Записки админа
Иногда, при написании скриптов, встаёт необходимость обработать какую-то HTML страницу, убрать из неё лишний код и т. п. Для этого, можно использовать sed, например, так: $ sed -e :a -e 's/<[^>]*>//g;/</N;//ba' index.html Но способ далеко не самый удобный.…
А ещё вот так, почти без заморочек можно получить контент из html файла:
#будничное #html2text
$ html2text index.html
#будничное #html2text