Записки админа
12.8K subscribers
653 photos
29 videos
227 files
2.48K links
Пишу о Linux и администрировании серверов.

Связаться с автором: @servers

Заметки в браузере: https://sysadmin.pm/

Буст канала: https://yangx.top/sysadminnotes?boost
加入频道
Иногда, при написании скриптов, встаёт необходимость обработать какую-то HTML страницу, убрать из неё лишний код и т. п. Для этого, можно использовать sed, например, так:

$ sed -e :a -e 's/<[^>]*>//g;/</N;//ba' index.html

Но способ далеко не самый удобный. Гораздо удобнее во многих случаях сделать вот так:

$ lynx --dump index.html

Либо сразу обратиться к сайту:

$ lynx --dump sysadmin.pm

И получить при этом, только контент, уже очищенный от всего лишнего.

#будничное #sed #lynx