📌 Модуль html.parser в Python
• Модуль html.parser определяет класс HTMLParser, который служит основой для парсинга файлов, отформатированных в HTML (HyperText Mark-up Language) и XHTML.
Базовый пример синтаксического анализа HTML (код на картинке).
📕 Документация
#урок
• Модуль html.parser определяет класс HTMLParser, который служит основой для парсинга файлов, отформатированных в HTML (HyperText Mark-up Language) и XHTML.
Базовый пример синтаксического анализа HTML (код на картинке).
📕 Документация
#урок
❤7🔥1
📌 Модуль urllib.parse в Python, операции с URL-адресом
• Модуль urllib.parse определяет стандартный интерфейс для разбора URL-адреса на компоненты: протокол, порт, домен, путь и т. д., чтобы можно было объединять компоненты обратно в строку URL-адреса и преобразовать относительный URL-адрес в абсолютный URL-адрес с учетом базового URL-адреса.
• Модуль был разработан в соответствии с "Internet RFC on Relative Uniform Resource Locators". Он поддерживает следующие схемы URL: file, ftp, http, https, imap, mailto, mms, news, nntp, rsync, sftp, shttp, sip, sips, svn, svn+ssh, telnet и т. д.
Пример разбора URL-адреса на компоненты (код на картинке).
📕 Документация
#урок
• Модуль urllib.parse определяет стандартный интерфейс для разбора URL-адреса на компоненты: протокол, порт, домен, путь и т. д., чтобы можно было объединять компоненты обратно в строку URL-адреса и преобразовать относительный URL-адрес в абсолютный URL-адрес с учетом базового URL-адреса.
• Модуль был разработан в соответствии с "Internet RFC on Relative Uniform Resource Locators". Он поддерживает следующие схемы URL: file, ftp, http, https, imap, mailto, mms, news, nntp, rsync, sftp, shttp, sip, sips, svn, svn+ssh, telnet и т. д.
Пример разбора URL-адреса на компоненты (код на картинке).
📕 Документация
#урок
🔥7