КАК РАБОТАЕТ АВТОМАТИКА КАНАЛА "COVID-19 AGGRE_GATE":
Очень часто люди представляют себе работу телеграм-канала так: ботанского вида дядька, с подглазинами от недосыпа, дни и ночи напролет сидит с кружкой пива и сигаретой во рту, читает тысячи заметок, чешет репу и поплевав в потолок, методом научного тыка разбрасывает их по разделам. Рядом с недопитой кружкой, на смятой кровати, видевшей последнюю женщину в былинные брежневские времена - валяется недопотрошенная вобла...🙃🤭
Разумеется все не так...🤣🤗
На самом деле, почти на 95% работа канала управляется автоматикой. Такие программы - помощники в Телеграмме называются ботами. Модерация 2х каналов в день занимает совсем немного времени, не более часа, да и то в редких случаях...
Каналом управляет целая система ботов, и сейчас я вас немного познакомлю с алгоритмом их работы:
1. Бот "Паук"
(1) парсит (в основном, через подключенные RSS-ленты) информацию с различных официальных новостных и ведомственных источников, официальных сми, медиа-агрегаторов, торрент-трекеров, youtube, агрегаторов препринтов (микроб, bio'r'xiv и др.), рабочих чатов.
(2) Семантический анализ
Паук отбирает не все заметки, а только те, где встречаются определенные (ключевые) слова, он также подсчитывает:
- частоту встречаемости ключевого слова в тексте заметки (параметр "вес"),
- частоту совместного упоминания ключевых слов (параметр "расстояние"),
Если в заметке используется система тегов или хэштегов, Паук использует ее, через специальную трансформационную таблицу
(3) Формирует базу заметок в виде непрерывной одноуровневой XML-ленты с параметрами "вес" и "расстояние",
(4) Проводит семантический анализ конкретной заметки относительно семантического ядра канала, присваивает данной заметке предполагаемые хэштеги.
Паук также следит чтобы на один хэштег не приходилось в совокупности более 30 заметок. Если их становится больше, Паук помечает все такие заметки служебным хэштегом "#РАЗДЕЛИТЬ?"
Новый хэштег может быть введен модератором вручную в служебном канале Чистилище (см. Пункт 2)
(5) Передает сформированную новостную ленту во вспомогательный телеграм-канал "Чистилище"
2. Чистилище
В этом канале все предварительно обработанные Пауком заметки модерируются в ручном режиме.
Единственная ручная работа во всей системе. Но и здесь работает бот - Архивариус.
Модератор просматривает ленту, подготовленную Пауком и оценивает правильность простановки хэштега. Примерно в 5% случаев бот ошибается, такие хэштеги корректируются вручную.
Новая информация сначала попадает в Новостную ленту, но по мере ее уточнения, постепенно переносится в соответствующие разделы, корректируется (например, вводятся новые хэштеги) или удаляется.
Что такое хэштег? Это гипертекстовая система, использующая для тематического поиска т.н. хэштеги - ссылки вида #ключевое_слово.
Нажав на хэштег, вы получите отсортированный по этому ключевому слову (хэштегу) список новостей. Хэштеги в канале соответствуют рубрикатору Главного меню, но есть также и уточняющие (тематические) хэштеги.
Поиск по хэштегам используется только в Новостной ленте, так задумано изначально.
Вся устояавшаяся и надежно установленная информация попадает в главные разделы (Главное меню) канала. Это невозможно полностью отдать на откуп машине, здесь нужно думать. Поэтому данную работу выполняет модератор канала. Модератор проставляет галочки (чекбоксы) в служебных свойствах заметки и нажатием кнопки "Публиковать" - запускает Бота Архивариуса.
Функции Бота Архивариус:
(1). Публикует заметку в новость, ориентируясь на служебные чекбоксы модератора. Например, он может опубликовать новость со сдвигом во времени на сутки (иногда требуется время, чтобы проверить ненадежную новость) и т.д.
(2) Пересчитывает и анализирует параметры семантического ядра канала (используется метод кластерного анализа "Решетки Келли").
Например, если количество новостей в сутки (параметр "мощность новостного потока") каком-то разделе не растет, а в другом - растет очень быстро, это может означать, что актуальность какого то раздела уже упала, а другого - наоборот, возрастает.
Очень часто люди представляют себе работу телеграм-канала так: ботанского вида дядька, с подглазинами от недосыпа, дни и ночи напролет сидит с кружкой пива и сигаретой во рту, читает тысячи заметок, чешет репу и поплевав в потолок, методом научного тыка разбрасывает их по разделам. Рядом с недопитой кружкой, на смятой кровати, видевшей последнюю женщину в былинные брежневские времена - валяется недопотрошенная вобла...🙃🤭
Разумеется все не так...🤣🤗
На самом деле, почти на 95% работа канала управляется автоматикой. Такие программы - помощники в Телеграмме называются ботами. Модерация 2х каналов в день занимает совсем немного времени, не более часа, да и то в редких случаях...
Каналом управляет целая система ботов, и сейчас я вас немного познакомлю с алгоритмом их работы:
1. Бот "Паук"
(1) парсит (в основном, через подключенные RSS-ленты) информацию с различных официальных новостных и ведомственных источников, официальных сми, медиа-агрегаторов, торрент-трекеров, youtube, агрегаторов препринтов (микроб, bio'r'xiv и др.), рабочих чатов.
(2) Семантический анализ
Паук отбирает не все заметки, а только те, где встречаются определенные (ключевые) слова, он также подсчитывает:
- частоту встречаемости ключевого слова в тексте заметки (параметр "вес"),
- частоту совместного упоминания ключевых слов (параметр "расстояние"),
Если в заметке используется система тегов или хэштегов, Паук использует ее, через специальную трансформационную таблицу
(3) Формирует базу заметок в виде непрерывной одноуровневой XML-ленты с параметрами "вес" и "расстояние",
(4) Проводит семантический анализ конкретной заметки относительно семантического ядра канала, присваивает данной заметке предполагаемые хэштеги.
Паук также следит чтобы на один хэштег не приходилось в совокупности более 30 заметок. Если их становится больше, Паук помечает все такие заметки служебным хэштегом "#РАЗДЕЛИТЬ?"
Новый хэштег может быть введен модератором вручную в служебном канале Чистилище (см. Пункт 2)
(5) Передает сформированную новостную ленту во вспомогательный телеграм-канал "Чистилище"
2. Чистилище
В этом канале все предварительно обработанные Пауком заметки модерируются в ручном режиме.
Единственная ручная работа во всей системе. Но и здесь работает бот - Архивариус.
Модератор просматривает ленту, подготовленную Пауком и оценивает правильность простановки хэштега. Примерно в 5% случаев бот ошибается, такие хэштеги корректируются вручную.
Новая информация сначала попадает в Новостную ленту, но по мере ее уточнения, постепенно переносится в соответствующие разделы, корректируется (например, вводятся новые хэштеги) или удаляется.
Что такое хэштег? Это гипертекстовая система, использующая для тематического поиска т.н. хэштеги - ссылки вида #ключевое_слово.
Нажав на хэштег, вы получите отсортированный по этому ключевому слову (хэштегу) список новостей. Хэштеги в канале соответствуют рубрикатору Главного меню, но есть также и уточняющие (тематические) хэштеги.
Поиск по хэштегам используется только в Новостной ленте, так задумано изначально.
Вся устояавшаяся и надежно установленная информация попадает в главные разделы (Главное меню) канала. Это невозможно полностью отдать на откуп машине, здесь нужно думать. Поэтому данную работу выполняет модератор канала. Модератор проставляет галочки (чекбоксы) в служебных свойствах заметки и нажатием кнопки "Публиковать" - запускает Бота Архивариуса.
Функции Бота Архивариус:
(1). Публикует заметку в новость, ориентируясь на служебные чекбоксы модератора. Например, он может опубликовать новость со сдвигом во времени на сутки (иногда требуется время, чтобы проверить ненадежную новость) и т.д.
(2) Пересчитывает и анализирует параметры семантического ядра канала (используется метод кластерного анализа "Решетки Келли").
Например, если количество новостей в сутки (параметр "мощность новостного потока") каком-то разделе не растет, а в другом - растет очень быстро, это может означать, что актуальность какого то раздела уже упала, а другого - наоборот, возрастает.
Бот Архивариус помечает такие разделы специальной служебной меткой и запрашивает решение модератора.
Модератор может удалить ставшей неактуальной информацию, ввести в меню канала новый раздел и вообще внести любую другую необходимую корректировку.
(3) Так же, через чекбокс модератор дает соответствующую команду Архивариусу, и он их исполняет, применяя однотипные операции одновременно для множества заметок (например, меняет в них какой-либо хэштег).
(4) Формирует и публикует заметки в связанных соцсетях, например в Группу в Одноклассниках "COVID-19 Agregator",
(5) Публикует новости в RSS-ленты некоторых корпоративных потребителей
3. Работа с разделами
Все разделы данного канала были сформированы не просто так, а исходя из параметра "мощность новостного потока".
Это означает, что разделы как бы "живые", они могут разделяться, удаляться или изменяться любым другим образом.
Они сформировались автоматически и изменяются тоже, исходя из обьективных критериев.
Модератор очень редко вмешивается в работу этого механизма, его работа - исправлять ошибки автоматики и принимать творческие решения. Этого пока машина за нас делать не умеет.
Например, на текущий момент
Разделы канала (Главное меню) внутри рабочей системы модератора выглядит так:
R1 профессиональная и научно-популярная литература о коронавирусе и пандемии ковид-19,
R2 официальные нормативные руководства Минздрава,
R3 обучающие и отраслевые вебинары Минздрава,
R4 сведения о вакцинах и вакцинации в России,
R5 лекарственные препараты, нутриенты и БАДы для профилактики и терапии ковид-19,
R6 профилактика, диагностика, лечение и пост- реабилитация ковид-19,
R7 мутация и штаммы коронавируса,
R8 практическая информация по схемам лечения,
R9 пост- ковидная реабилитация,
R10 ковид-диссиденты и фейки о коронавирусе,
R11 тенденции и прогнозы,
R12 новостная лента (с хэштегами)
Вы в меню канала видите несколько иное разделение, но это сделано только для удобства восприятия...
Разделы r1...r12 составляют верхний (первый) уровень системы меню.
Внутри Главного меню есть второй и третий уровни (система под- меню).
Второй уровень при этом вы видите, а вот третий (служебный) вам недоступен.
Например, рубрикатор сведений о конкретном лекарственном препарате находится на втором уровне (визуально для вас это просто очередная заметка с гиперссылками):👇
ПОИСК ИНФОРМАЦИИ ПО ЛЕКАРСТВЕННЫМ СРЕДСТВАМ, НУТРИЕНТАМ И БАДам:
https://yangx.top/c/1384776241/851
То есть, Уровень 2 Главного меню представляет собой подменю
"ПОИСК ЛЕКАРСТВА ПО НАЗВАНИЮ" и т.д.
Обратите внимание:
ПОЛНАЯ БАЗА ДАННЫХ КАНАЛА СОДЕРЖИТ БОЛЕЕ 3.000 УНИКАЛЬНЫХ ДОКУМЕНТОВ!
Поэтому я бы вам посоветовал активно использовать систему меню, и вы удивитесь, как много всего внутри еще спрятано! ;)
Такая система многоуровневого меню, если ее освоить, позволяет после очень небольшой тренировки, в течение буквально нескольких секунд найти любую интересующую информацию.
Хотя вы и не видите третьего уровня системы меню, но именно на этом уровне Бот Паук расставляет хэштеги. Хештег как раз соответствует отдельной теме.
Например, 3й уровень (раздел)
ТЕНДЕНЦИИ И ПРОГНОЗЫ 👇
https://yangx.top/c/1384776241/1580
включает следующие темы:
R3.11_a социальные и экономические последствия пандемии, @СОЦИУМ
R3.11_b политика Российской Федерации по преодолению последствий пандемии, адресная помощь государства населению и предпринимателям, @ОФИЦИАЛ
R3.11_c информация по практическим аспектам дистанционной трудовой деятельности (удаленке): организация трудового процесса, технологии, правовые моменты удаленки, @УДАЛЕНКА
R3.11_d математическое моделирование эпидемического процесса (отметим, что российские ученые достигли впечатляющего прогресса в создании точных прогностических моделей распространения ковид-19), @SEIR
R3.11_e тенденции и прогнозы течения пандемии, @ТЕНДЕНЦИИ
R3.11_f мнения экспертов о сроках окончания и течении отдельных фаз пандемии ковид-19 и возможности вспышки новой пандемии, @ТРЕТЬЯ_ВОЛНА
4. База данных и публикация ленты новостей в соцсетях.
Модератор может удалить ставшей неактуальной информацию, ввести в меню канала новый раздел и вообще внести любую другую необходимую корректировку.
(3) Так же, через чекбокс модератор дает соответствующую команду Архивариусу, и он их исполняет, применяя однотипные операции одновременно для множества заметок (например, меняет в них какой-либо хэштег).
(4) Формирует и публикует заметки в связанных соцсетях, например в Группу в Одноклассниках "COVID-19 Agregator",
(5) Публикует новости в RSS-ленты некоторых корпоративных потребителей
3. Работа с разделами
Все разделы данного канала были сформированы не просто так, а исходя из параметра "мощность новостного потока".
Это означает, что разделы как бы "живые", они могут разделяться, удаляться или изменяться любым другим образом.
Они сформировались автоматически и изменяются тоже, исходя из обьективных критериев.
Модератор очень редко вмешивается в работу этого механизма, его работа - исправлять ошибки автоматики и принимать творческие решения. Этого пока машина за нас делать не умеет.
Например, на текущий момент
Разделы канала (Главное меню) внутри рабочей системы модератора выглядит так:
R1 профессиональная и научно-популярная литература о коронавирусе и пандемии ковид-19,
R2 официальные нормативные руководства Минздрава,
R3 обучающие и отраслевые вебинары Минздрава,
R4 сведения о вакцинах и вакцинации в России,
R5 лекарственные препараты, нутриенты и БАДы для профилактики и терапии ковид-19,
R6 профилактика, диагностика, лечение и пост- реабилитация ковид-19,
R7 мутация и штаммы коронавируса,
R8 практическая информация по схемам лечения,
R9 пост- ковидная реабилитация,
R10 ковид-диссиденты и фейки о коронавирусе,
R11 тенденции и прогнозы,
R12 новостная лента (с хэштегами)
Вы в меню канала видите несколько иное разделение, но это сделано только для удобства восприятия...
Разделы r1...r12 составляют верхний (первый) уровень системы меню.
Внутри Главного меню есть второй и третий уровни (система под- меню).
Второй уровень при этом вы видите, а вот третий (служебный) вам недоступен.
Например, рубрикатор сведений о конкретном лекарственном препарате находится на втором уровне (визуально для вас это просто очередная заметка с гиперссылками):👇
ПОИСК ИНФОРМАЦИИ ПО ЛЕКАРСТВЕННЫМ СРЕДСТВАМ, НУТРИЕНТАМ И БАДам:
https://yangx.top/c/1384776241/851
То есть, Уровень 2 Главного меню представляет собой подменю
"ПОИСК ЛЕКАРСТВА ПО НАЗВАНИЮ" и т.д.
Обратите внимание:
ПОЛНАЯ БАЗА ДАННЫХ КАНАЛА СОДЕРЖИТ БОЛЕЕ 3.000 УНИКАЛЬНЫХ ДОКУМЕНТОВ!
Поэтому я бы вам посоветовал активно использовать систему меню, и вы удивитесь, как много всего внутри еще спрятано! ;)
Такая система многоуровневого меню, если ее освоить, позволяет после очень небольшой тренировки, в течение буквально нескольких секунд найти любую интересующую информацию.
Хотя вы и не видите третьего уровня системы меню, но именно на этом уровне Бот Паук расставляет хэштеги. Хештег как раз соответствует отдельной теме.
Например, 3й уровень (раздел)
ТЕНДЕНЦИИ И ПРОГНОЗЫ 👇
https://yangx.top/c/1384776241/1580
включает следующие темы:
R3.11_a социальные и экономические последствия пандемии, @СОЦИУМ
R3.11_b политика Российской Федерации по преодолению последствий пандемии, адресная помощь государства населению и предпринимателям, @ОФИЦИАЛ
R3.11_c информация по практическим аспектам дистанционной трудовой деятельности (удаленке): организация трудового процесса, технологии, правовые моменты удаленки, @УДАЛЕНКА
R3.11_d математическое моделирование эпидемического процесса (отметим, что российские ученые достигли впечатляющего прогресса в создании точных прогностических моделей распространения ковид-19), @SEIR
R3.11_e тенденции и прогнозы течения пандемии, @ТЕНДЕНЦИИ
R3.11_f мнения экспертов о сроках окончания и течении отдельных фаз пандемии ковид-19 и возможности вспышки новой пандемии, @ТРЕТЬЯ_ВОЛНА
4. База данных и публикация ленты новостей в соцсетях.
Данный канал представляет собой базу данных, информация из которой может быть доставлена до потребителя различным образом.
1. Можно подписаться на канал. Это определенный акт, означающий возможную заинтересованность человека в информации из данного канала. В дальнейшем предполагается прикрутить рабочий чат и выбрать модераторов из числа подписчиков.
Этот канал служит только одной цели - дать информацию. Все. Монетизировать его и зарабатывать деньги не планируется. Это дань совести.
Как либо раскручивать его не хочу, да и не требуется. Как донести информацию, я знаю, меркантильных интересов и жажды славы нет (по крайней мере, этого канала это точно не касается 😉)
2. Можно просто смотреть канал через браузер и не становиться подписчиком. Можно, мне без разницы. Лишь бы доходила информация. Рейтингами меряться я не хочу😉 Количество просмотров тех, кто смотрит из браузера в счетчике внизу заметки не отражается, но по своей Админской статистике я вижу, сколько зашло и что посмотрели. Я не вижу только кто это (в Телеграм действительно самая лучшая система безопасности, наравне с мессенджером Signal - кстати, любимой прогой Сноудена😉🙃)
3. Наибольшее количество просмотров идет из соцсетей, где созданы соответствующие группы. Например, из Одноклассников количество просмотров измеряется сотнями тысяч (приведу внизу скрин, чтобы было понятнее)
В общем, этот ресурс задуман как обьективная база данных, а не как тусовочный чат, где каждый может попетушиться😉
Надеюсь, теперь стало яснее, как тут все работает...
Всем здоровья✌👋
1. Можно подписаться на канал. Это определенный акт, означающий возможную заинтересованность человека в информации из данного канала. В дальнейшем предполагается прикрутить рабочий чат и выбрать модераторов из числа подписчиков.
Этот канал служит только одной цели - дать информацию. Все. Монетизировать его и зарабатывать деньги не планируется. Это дань совести.
Как либо раскручивать его не хочу, да и не требуется. Как донести информацию, я знаю, меркантильных интересов и жажды славы нет (по крайней мере, этого канала это точно не касается 😉)
2. Можно просто смотреть канал через браузер и не становиться подписчиком. Можно, мне без разницы. Лишь бы доходила информация. Рейтингами меряться я не хочу😉 Количество просмотров тех, кто смотрит из браузера в счетчике внизу заметки не отражается, но по своей Админской статистике я вижу, сколько зашло и что посмотрели. Я не вижу только кто это (в Телеграм действительно самая лучшая система безопасности, наравне с мессенджером Signal - кстати, любимой прогой Сноудена😉🙃)
3. Наибольшее количество просмотров идет из соцсетей, где созданы соответствующие группы. Например, из Одноклассников количество просмотров измеряется сотнями тысяч (приведу внизу скрин, чтобы было понятнее)
В общем, этот ресурс задуман как обьективная база данных, а не как тусовочный чат, где каждый может попетушиться😉
Надеюсь, теперь стало яснее, как тут все работает...
Всем здоровья✌👋
https://www.kp.ru/daily/27266.5/4399103/
Какие изменения происходят в организме людей, перенесших COVID-19, рассказал академик РАН Александр Чучалин
#ПОСТКОВИД_ПОСЛЕДСТВИЯ
Какие изменения происходят в организме людей, перенесших COVID-19, рассказал академик РАН Александр Чучалин
#ПОСТКОВИД_ПОСЛЕДСТВИЯ