СЛЕГ! <Z> ️
523 subscribers
678 photos
20 videos
12 files
307 links
Здесь создают авторских телеграм-ботов. Когда не справляются конструкторы и веб-студии - есть СЛЕГ.

Статистика ботов:
https://ssleg.tech/bots_view.html

Написать автору: @yesitsnew

TW: ещё тут политота, утечки баз и игры в товарища майора на минималках
加入频道
Распределение по чатам. Прослойка актива не просто тонка, а буквально 1% от всех. Большинство читает только один чат. Так что тактика посева по чатам для распространения информации эффективна, если не забанят :)
Количество "молчунов" в чатах - 90%.
Активность не замерялась в очень крупных чатах, из за медленности метода. Активным считается пользователь, который написал хотя бы 1 сообщение в чат за последнюю неделю.
СЛЕГ! <Z> ️
Ежедневный приток новых пользователей на карантине. Стабильно 1600 человек в сутки и более.
Прикрутил pandas для наглядности. Сегодня рекорд - всего 1100 человек. Народ явно узбагаивается.
/подвывая/ вы спрашивали, что такое задержка в умственном развитии? Не спрашивали? Но это она. Афтор канала @thisismyfacebook открывает для себя ортегу и кононенко. Весной 2020 года он увидел людей, которые не менялись последние лет 10 😂
Внезапно продал готовое решение Крамнику. Теперь у него тоже есть фейсконтроль в чатике. :)
В работе фейсконтроль выглядит вот так. Третье внедрение наверное сделаю уже за символические деньги, джаст фо лулз.
И о выгрузке сообщений телеграм. Рано или поздно мы перейдём на эту дрянь :)

Телега никак не защищена от разграбления, скорость выгрузки 360 тысяч сообщений в час или 100 в секунду. То есть средний чат сливается за 20 минут, большой и старый, за пару часов.

Оптимальный по скорости вариант: запрос 1000 сообщений с паузой 3 секунды между ними. Дальше библиотека telethon все сделает сама, тройные пики на графике это выгрузка. А паузы нужной длинны проставляет телетон.

P.S. Постгрес это очень круто, mssql отдыхает :)
Но сохранять все подряд в неразобранном виде идея так себе. Для обучения парсера скачано 1,75М сообщений. Как видно на картинке, половина объёма это стикосы, гифки, и прочая дрянь. Получается 970 байт на среднее сообщение.

Поэтому рабочий вариант будет совсем другой.

Stay tuned :)
Эпической силы чтение получилось. Это окуклившийся сейчас чат "инвесторов", разорившихся в понедельник на нефти. Суть события в новостях. Рыночек порешал так, что самый счастливый должен брокеру 150к, самый несчастный под 10м рублей. Я его успел залить к себе и теперь выложу текстовую версию на память. Следующий пост ⬇️
invest.zip
393.6 KB
Архив чата инвесторов в текстовом формате. В несжатом виде 1,5Мб.
Когда подгребаешь уже остатки политоты (все основное собрано ещё в марте) получается смешное.

Первый проход скрипта по чату:
users - 578, dead - 179, bot - 2, phones - 4, written - 199, inchatwritten - 578

Новых пользователей только 199. Ещё 379 уже известны по другим чатам. 179 удалённых аккаунтов, 23% от общего числа. Да это же зомбиленд, Карл!
На днях переписал один из самых старых алгоритмов своих метрик. Ускорение в 280 раз. Оказалось, что сравнение строк в массивах в c++ стиле на питоне работает кое-как, а словари работают сверхбыстро. 🐍💙

P.s. В начале мая будут массивные обновления статистики, не переключайтесь
К концу третьего месяца питоненья, я познал дзен asyncio и тут мне карта как поперла! © фантастически удобная обёртка для многопоточной обработки, без вникания в детали.

В применении к моим игрушкам, проект питух-детектор плавно превратился в волшебную палочку (админа чата), которой могут пользоваться все админы параллельно. Фейсконтроль на входе дополнился быстрыми и однобуквенными командами: кинуть мьют на время, отключить медиа, забанить, а так же получить справку на пользователя, если консерва вдруг подала голос. :)

P. S. Специально оставил развёрнутым диспетчер задач системы. Всего 17 строчек для определения всего поведения проекта. Обалденно.
Сегодня 45 лет со взятия Сайгона правильными парнями :)
30 апреля 1975 года.