Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#статьи
Ещё один агрегатор свежих публикаций...
https://42papers.com
#забавно
Текстура важнее контура! Из работы https://arxiv.org/pdf/1811.12231.pdf
#юмор
нужно же какую-нибудь шутку запостить...
#юмор
А ещё довольно мало работ по генерации шуток... вот один из последних обзоров на эту тему: https://www.aclweb.org/anthology/2020.latechclfl-1.4.pdf
#забавно
Выложена языковая модель от Сбера, которая продолжает фрагмент текста введённый Вами. У меня вот что получилось (ниже, что я ввёл - жирное, остальное - творчество модели)

https://russiannlp.github.io/rugpt-demo/

Пришли Шмидхубер и Греф в Сбербанк карту зарплатную открыть.
И тут с ними две миловидные сотрудницы, возраста кораллов, беседуют
так ненавязчиво.
Греф вынимает перед ними из портмоне и показывает на фигню, которая почти сразу погасла,
но всё равно видно,
что это карта Сбербанка.

Мдя, масштаб конечно не тот, но результат - один в один.
К сожалению, кто-то был в курсе и на месте сделали им замечание.
Как потом оказалось, всё довольно серьёзно.
У них прямо в офисе лежит 460 тысяч долларов, а до такого мы сами когда-нибудь дойдем.
Так что вот, лучше проверять всё заранее.
А ещё они хорошо ориентируются в курсе рубля и любят слушать Президента,
поэтому, когда попадаются им на глаза портреты
Путина и Медведева, то с удовольствием наблюдают их вблизи.
Они знают, что Путин это суперзвезда и им это удобно.
Да и пусть знают, тем более, что он это и в самом деле так!
#юмор
И в продолжение последних постов. Попробовал я с помощью Сберовской модели анекдот сгенерировать. За мат очень извиняюсь (эта хвалёная RuGPT3 выдала), оказывается, создатели не сделали фильтр обсценной лексики!

Встречаются Пятачок, Штирлиц и Боря Моисеев. ПятачОк:-Пятачок! Вот мы и встретились! Я так рад!!! Ты-настоящий мужчина!!!Ты-настоящая женщина!!! Пята:-Какая я тебе женщина, ты с ума сошел? Мы уже не вместе! Боря:-Ну и хуй с тобой! Блядь!
картинка к следующему вопросу... сегодня он касается обработки звука
Что скрыто за синим прямоугольником (напоминаю, после ответа можно посмотреть подсказку)?
Anonymous Quiz
35%
bark
20%
quack
11%
grunt
17%
growl
17%
bank
#конференции
Открыта регистрация на научную летнюю школу ssopt.org
Основной фокус: оптимизация
В этом году в основном будет про многоруких бандитов и опты (непрерывные и комбинаторные), но список спикеров еще не полный
Школа пройдет в подмосковном "Вороново" с 10 по 17 июня
Проживание, питание и т.д. включено
#книги
Посмотрел книгу «Learning theory from first principles». Для тех, кто любит математику в ML, по сути, это обзор теоретических результатов, приводятся теоремы с доказательствами. Из любопытного - у многих известных теорем указаны другие авторы - надо проверить, названия некоторых теорем тоже отличаются, например от википидийных. Из минусов - для практиков книга не очень полезная.
https://www.di.ens.fr/~fbach/ltfp_book.pdf
#новости
О лауреатах премии Абеля. Меня привлёк в первую очередь автор статьи - Разборов - крутой математик, о котором что-то в последнее время не было слышно:
https://trv-science.ru/2021/03/pervoproxodcy-teoreticheskoj-informatiki/
#забавно
Многие используют ирисы Фишера, но вот самого Фишера не многие...
(картинка их Хасти, Тибширани и Фридмана)
#обзор
Тренды на ближайшие годы... лучше не будет;) Полный обзор по ссылке:
https://www.dni.gov/files/ODNI/documents/assessments/GlobalTrends_2040.pdf
#визуализация
Очень нравится, когда оригинально и наглядно подают материал, даже если это лишено особого смысла. Например, такие вещи очень нравятся. Взято отсюда:
https://m.vk.com/wall-37160097_447822
#книги
Не очень понравилась книга «Mathematical Problems in Data Science». Темы интересные: топологический анализ данных, методы Монте-Карло в ML и т.п. Но главы писали разные люди, стиль не выдержан, и каких-то ценных знаний книга не даёт.
#конференция
Научная школа по алгоритмам, комбинаторике и сложности (конец мая, язык - английский, информацию взял с FB Юрия Дорна).
https://indico.eimi.ru/event/199/
#конференция
Митап про сбор данных в широком смысле.
22 апреля (18-30 MSK) будут следующие доклады:

1. "Еще одна архитектура системы мониторинга цен и место библиотеки ferret в ней"
2. "Кейс от mail.ru. Россети. Контроль качества данных"
3. "Автоматические регистрации на веб-порталах"
4. "Сбор данных с сейсмографов"
5. "Сбор данных о бумажных книгах"
6. "Парсинг через Tor: Как скачать 1.5 млн патентов за 2 недели, а не за 40 лет"

Вся информация в https://yangx.top/parsing_conf