Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
Сейчас в рейтинге платформы Kaggle на 5е место поднялся участник с ником dott. Не все знают, но это выпускник нашей кафедры - Дима Гордеев. Один из самых умных студентов, которых я учил... у него очень "спокойное мышление", что мне всегда импонировало в людях (твёрдая логика и взвешивание ситуации). Интересно, что он не сразу стал работать DS после окончания кафедры - сначала работал в банках, а потом уже решил заняться ML. Вот за кого я буду болеть в ближайший год!
#интересно
Классное видео про моделирование и исследование эволюции с помощью симуляции. Когда-то я хотел сделать примерное такое. Но тут совсем симпатичное. И в канале ещё много чего есть. Из минусов - эксперимент хорошо бы запускать много раз, показывать графики средних, коридоры отклонений и отдельные симуляции.
https://youtu.be/PyR0EQlnCSY
#книга
Больше для лингвистов - но интересная книга «Введение в науку о языке»
http://tipl.philol.msu.ru/application/files/9215/8507/9636/AEK_et_al_corrected_2020.pdf
Вопрос к знатокам ML. Что это за формула?
Anonymous Quiz
3%
Log loss
12%
Hinge loss
57%
Triplet loss
13%
Brier score
6%
L1-loss
9%
KL-дивергенция
#конференции
С 21 по 26 июня в Образовательном центре "Сириус" в Сочи будет проводиться летняя научная школа «Управление, Информация, Оптимизация». Очень крутые спикеры: Нестеров, Кабанихин, Оселедец, Воронцов, Гасников, Максимов, Хачай. Если из-за эпидемии не удастся провести школу в Сочи, она будет проведена в онлайн-формате.
https://ssopt.org/
Сложный вопрос для тех, кто помнит содержания ML-статей (или курсов). Для каких задач был придуман динамический k-пулинг?
Anonymous Quiz
18%
Классификация изображений
15%
Сегментация
20%
Анализ текстов (NLP)
14%
Машинный перевод (NMT)
17%
Распознавание речи (ASR)
16%
Синтез речи (TTS)
#блоги
Один из самых крутейших ML-блогов, конечно этот... сегодня готовился к лекции, и много оттуда надёргал, поскольку картинки собраны хорошие (почти всегда не авторские, но грамотно отобраны) и формулировки там чёткие
https://lilianweng.github.io/lil-log/
#забавно
Снова о процессе рецензирования статей;)
https://arxiv.org/pdf/2003.14415.pdf
Один из стандартных датасетов для проверки ИИ на способность анализировать текст и отвечать на вопросы - SQuAD. Несколько лет назад его первую версию сменила вторая. В чём их главное отличие?
Anonymous Quiz
14%
Несколько языков
9%
Более шумные данные
30%
Добавлен вариант «нет ответа»
10%
Данные нагенерированы с помощью GAN
16%
Данные нагенерированы так, чтобы минимизировать качество текущей SOTA-модели
21%
Существенного отличия нет, кроме объёма
#забавно
знал ли я лет 10 назад, что для лекций буду готовить подобные слайды...
#полезное
Вдруг, кто не знает - большая коллекция датасетов по с(у/а)ммаризации текстов, ссылок на статьи по векторным представлениям слов и текстов есть здесь:
https://github.com/mathsyouth/awesome-text-summarization
#полезное
Неплохой обзор ссылок на статьи по теме разговорного ИИ, но уже устаревший (2018). Где-то я находи более свежий за прошлый год, но вот совсем свежего, увы, я не знаю.
https://medium.com/x8-the-ai-community/a-reading-list-and-mini-survey-of-conversational-ai-32fceea97180
#статья
Для тех, кто профессионально занимается построением ИИ-систем, технический отчёт исследователя из Кембриджа: Alexander Kuhnle "Evaluating visually grounded languagecapabilities using microworlds"
https://www.cl.cam.ac.uk/techreports/UCAM-CL-TR-942.pdf