Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#блоги
Один из самых крутейших ML-блогов, конечно этот... сегодня готовился к лекции, и много оттуда надёргал, поскольку картинки собраны хорошие (почти всегда не авторские, но грамотно отобраны) и формулировки там чёткие
https://lilianweng.github.io/lil-log/
#забавно
Снова о процессе рецензирования статей;)
https://arxiv.org/pdf/2003.14415.pdf
Один из стандартных датасетов для проверки ИИ на способность анализировать текст и отвечать на вопросы - SQuAD. Несколько лет назад его первую версию сменила вторая. В чём их главное отличие?
Anonymous Quiz
14%
Несколько языков
9%
Более шумные данные
30%
Добавлен вариант «нет ответа»
10%
Данные нагенерированы с помощью GAN
16%
Данные нагенерированы так, чтобы минимизировать качество текущей SOTA-модели
21%
Существенного отличия нет, кроме объёма
#забавно
знал ли я лет 10 назад, что для лекций буду готовить подобные слайды...
#полезное
Вдруг, кто не знает - большая коллекция датасетов по с(у/а)ммаризации текстов, ссылок на статьи по векторным представлениям слов и текстов есть здесь:
https://github.com/mathsyouth/awesome-text-summarization
#полезное
Неплохой обзор ссылок на статьи по теме разговорного ИИ, но уже устаревший (2018). Где-то я находи более свежий за прошлый год, но вот совсем свежего, увы, я не знаю.
https://medium.com/x8-the-ai-community/a-reading-list-and-mini-survey-of-conversational-ai-32fceea97180
#статья
Для тех, кто профессионально занимается построением ИИ-систем, технический отчёт исследователя из Кембриджа: Alexander Kuhnle "Evaluating visually grounded languagecapabilities using microworlds"
https://www.cl.cam.ac.uk/techreports/UCAM-CL-TR-942.pdf
#конкурсы
Конкурс инновационных проектов для студентов и аспирантов МГУ:
http://yrp.msu.ru/science21-2020
#вакансия
Если среди подписчиков есть люди с опытом в синтезе речи - напишите в личку (возможны разные варианты сотрудничества, от консультирования, до работы над речевым ИИ).
Как расшифровывается название одной из самых прорывных языковых моделей GPT?
Anonymous Quiz
36%
Generative Pre Training
10%
General Post Tagging
31%
Global Pruned Transformer
4%
Glove per Token
4%
Great Poly-lingual Transducer
15%
Ни один из вариантов
#курс
Факультет журналистики МГУ выложил лекции своих лучших преподавателей в открытый доступ:
https://www.youtube.com/playlist?list=PLbBJQskbznuMtA5kKrh-JlBrzr6TQ3TYD