Small Data Science for Russian Adventurers

#курс
Качественный курс “Введение в анализ данных и машинное обучение” от читателя моего блога (кстати, если есть кому что показать - присылайте). Готовился для школьников, но, мне кажется, подходит любым начинающим в ML. Очень симпатично оформлен.
https://yangx.topseries-ru.github.io/course/README.html

5.3K views11:24

#интересно
Статистика по прошлому году. Больше всего авторов (45) у статьи: Task-Oriented Dialogue as Dataflow Synthesis.
Самое длинное название статьи: Code-Switching Patterns Can Be an Effective Route to Improve Performance of Downstream NLP Applications: A Case Study of Humour, Sarcasm and Hate Speech Detection.
Самое короткое название: Ode to an ODE.
(взято отсюда: https://www.marekrei.com/blog/ml-and-nlp-publications-in-2020/)

4.0K views21:42

Small Data Science for Russian Adventurers

#курс
Наконец "дошли руки" посмотреть курс NLP, ссылку на которую в чате канала кидал Юра Кашницкий. Очень классно всё сделано. И дело не только в оформлении, хорошо сделаны объяснения и ссылки на релевантные работы. Всем, кто изучает ML, обязательно к проработке...
https://lena-voita.github.io/nlp_course.html

lena-voita.github.io

NLP Course | For You

Natural Language Processing course with interactive lectures-blogs, research thinking exercises and related papers with summaries. Also a lot of fun inside!

5.4K views12:44

Small Data Science for Russian Adventurers

#мгу
Для выпускников ВМК МГУ, которые хотят понастальгировать - виртуальный 3D-тур (надо поворачивать телефон/планшет):
https://youtu.be/A9zCKgWPY_E

YouTube

Виртуальное путешествие по факультету вычислительной математики ВМК МГУ в формате 360 VR центр МГУ

#VR #360VR #VR360 #MSU #МГУ #лучшедома #удаленка #мгудома #ВУЗ #VRMSU #CS #CSMSU #ВМК #ВМКМГУ
Посетите Московский университет не выходя из дома. ВМК МГУ

VR Кластер МГУ
https://www.instagram.com/vr.msu/
https://vk.com/vrmsu

4.7K views17:43

Small Data Science for Russian Adventurers

#интересно
"Быть живым, значит сокращать разрыв между ожиданиями и чувственными данными. Словом, минимизировать свободную энергию. "
В этой статье особенно хороши комментарии...
https://vc.ru/future/52798-megatheory

vc.ru

Теория всего — Будущее на vc.ru

Конспект статьи от издания Wired о британском нейробиологе Карле Фристоне, который собирается объяснить устройство всего мира — а заодно, возможно, наконец создать полноценный искусственный интеллект.

4.1K views11:43

Small Data Science for Russian Adventurers

#мысли
Одно из недооценённых направлений в ML (на мой взгляд) - это резервуарные вычисления. Подобные архитектуры упоминаются, например, в книге Гудфелло, но совсем мельком, занимались ими лишь несколько исследователей. С точки зрения современных архитектур, это RNN в которых специальным образом выбраны и зафиксированы веса, соответствующие рекуррентным связям, а обучаются все остальные. Это позволяет избежать проблемы взрыва и затухания градиента. Есть много (не обнародованных) хаков, как эффективно такие сети применять на практике, но вот хайпа вокруг них никогда не было. Для тех, кто хочет погрузиться в теорию резервуарных вычислений, есть, например такое видео:
https://www.youtube.com/watch?v=HfltqZa2Fco

YouTube

Explaining the reservoir computing phenomenon using randomized discrete-time signatures

Speaker: Juan-Pablo Ortega

Event: Second Symposium on Machine Learning and Dynamical Systems
http://www.fields.utoronto.ca/activities/20-21/dynamical

Title: Explaining the reservoir computing phenomenon using randomized discrete-time signatures

4.7K views15:29

Small Data Science for Russian Adventurers

#забавно
Вы можете нарисовать айсберг и посмотреть, как он будет плавать в воде:
https://engaging-data.com/iceberger-remixed

Engaging Data

Iceberger Remixed and Improved - Iceberg Simulator - Engaging Data

Based on Josh Tauberer's Iceberger, this lets you make some pre-made icebergs designs to see how they float and you can also interact with them.

4.0K viewsedited 21:37

Small Data Science for Russian Adventurers

#блог
Новый пост в блоге:
https://dyakonov.org/2021/03/04/ml-scikit-learn/

Анализ малых данных

Scikit-Learn: тонкие вопросы о реализации методов машинного обучения

Рассмотрим несколько с виду простых вопросов об алгоритмах машинного обучения и их реализации, на которые, однако, немногие смогут верно ответить (можете попробовать сами – не читая объяснений, так…

3.9K views10:08

Small Data Science for Russian Adventurers

#забавно
Есть такой известный термин ablation, который обычно используется в устойчивом словосочетании ablation study - это обоснование существенной неупрощаемости предложенного решения. Обычно в каждой новой статье придумывается много хаков для достижения SOTA-ы: предобучение на новом датасете, аугментации, другие функции активации, новые нормировки и т.п. Чтобы обосновать, что всё что придумали и описали в работе реально важно пытаются немного упростить описанное решение, отказавшись от каких-то нововведений. В идеале оказывается, что любой отказ только ухудшает качество.

Так вот, я никогда не задумывался, как этот термин сказать по-русски... Сегодня просматривая хабр наткнулся на перевод, показавшийся мне неприличным... но такое слово есть в русском языке (это я просто не знал).

3.2K views15:39

Small Data Science for Russian Adventurers

#мозг
Доклады на BCI Samara 2020
https://youtube.com/playlist?list=PL31Vmt611WQZ2488pUEqPDijocJhRbl4y

YouTube

BCI Samara 2020 - YouTube

3.0K views18:20

Small Data Science for Russian Adventurers

#визуализация
Качественный ролик про муравьиные алгоритмы (для тех, кто не знает, что это). Когда-то они были очень популярные, последние годы как-то я о них не слышал.
https://youtu.be/8KTzAiusfPs

YouTube

Роевой интеллект. Муравьиный алгоритм.

В ролике рассказано о "Муравьином алгоритме".
Муравьиный алгоритм - один из эффективных полиномиальных алгоритмов для решения задач поиска маршрутов на графах. Суть подхода заключается в анализе и использовании модели поведения муравьёв, ищущих пути от колонии…

3.2K views08:07

Small Data Science for Russian Adventurers

Каким фреймворком для глубокого обучения Вы пользуетесь? (можно выбрать несколько вариантов):

Anonymous Poll

1.1K voters3.1K views10:26

Small Data Science for Russian Adventurers

Не думал, что 20 комментариев сходу может набрать опрос по фрейворкам, причём с нейтральной формулировкой, а не так "Давайте выберем самый крутой..."
Для желающих что-то изменить в опросе, обратите внимание что Kaggle-опрос и любой из top-10 гугловской выдачи обладает такими же "недостатками" (разве что я JAX не указал), поэтому атакуйте сначала Kaggle-сообщество (там более 20 000 опрошенных, опрос имеет больший вес в IT-сообществе и не отражает личного любопытства автора ;)
https://www.kaggle.com/kaggle-survey-2020

П.С. Кстати, заметьте прогнозируемое, но тем не менее любопытное несоответствие популярности TF vs Pytorch на кэгле и здесь...

3.3K views12:45

Small Data Science for Russian Adventurers

#жзл
Интервью у руководительницы группы исследователей в FAIR
https://meduza.io/feature/2021/03/07/v-facebook-rabotayut-ne-tolko-inzhenery-no-i-nastoyaschie-uchenye-odna-iz-nih-natalya-neverova-uchit-kompyutery-videt-i-ponimat-mir

Meduza

В Facebook работают не только инженеры, но и настоящие ученые. Одна из них, Наталья Неверова, учит компьютеры видеть и понимать…

Facebook — большая корпорация, которая пытается охватить множество сфер, от общения людей и игр до разработки шлемов виртуальной реальности. Разумеется, не обходит фейсбук вниманием и искусственный интеллект: 4 марта компания рассказала о новой модели компьютерного…

3.5K views18:19

Small Data Science for Russian Adventurers

#конференции
Научная школа по финансовой математике в Сочи
https://sochisirius.ru/obuchenie/graduates/smena874/4195

3.6K views21:42

Small Data Science for Russian Adventurers

#юмор
Для работающих со звуком - прямо в точку;)

3.4K views13:06

Small Data Science for Russian Adventurers

#видео
Продолжаем семинар в этом семестре... про произведение двух бертоподобных моделей:
https://youtu.be/gFdxrBZq6rE

YouTube

SEM2021: Васильев Руслан "Learning from others’ mistakes: Avoiding dataset biases..."

09.03.2021 Доклад о "правильном" файнтьюнинге BERT-a.
докладчик: Васильев Руслан (317 группа ВМК МГУ)
слайды: https://github.com/Dyakonov/MSU/blob/master/SEMINARS/20210309_VasilievR_avoiddatasetbias.pdf
руководитель семинара: Дьяконов Александр (https://…

3.8K views16:56

Small Data Science for Russian Adventurers

#конференции
Доклад Марии Когадеевой (кстати, выпускницы нашей кафедры;), а сейчас PhD from EMBL Heidelberg) "Integrating metabolomics and transcriptomics to explore host-microbiome interactions"
https://ucdavis.zoom.us/meeting/register/tJwpdeytrTkpGNYvzczugTGRTmgZGXGS4ViX

4.2K views12:10

Small Data Science for Russian Adventurers

#визуализация
Самая странная визуализация, которую я видел в этом году... тут и хотдоги и марихуана. Что хотел передать этим автор неизвестно...

5.5K views14:41

Small Data Science for Russian Adventurers

#математика
Здесь собраны интересные факты о числах (как правило, представления их каким-то образом):
https://primes.utm.edu/curios/index.php

primes.utm.edu

Prime Curios! Index: Numbers

This is the complete index for
the prime curiosity collection--an exciting collection of curiosities,
wonders and trivia related to prime numbers and integer factorization.
Pleasant browsing for those who love mathematics at all levels;…

4.7K views16:04