Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
Forwarded from Sberloga (Alexander C)
🚀 "SBERLOGA" представляет необычнейший доклад - дата сайнс (NLP, граф-мл) и философия - присоединяйтесь.
👨‍🔬 Антон Костин (МФТИ) "Философия на графах"
⌚️ Вторник 27 апреля, 19.00 по Москве

Разберем блокнот с кодом построения графа поверх текстовых эмбеддингов (fasttext).
На примере Louvain посмотрим, как алгоритмы модульности находят философские школы.
В задаче Link Prediction подумаем над неочевидными связями между разными школами и философами.
А также обсудим, будут ли студенты ВУЗов делать домашку по философии с использованием NLP
и дискретной математики (спойлер: на Физтехе уже начали)? Рассказывает преподаватель философии.

Ноутбуки и данные доступы на каггле:
https://www.kaggle.com/visualcomments/philosophy-ru-large
Ваши апвоут, конечно, приветствуются.

Ссылка на зум будет доступна через чат тг чат https://yangx.top/kg_course ближе к началу доклада.
#код
Библиотека для активного обучения (пока не пробовал, да и задач таких сейчас у меня нет, но выглядит симпатично, самые известные подходы реализованы, заявлена совместимость с другими библиотеками)
modal-python.readthedocs.io
#видео
Здесь есть видео курса «Основы нейронауки» Института высшей нервной деятельности и нейрофизиологии РАН. Я сам пока не смотрел, но выглядит любопытно.
https://www.youtube.com/channel/UC_chHsPHVi8xwdVYgSwtgAA/videos
Forwarded from Chat Small Data Science for Russian Adventurers
картинка к следующему опросу
Forwarded from Chat Small Data Science for Russian Adventurers
Какой метод иллюстрирует картинка
Anonymous Quiz
5%
SVD
7%
PCA
15%
kernel PCA
29%
LLE
11%
SNE
33%
t-SNE
#юмор
Пример вечного двигателя;)
#обзор
Вроде уже не пополняемый сборник ссылок, но есть ссылки на интересные старые материалы
https://mlpapers.org/
C4. Data Science Interview.pdf
15.6 MB
#карьера
Вопросы для DS-собеседования
#блог
Есть такой блог одного сообщества. Там не очень часто, но регулярно выходят небольшие обзоры ярких статей из мира DS:
https://www.topbots.com/
#забавно
Наблюдение...
Когда говорят об открытиях прошлого, то прежде всего называют фамилии создателей, например "нейрон" прочно ассоциируется с МакКаллоком и Питсом, неокогнитрон с Фукусимой, LSTM с Шмидхубером, LeNet с ЛеКуном, при этом мало кто может ответить, а где же работали эти исследователи, когда это всё создавали. Современные открытия ассоциируются с компаниями, например BERT с Google, Alpha* с DeepMind, GPT2/3 c OpenAI. И при этом почти никто не назовёт, например, фамилии авторов статьи про BERT...
#забавно
Белые и чёрные всё-таки отличаются...
#блог
У Андрея Лукьяненко есть очень симпатичный блог. Большая часть постов - обзор свежих научных работ.
https://andlukyane.com/blog/
#статья
Довольно интересный сборник теории:
https://arxiv.org/abs/2105.04026
#забавно
На рисунке изображён не просто какой-то человек, а Бёр Сеттлс (Burr Settles) - автор одной из лучших (но уже немного старой) книг по активному обучению.
#длясправки
Есть Semi-supervised Learning - довольно известный вид обучения, когда дана выборка, часть которой имеет метки (поэтому можно сказать, что это "промежуточная" задача между Supervised Learning и Unsupervised Learning). Но есть ещё Semi-Unsupervised Learning - и мало кто знает, что это за зверь. На самом деле, этот термин разные исследователи пытались ввести по-разному. Мне понравилась такая формализация - обучение по неразмеченной выборке, для которой есть некоторая дополнительная информация о разметке (например, такие-то объекты имеют одинаковые метки, всего 3 класса, пропорции классов 3:2:1).
картинка к вопросу