Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
Forwarded from Chat Small Data Science for Russian Adventurers
картинка к следующему опросу
Forwarded from Chat Small Data Science for Russian Adventurers
Какой метод иллюстрирует картинка
Anonymous Quiz
5%
SVD
7%
PCA
15%
kernel PCA
29%
LLE
11%
SNE
33%
t-SNE
#юмор
Пример вечного двигателя;)
#обзор
Вроде уже не пополняемый сборник ссылок, но есть ссылки на интересные старые материалы
https://mlpapers.org/
C4. Data Science Interview.pdf
15.6 MB
#карьера
Вопросы для DS-собеседования
#блог
Есть такой блог одного сообщества. Там не очень часто, но регулярно выходят небольшие обзоры ярких статей из мира DS:
https://www.topbots.com/
#забавно
Наблюдение...
Когда говорят об открытиях прошлого, то прежде всего называют фамилии создателей, например "нейрон" прочно ассоциируется с МакКаллоком и Питсом, неокогнитрон с Фукусимой, LSTM с Шмидхубером, LeNet с ЛеКуном, при этом мало кто может ответить, а где же работали эти исследователи, когда это всё создавали. Современные открытия ассоциируются с компаниями, например BERT с Google, Alpha* с DeepMind, GPT2/3 c OpenAI. И при этом почти никто не назовёт, например, фамилии авторов статьи про BERT...
#забавно
Белые и чёрные всё-таки отличаются...
#блог
У Андрея Лукьяненко есть очень симпатичный блог. Большая часть постов - обзор свежих научных работ.
https://andlukyane.com/blog/
#статья
Довольно интересный сборник теории:
https://arxiv.org/abs/2105.04026
#забавно
На рисунке изображён не просто какой-то человек, а Бёр Сеттлс (Burr Settles) - автор одной из лучших (но уже немного старой) книг по активному обучению.
#длясправки
Есть Semi-supervised Learning - довольно известный вид обучения, когда дана выборка, часть которой имеет метки (поэтому можно сказать, что это "промежуточная" задача между Supervised Learning и Unsupervised Learning). Но есть ещё Semi-Unsupervised Learning - и мало кто знает, что это за зверь. На самом деле, этот термин разные исследователи пытались ввести по-разному. Мне понравилась такая формализация - обучение по неразмеченной выборке, для которой есть некоторая дополнительная информация о разметке (например, такие-то объекты имеют одинаковые метки, всего 3 класса, пропорции классов 3:2:1).
картинка к вопросу
Как называется приведённый классический метод из категории Semi-Supervised Learning?
Anonymous Quiz
13%
bi-Training
31%
Co-Training
23%
Self-Training
8%
Propagating
9%
Transductive SVM
17%
нет правильного варианта