Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#чужие_блоги
У Артёма Груздёва есть блог на медиуме, пока не очень популярный, но полезный. Последняя заметка в интересном формате - ответы на вопросы (тоже хочу подобное сделать):
https://medium.com/@rcgewissta/ответы-на-вопросы-учеников-1-db5f439015bc
#код
Сам не пробовал, но когда-то что-то подобное было актуально. Только вот автоматический выбор размера батча проблемы с памятью не решит.
https://github.com/rentruewang/koila
#статья
Мой коллега Дмитрий Ватолин написал лонгрид по мотивам работы своей лаборатории, посвящённый году науки! Если не можете комментировать на хабре - напишите здесь, что думаете по поднятым вопросам. Мне кажется, что мнения будут полярными;)
https://habr.com/ru/post/598305/
#статья
На тему, а можно ли использовать открытые датасеты...
https://arxiv.org/abs/2111.02374v1
Всех с Новым годом!
Побольше вокруг конструктива, позитива и креатива.
Всем здоровья, материального благополучия и самореализации.
Немного статистики канала по прошлому году… что-то очень много подписчиков для канала, который создавался «для своих». В начале года будет много ссылок на разные курсы, поскольку их просмотром я сейчас и занимаюсь. В канале включены «реакции». Если Вы вдруг не понимаете, что это такое, запустите телеграм через VPN (тогда он обновится должным образом). Теперь можно дизлайкать посты;)
Первого января на arxiv был залит такой довольно приличный обзор по матричным разложениям: https://arxiv.org/abs/2201.00145
Правда, автор раньше уже заливал в более полном виде: https://arxiv.org/pdf/2107.02579.pdf
В любом случае обзор хорош (с доказательствами) и это первая статья, которую я посмотрел в новом году.
#книга
ANDREW FERLITSCH «Deep Learning Patterns and Practices»
Глубокое обучение вряд ли по этой книге можно выучить, но в качестве быстрого повтора (подготовки к экзамену или собесу) подойдёт. Идея книги неплохая и оригинальная систематизация тоже. Есть примеры на керасе. Поясняется много терминов из мира машинного обучения. Из минусов - много чего нет (рекуррентных сетей и трансформеров, например).
#курс
Началось чтение курса Statistical Rethinking (2022 Edition).
Выглядит очень симпатичным. Есть видео и слайды. Из условных минусов - примеры кода на R.
https://github.com/rmcelreath/stat_rethinking_2022
#курс
И ещё один классный курс "Вероятностное машинное обучение" - Probabilistic Machine Learning (Summer 2020). Хорошо продуман, "крафтовый". Про сэмплирование, MCMC, гауссовские процессы и многое другое.
https://uni-tuebingen.de/en/fakultaeten/mathematisch-naturwissenschaftliche-fakultaet/fachbereiche/informatik/lehrstuehle/methoden-des-maschinellen-lernens/lehre/probabilistic-machine-learning/
#забавно
Небольшая мотивирующая история... вот эта работа 2004го года Давида Лойе имеет более 65 тысяч цитирований. Её первые версии подавались аж в конце 90х на ICCV 97, CVPR 98 и были отвергнуты... успех пришёл только через 7 лет.
#юмор
Редкое явление для регулярных конференций под эгидой РАН: см. название и дизайн логотипа (верхний кончик снежинки):
http://web2.nioch.nsc.ru/ctoc2022/