Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#книга
Посмотрел "Геометрию глубокого обучения" от Джонга Йе.
+ попытка сделать обзор всего-всего (тут не только нейросети) и не только геометрия
+ есть интересные ссылки в обзорах (книга свежая и ссылки на статьи прошлого года)
- несоответствие названия содержанию
- нет методов, основанных на деревьях (зато много про методы с kernel tricks)
- поверхностное изложение всех тем, как учебник не годится, для повторения материала тоже не очень
#книга
Учебник по RL от Сергея Иванова - новая версия (исправленная), теперь на arxiv-е (на русском языке):
https://arxiv.org/abs/2201.09746
#книга
Совсем недавно выложили в общий доступ книгу про регрессию "Regression and Other Stories" (я ещё пока не читал, просто посмотрел - много смежных тем: заполнение пропусков, байесовский вывод и т.п., примеры кода на R).
https://users.aalto.fi/~ave/ROS.pdf
#полезно
Сегодня коллега по работе спросил, есть ли ресурс, который позволяет работать с графом цитирования статей. Я нашёл только это:
https://www.connectedpapers.com/
Хотя тут нет всего функционала, который бы хотелось...

UPDATE: в комментариях есть и более крутые решения!
Channel name was changed to «Small Data Science for Russian Adventurers»
#курс
Табличка с курсами Стэнфорда (указано наличие материалов и видео):
https://burlachenkok.github.io/Courses-at-Stanford-relative-to-AI/
#визуализация
Статья по математике (!) с офигительными рисунками, вот это уровень!
https://arxiv.org/pdf/2201.12689.pdf
#полезно
Многие, думаю, уже знают. Но поскольку я как-то писал о ресурсах, которые превращают статьи на arxive в html-документы, то для полноты надо и об этом написать...

Теперь достаточно в слове arxiv заменить X на 5. Например, так
https://arxiv.org/abs/2010.09839 (было) -> https://ar5iv.org/abs/2010.09839 (стало) https://ar5iv.org/html/2010.09839 (или так)

Получается довольно приятно, но на примере выше видны возможные проблемы с картинками. Также это пока не работает для свежих статей.
#статья
Неплохой пример современной диссертации (их раньше меньше выкладывали на arxiv) про нейронные дифференциальные уравнения (именно диссертаций по этой теме я раньше не видел):
https://arxiv.org/abs/2202.02435
#забавно
Когда-то гугл ругали за это - по запросу "CEO" в гугл-картинках выводились практически одни мужчины, а первая женщина-CEO в выдаче была Барби. Сейчас это пофиксили, но легко "взломать систему" - немного исправив запрос "CEO" добиться гендерного перекоса.
#юмор
Эту историю постоянно пересказывают, причём почти всегда сильно перевирая и добавляя деталей, которых не было (хотя, возможно, есть несколько схожих историй - но я сомневаюсь).

Ссылка на интервью с Марвином Минским: https://www.webofstories.com/play/marvin.minsky/122
#курс
У Себастьяна Рашки есть очень симпатичный вводный в DL курс. Он довольно хорошо продуман, рассчитан на относительно начальный уровень, много хорошего кода, почти все классические темы покрыты (до трансформеров), без копания в тонкости (например, нет ничего про сегментацию или детектирование объектов в CV).
https://sebastianraschka.com/blog/2021/dl-course.html
#блог
В комментариях скинули ссылку на один любопытный материал. Оказалось, что она ведёт на довольно оригинальный блог (он довольно известный, но я, например, уже больше года его не читал). По-моему, есть ещё один - аналогичный по стилю изложения и охвату тем (а может, просто у этого дизайн поменялся). Давайте его порекламируем (но мне читать материалы оттуда почему-то сложно):
https://www.gwern.net/
#курс
В эту пятницу стартует курс OzonMasters по Продуктовой аналитике от Кирилла Кочнева (https://koch-kir.medium.com/). В отличии от большинства курсов OzonMasters этот курс открыт для всех!
Если Вы
- хотите прослушать курс,
- знаете python,
- знаете статистику хотя бы на базовом уровне,
- хотите развиваться в роли аналитика данных/бизнес-аналитика
пишите на [email protected] до четверга (24 февраля) включительно или заполните короткую регистрационную форму
https://forms.gle/pXyyNpyskyHr8p2W9

Программа курса:
Блок Введение
Занятие 1: Зачем нужна аналитика, виды аналитиков
Занятие 2: Метрики
Блок по БД
Занятие 3: Зачем нужны БД и какие они бывают
Занятие 4: Введение в SQL
Занятие 5: Типы данных, подзапросы и view
Занятие 6: Оконные функции и оптимизация запросов
Занятие 7: Фишки Clickhouse
Занятие 8: Типичные задачи в аналитике
Блок по фреймворкам:
Занятие 9: сегментация, RFM-анализ
Занятие 10: экономика продукта, Когорты, LTV
Блок по визуализации:
Занятие 11: Инструменты визуализации, Tableau
Занятие 12: Представление результатов работы
Занятие 13: Airflow
#образование
Сейчас в аспирантурах страны будет использоваться новая номенклатура специальностей, по которым можно защищать диссертации. Она стала более современной, например, появился раздел 1.2 "Компьютерные науки и информатика", в котором есть специальность 1.2.1 "Искусственный интеллект и машинное обучение". Раньше у всех, кто занимался машинным обучением были проблемы с тем, по какой специальности защищаться. Теперь её нет.

Из интересного, есть и раздел 5.11. "Теология" (почему-то соседний с когнитивными науками) и три специальности, оказывается, теология может быть теоретической, исторической и практической;)

https://vak.minobrnauki.gov.ru/uploader/loader?type=1&name=91506173002&f=7892
#книга
Питер Брайан  Медавар «Советы молодому ученому»
Классика - книга о науке, в форме монолога о разных аспектах научной деятельности (где взять задачу, что такое публичность в науке, этика ссылок на первоисточники, какие бывают эксперименты и многое другое). Все вещи довольно простые, но собраны в одном месте и написаны хорошим языком.
#интересно
Довольно любопытный график. Чемпион до-глубокого периода (если измерять во FLOP-сах) – решение задачи на конкурсе Netflix (это к вопросу, что нельзя было просто так взять и выиграть). Чемпион глубокого – GloVe (никогда не подумал бы). А текущего чемпиона попробуем угадать в голосовалке ниже...
Оригинал здесь. Смотреть после голосования;)