Small Data Science for Russian Adventurers
11.3K subscribers
307 photos
3 videos
13 files
708 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#полезно
Для МГУшников…
МГУ и Яндекс предлагают возможность завести почтовый ящик в домене @my.msu.ru, доступ к Яндекс.диску объемом 1 Тб без рекламы, Онлайн-редактору документов, Календарю, Мессенджеру, cистеме видеоконференции связи Телемост для ведения семинарских занятий.
https://my.msu.ru
🔥19
#полезно
Вчера просматривал DS-чаты, которые обычно не особо мониторю, ответил на несколько вопросов из серии "а почему у меня этот код не работает". Сегодня утром в личку стучится рекрутер с предложением о работе (судя по общим подпискам, как раз из-за вчерашней активности - до этого никогда не стучались). Вакансия на мидла в крупной компании, вилку не называют. Но в целом, мне идея понравилась - отлавливать кандидатов в профильных чатах (не тех, кто все вопросы к политике сводят или про будущее ИИ разглагольствуют, а тех, кто что-то дельное пишет, хоть в телеграме и нет кармы). Интересно только, насколько это действенный способ?
👍104
#полезно
Вот какая подборочка полезных ресурсов (в основном Open Source библиотек), разбитая по темам!
https://awesomeopensource.com/
👍27🔥3😱1
#полезно
Материалы по теории оптимизации, есть ссылки на другие полезные ресурсы.
https://fmin.xyz
❤‍🔥51🔥8🤩1🙏1🐳1
#полезно
Лучшие решения кэгловских конкурсов в одном месте:
https://farid.one/kaggle-solutions/
👍104🔥6😱1
#полезно
Пособие для подготовки к DS-собеседованиям.
Мне не очень понравилось, но его делали, опираясь на какие-то реальные кейсы, так что для быстрого повтора тем всё равно будет небесполезно.
https://dipranjan.github.io/dsinterviewqns/intro.html
👍39🔥10👎1
#полезно
Поучительная схемка из "старенькой" статьи. При работе с рядами часто забывают, что их можно по-разному представлять, например переводя в строки: можно разбить на кусочки и задать правило, по которому кусок кодируется буквой из некоторого алфавита. Когда-то этот способ рекламировал Воронцов для анализа ЭКГ (т.н. метод Успенского В.М.).
👍28🤔62
#полезно
Довольно любопытный блог, в основном тут описываются идеи научных статей. Тематика: оптимизация, тензорные разложения, GAN-ы. Из последних интересных постов: качество на тестовой выборке почти совпадает с качеством на синтетической выборке, построенной с помощью GAN-a, обученного на обучении (т.е. предсказывается качество на тесте).

https://www.offconvex.org
👍42
#полезно
Один интересный кейс, который мне очень нравится: как догадаться до нужной деформации целевых значений.
🔥90👍21
#полезно
Очень классный источник обзорных статей с красивыми визуализациями от одного из авторов книги "Hands-On Large Language Models". Есть обзоры по LLM-агентам, рассуждающим моделям, смеси экспертов, квантованию, моделе Mamba.

https://newsletter.maartengrootendorst.com
👍599🥰5❤‍🔥2