Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#курсы
Посмотрел курс "Introduction to
Deep Learning" http://introtodeeplearning.com/ Из минусов - очень несбалансирвоан, первые лекции для совсем новичков, а последние больше для узких специалистов. Выбор тем тоже определялся вкусами авторов. Но из явных плюсов: подача материала продумана и слайды сделали хорошо. Это именно авторский курс (а не как сейчас часто делают - скопировали слайды из 2-3 известных курсов и сделали свой).
#юмор
До сих пор в моей коллекции формул рекорд был у 5-этажной. Справедливости ради, авторы именно так эту теорему не формулировали. А скриншот я сделал отсюда: https://users.cs.duke.edu/~rupert/fair-division-aaai20/Tutorial-Slides.pdf
#забавно
Чего только нет на рынке умных колонок:
http://bjoernkarmann.dk/project_alias
#вёрстка
Можно проверить, насколько Вы хорошо знаете ТеХ:
https://texnique.xyz
#вакансия
«Построить realtime персонализирующую систему» - такая задача стоит в этом году перед ds-командой в озоне.
Надо уметь для миллионов клиентов выбирать лучшие товары (а их миллионы), лучшие акции (а их тысячи), лучшие бренды, категории и много чего еще. Надо нагенерить сотни фич, перепробовать разные модели, состыковаться с бизнес-заказчиками и техническими экспертами, которые выкатят это добро в продакшн. Помимо этой задачи есть и другие, например, предсказание CTR или подбор оптимальной скидки для клиента.
Мы ищем сильного лида в группу DS на направление рекомендаций и маркетинга, который готов возглавить команду из 3-5 человек и довести все существующие бизнес-задачи до прода и по пути нагенерить новых.

Стек: PySpark, Airflow, Pytorch, Git, Confluence :)
Локация: Москва-Сити
Зп: 250-350

[email protected] , мессенджеры по номеру +7-909-688-36-48 (Ксюша, руководитель отдела DS)
комментарий к предыдущей вакансии: когда-то я сам работал (причём лет 5, наверное) в группе аналитиков Озона - тогда и сама группа была существенно меньше и задач меньше и офис меньше;) Сейчас я с ребятами по работе никак не связан, но приятно, что осталось ядро старого коллектива, что огромный прогресс в организации работы, самих задачах и компании в целом, и что пришло много новых крутых DS. Думаю, что это одно из самых аппетитных предложений по совокупности разных факторов (если, конечно, Вы не фанат банковского сектора или китайских компаний). В вакансии есть один подвох - нужен Lead DS (т.е. человек с опытом и способный руководить).
#книга
Для начинающих - небольшой обзор matplotlib на русском языке:
https://devpractice.ru/files/books/python/Matplotlib.book.pdf
#видео
Порекламирую-ка я доклад моего магистра, а то там меньше 200 просмотров. А доклад (и магистр) очень крутой - про обучение с подкреплением (RL), но не про всё, конечно, а про способы RL-обучения в режиме Self-Supervision (вместе с сопутствующими терминами: "без награды", "с виртуальной наградой", "с любопытством" и т.п.)
https://www.youtube.com/watch?v=8zZrciFXJM8
#железо
О видеокартах для глубокого обучения:
https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/
#визуализация
Люблю инфографику, особенно полезную, когда на ровном месте можно сделать так, чтобы было красиво и мир стал чуточку удобнее. Вот пример - карта проходных дворов Питера:
https://www.behance.net/gallery/91311791/karta-prohodnyh-dvorov-petrogradki
#конференция
Сейчас проходит мероприятие Intersections between Control, Learning and Optimization, которое интересно, в первую очередь, любителям обучения с подкреплением, оптимизации, диффуров и робототехники. Здесь можно посмотреть доклады (часть выложена, остальная - чуть позже, т.к. воркшоп в разгаре):
http://www.ipam.ucla.edu/programs/workshops/intersections-between-control-learning-and-optimization/?tab=schedule
#статья
Небольшое социологическое исследование: молодых людей из нескольких университетов США спрашивали о приоритетах при выборе партнёров. Интересно, что особой разницы в ответах юношей и девушек я не увидел:
https://www.researchgate.net/profile/Mary_Noonan/publication/275010298_Measuring_Mate_Preferences_A_Replication_and_Extension/links/5919a9e64585159b1a4b99c4/Measuring-Mate-Preferences-A-Replication-and-Extension.pdf
#данные
Смитсонианский институт (США) предоставил для свободного доступа почти 3 млн изображений. На самом деле, выложено больше, но примерно столько имеют пометку «свободное использование», есть и 3D-изображения, и платформа для доступа к ним.
https://www.smithsonianmag.com/smithsonian-institution/smithsonian-releases-28-million-images-public-domain-180974263/
#оптимизация
Немного баян, но вдруг не все знают - хороший небольшой обзор по методам оптимизации. Есть приятный бонус - интерактивность графиков сходимости (можно подвигать начальную точку)
http://fa.bianp.net/teaching/2018/COMP-652/
#ПО
Обзор библиотек, которые используют Pytorch, но предоставляют более удобные функции и возможности простого написания и контроля пайплайнов:
https://neptune.ai/blog/model-training-libraries-pytorch-ecosystem