Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#забавно
Чего только нет на рынке умных колонок:
http://bjoernkarmann.dk/project_alias
#вёрстка
Можно проверить, насколько Вы хорошо знаете ТеХ:
https://texnique.xyz
#вакансия
«Построить realtime персонализирующую систему» - такая задача стоит в этом году перед ds-командой в озоне.
Надо уметь для миллионов клиентов выбирать лучшие товары (а их миллионы), лучшие акции (а их тысячи), лучшие бренды, категории и много чего еще. Надо нагенерить сотни фич, перепробовать разные модели, состыковаться с бизнес-заказчиками и техническими экспертами, которые выкатят это добро в продакшн. Помимо этой задачи есть и другие, например, предсказание CTR или подбор оптимальной скидки для клиента.
Мы ищем сильного лида в группу DS на направление рекомендаций и маркетинга, который готов возглавить команду из 3-5 человек и довести все существующие бизнес-задачи до прода и по пути нагенерить новых.

Стек: PySpark, Airflow, Pytorch, Git, Confluence :)
Локация: Москва-Сити
Зп: 250-350

[email protected] , мессенджеры по номеру +7-909-688-36-48 (Ксюша, руководитель отдела DS)
комментарий к предыдущей вакансии: когда-то я сам работал (причём лет 5, наверное) в группе аналитиков Озона - тогда и сама группа была существенно меньше и задач меньше и офис меньше;) Сейчас я с ребятами по работе никак не связан, но приятно, что осталось ядро старого коллектива, что огромный прогресс в организации работы, самих задачах и компании в целом, и что пришло много новых крутых DS. Думаю, что это одно из самых аппетитных предложений по совокупности разных факторов (если, конечно, Вы не фанат банковского сектора или китайских компаний). В вакансии есть один подвох - нужен Lead DS (т.е. человек с опытом и способный руководить).
#книга
Для начинающих - небольшой обзор matplotlib на русском языке:
https://devpractice.ru/files/books/python/Matplotlib.book.pdf
#видео
Порекламирую-ка я доклад моего магистра, а то там меньше 200 просмотров. А доклад (и магистр) очень крутой - про обучение с подкреплением (RL), но не про всё, конечно, а про способы RL-обучения в режиме Self-Supervision (вместе с сопутствующими терминами: "без награды", "с виртуальной наградой", "с любопытством" и т.п.)
https://www.youtube.com/watch?v=8zZrciFXJM8
#железо
О видеокартах для глубокого обучения:
https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/
#визуализация
Люблю инфографику, особенно полезную, когда на ровном месте можно сделать так, чтобы было красиво и мир стал чуточку удобнее. Вот пример - карта проходных дворов Питера:
https://www.behance.net/gallery/91311791/karta-prohodnyh-dvorov-petrogradki
#конференция
Сейчас проходит мероприятие Intersections between Control, Learning and Optimization, которое интересно, в первую очередь, любителям обучения с подкреплением, оптимизации, диффуров и робототехники. Здесь можно посмотреть доклады (часть выложена, остальная - чуть позже, т.к. воркшоп в разгаре):
http://www.ipam.ucla.edu/programs/workshops/intersections-between-control-learning-and-optimization/?tab=schedule
#статья
Небольшое социологическое исследование: молодых людей из нескольких университетов США спрашивали о приоритетах при выборе партнёров. Интересно, что особой разницы в ответах юношей и девушек я не увидел:
https://www.researchgate.net/profile/Mary_Noonan/publication/275010298_Measuring_Mate_Preferences_A_Replication_and_Extension/links/5919a9e64585159b1a4b99c4/Measuring-Mate-Preferences-A-Replication-and-Extension.pdf
#данные
Смитсонианский институт (США) предоставил для свободного доступа почти 3 млн изображений. На самом деле, выложено больше, но примерно столько имеют пометку «свободное использование», есть и 3D-изображения, и платформа для доступа к ним.
https://www.smithsonianmag.com/smithsonian-institution/smithsonian-releases-28-million-images-public-domain-180974263/
#оптимизация
Немного баян, но вдруг не все знают - хороший небольшой обзор по методам оптимизации. Есть приятный бонус - интерактивность графиков сходимости (можно подвигать начальную точку)
http://fa.bianp.net/teaching/2018/COMP-652/
#ПО
Обзор библиотек, которые используют Pytorch, но предоставляют более удобные функции и возможности простого написания и контроля пайплайнов:
https://neptune.ai/blog/model-training-libraries-pytorch-ecosystem
#олимпиада
Олимпиада для студентов выпускных курсов бакалавриата и выпускников по направлению «Прикладная математика и информатика» или смежным специальностям.

https://hse.skoltech.ru
#соревнования
Список хакатонов по DS:

21-22 марта, Хакатон от Яндекс-недвижимости, 500 000 руб
https://yandex.ru/promo/realty/hacktherealty

13-15 марта, Санкт-Петербург, MLHack, 425 000 руб (DS)
http://mlhack.tech/#/

25-28 марта, Санкт-Петербург, StarLine, какие-то призы обещали
https://robofinist.ru/event/info/short/id/339

4-5 апреля, Москва, Agro Hack, за идею (?)
https://agro-code.ru/#about

10-17 марта, онлайн, Cup IT, за идею (?)
https://1.changellenge.com/cup-it?utm
#интересно
Лаборатория Касперского разработала систему электронного голосования на базе блокчейна:
https://polys.me/ru/voting-machines
#CV
Примеры ноутбуков, в которых на Pytorch показаны решения нескольких ключевых задач в CV: классификация, сходство, детектирование и т.п.
https://github.com/microsoft/computervision-recipes