Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#статья
Работа From local explanations to global understanding with explainable AI for trees опубликованная в Nature Machine Intelligence про интерпретацию алгоритмов, основанных на решающих деревьях, с помощью SHAP-подхода
https://www.nature.com/articles/s42256-019-0138-9.epdf
#математика
Некоммерческий проект - электронная математическая библиотека. Например, нашёл там интересный перевод 1923 года книги Эмиля Бореля «Случай». Можно почитать, как рассказывали о вероятности до трудов Колмогорова.
https://www.mathedu.ru
#DL
Одно из применений нейронок - реставрация старых видео
https://youtu.be/3RYNThid23g
#законы
В наше время анализа данных один из способов их получения - веб-скрейпинг, про законность которого есть разные мнения (естественно, в зависимости от того, владеете ли Вы интернет-ресурсом, или хотите получить данные). Вот последняя практика в США:
https://parsers.me/us-court-fully-legalized-website-scraping-and-technically-prohibited-it/
#интересно
Петиция за дистанционное участие в конференциях. Идея понятная, я ожидал, правда, более веских аргументов в обосновании...
https://www.change.org/p/organizers-of-data-science-and-machine-learning-conferences-neurips-icml-aistats-iclr-uai-allow-remote-paper-poster-presentations-at-conferences
#конференция
Сейчас проходит AAAI-20, на сайте можно найти много любопытных материалов:
https://aaai.org/Conferences/AAAI-20/
#курсы
Посмотрел курс "Introduction to
Deep Learning" http://introtodeeplearning.com/ Из минусов - очень несбалансирвоан, первые лекции для совсем новичков, а последние больше для узких специалистов. Выбор тем тоже определялся вкусами авторов. Но из явных плюсов: подача материала продумана и слайды сделали хорошо. Это именно авторский курс (а не как сейчас часто делают - скопировали слайды из 2-3 известных курсов и сделали свой).
#юмор
До сих пор в моей коллекции формул рекорд был у 5-этажной. Справедливости ради, авторы именно так эту теорему не формулировали. А скриншот я сделал отсюда: https://users.cs.duke.edu/~rupert/fair-division-aaai20/Tutorial-Slides.pdf
#забавно
Чего только нет на рынке умных колонок:
http://bjoernkarmann.dk/project_alias
#вёрстка
Можно проверить, насколько Вы хорошо знаете ТеХ:
https://texnique.xyz
#вакансия
«Построить realtime персонализирующую систему» - такая задача стоит в этом году перед ds-командой в озоне.
Надо уметь для миллионов клиентов выбирать лучшие товары (а их миллионы), лучшие акции (а их тысячи), лучшие бренды, категории и много чего еще. Надо нагенерить сотни фич, перепробовать разные модели, состыковаться с бизнес-заказчиками и техническими экспертами, которые выкатят это добро в продакшн. Помимо этой задачи есть и другие, например, предсказание CTR или подбор оптимальной скидки для клиента.
Мы ищем сильного лида в группу DS на направление рекомендаций и маркетинга, который готов возглавить команду из 3-5 человек и довести все существующие бизнес-задачи до прода и по пути нагенерить новых.

Стек: PySpark, Airflow, Pytorch, Git, Confluence :)
Локация: Москва-Сити
Зп: 250-350

[email protected] , мессенджеры по номеру +7-909-688-36-48 (Ксюша, руководитель отдела DS)
комментарий к предыдущей вакансии: когда-то я сам работал (причём лет 5, наверное) в группе аналитиков Озона - тогда и сама группа была существенно меньше и задач меньше и офис меньше;) Сейчас я с ребятами по работе никак не связан, но приятно, что осталось ядро старого коллектива, что огромный прогресс в организации работы, самих задачах и компании в целом, и что пришло много новых крутых DS. Думаю, что это одно из самых аппетитных предложений по совокупности разных факторов (если, конечно, Вы не фанат банковского сектора или китайских компаний). В вакансии есть один подвох - нужен Lead DS (т.е. человек с опытом и способный руководить).
#книга
Для начинающих - небольшой обзор matplotlib на русском языке:
https://devpractice.ru/files/books/python/Matplotlib.book.pdf