#код
Пример использования библиотеки RAPIDS от NVIDIA от победителя соревнования IEEE-CIS Fraud Detection
https://www.kaggle.com/cdeotte/rapids-feature-engineering-fraud-0-96
Пример использования библиотеки RAPIDS от NVIDIA от победителя соревнования IEEE-CIS Fraud Detection
https://www.kaggle.com/cdeotte/rapids-feature-engineering-fraud-0-96
Kaggle
RAPIDS - Feature Engineering - Fraud - [0.96]
Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources
#статья
Работа From local explanations to global understanding with explainable AI for trees опубликованная в Nature Machine Intelligence про интерпретацию алгоритмов, основанных на решающих деревьях, с помощью SHAP-подхода
https://www.nature.com/articles/s42256-019-0138-9.epdf
Работа From local explanations to global understanding with explainable AI for trees опубликованная в Nature Machine Intelligence про интерпретацию алгоритмов, основанных на решающих деревьях, с помощью SHAP-подхода
https://www.nature.com/articles/s42256-019-0138-9.epdf
Nature
From local explanations to global understanding with explainable AI for trees
Nature Machine Intelligence - Tree-based machine learning models are widely used in domains such as healthcare, finance and public services. The authors present an explanation method for trees that...
#математика
Некоммерческий проект - электронная математическая библиотека. Например, нашёл там интересный перевод 1923 года книги Эмиля Бореля «Случай». Можно почитать, как рассказывали о вероятности до трудов Колмогорова.
https://www.mathedu.ru
Некоммерческий проект - электронная математическая библиотека. Например, нашёл там интересный перевод 1923 года книги Эмиля Бореля «Случай». Можно почитать, как рассказывали о вероятности до трудов Колмогорова.
https://www.mathedu.ru
Библиотека Mathedu.Ru
Главная // Библиотека Mathedu.Ru
«Математическое образование» — общедоступная сетевая электронная библиотека. Содержит учебную, методическую и популярную литературу по математике.
#законы
В наше время анализа данных один из способов их получения - веб-скрейпинг, про законность которого есть разные мнения (естественно, в зависимости от того, владеете ли Вы интернет-ресурсом, или хотите получить данные). Вот последняя практика в США:
https://parsers.me/us-court-fully-legalized-website-scraping-and-technically-prohibited-it/
В наше время анализа данных один из способов их получения - веб-скрейпинг, про законность которого есть разные мнения (естественно, в зависимости от того, владеете ли Вы интернет-ресурсом, или хотите получить данные). Вот последняя практика в США:
https://parsers.me/us-court-fully-legalized-website-scraping-and-technically-prohibited-it/
Parsers
US court fully legalized website scraping and technically prohibited it - Parsers
- US court fully legalized website scraping and technically prohibited it Parsers
#интересно
Петиция за дистанционное участие в конференциях. Идея понятная, я ожидал, правда, более веских аргументов в обосновании...
https://www.change.org/p/organizers-of-data-science-and-machine-learning-conferences-neurips-icml-aistats-iclr-uai-allow-remote-paper-poster-presentations-at-conferences
Петиция за дистанционное участие в конференциях. Идея понятная, я ожидал, правда, более веских аргументов в обосновании...
https://www.change.org/p/organizers-of-data-science-and-machine-learning-conferences-neurips-icml-aistats-iclr-uai-allow-remote-paper-poster-presentations-at-conferences
Change.org
Sign the Petition
Allow remote paper & poster presentations at scientific conferences
#бизнес
На хабре недавно вышла очень хорошая и правдивая статья - здорово описывает большинство известных мне стартапов и ситуацию в медицине:
https://habr.com/ru/company/dcmiran/blog/483154/
На хабре недавно вышла очень хорошая и правдивая статья - здорово описывает большинство известных мне стартапов и ситуацию в медицине:
https://habr.com/ru/company/dcmiran/blog/483154/
Хабр
Я потратил $40 тыс. и запорол отличную идею для стартапа
Из хорошей идеи не всегда выходит бизнес Голова буквально раскалывается. Вы стоите в аптеке, массируете виски и ищете на витрине что-нибудь — что угодно — лишь б...
#конференция
Сейчас проходит AAAI-20, на сайте можно найти много любопытных материалов:
https://aaai.org/Conferences/AAAI-20/
Сейчас проходит AAAI-20, на сайте можно найти много любопытных материалов:
https://aaai.org/Conferences/AAAI-20/
#визуализация
Статистика фильмов-номинантов на Оскар за всё время:
https://app.powerbi.com/view?r=eyJrIjoiNTA3YTlmZjAtOTcwYy00NjUxLTk3OWItMGE0Zjc3ZGJiZmUzIiwidCI6ImU3N2EyNjdjLWE1ZjctNDQyNi1iYTA4LWM2ZTU5OWE2ZDExYiIsImMiOjl9
Статистика фильмов-номинантов на Оскар за всё время:
https://app.powerbi.com/view?r=eyJrIjoiNTA3YTlmZjAtOTcwYy00NjUxLTk3OWItMGE0Zjc3ZGJiZmUzIiwidCI6ImU3N2EyNjdjLWE1ZjctNDQyNi1iYTA4LWM2ZTU5OWE2ZDExYiIsImMiOjl9
#курсы
Посмотрел курс "Introduction to
Deep Learning" http://introtodeeplearning.com/ Из минусов - очень несбалансирвоан, первые лекции для совсем новичков, а последние больше для узких специалистов. Выбор тем тоже определялся вкусами авторов. Но из явных плюсов: подача материала продумана и слайды сделали хорошо. Это именно авторский курс (а не как сейчас часто делают - скопировали слайды из 2-3 известных курсов и сделали свой).
Посмотрел курс "Introduction to
Deep Learning" http://introtodeeplearning.com/ Из минусов - очень несбалансирвоан, первые лекции для совсем новичков, а последние больше для узких специалистов. Выбор тем тоже определялся вкусами авторов. Но из явных плюсов: подача материала продумана и слайды сделали хорошо. Это именно авторский курс (а не как сейчас часто делают - скопировали слайды из 2-3 известных курсов и сделали свой).
MIT Deep Learning 6.S191
MIT's introductory course on deep learning methods and applications
#конференция
В МГУ проходит ежегодная конференция для молодых учёных "Ломоносов"
http://lomonosov-msu.ru/rus/event/6500/
В МГУ проходит ежегодная конференция для молодых учёных "Ломоносов"
http://lomonosov-msu.ru/rus/event/6500/
lomonosov-msu.ru
Ломоносов 2020
Международная научная конференция студентов, аспирантов и молодых учёных «Ломоносов-2020» / Москва, Россия, МГУ, 10 - 27 Ноя 2020
#юмор
До сих пор в моей коллекции формул рекорд был у 5-этажной. Справедливости ради, авторы именно так эту теорему не формулировали. А скриншот я сделал отсюда: https://users.cs.duke.edu/~rupert/fair-division-aaai20/Tutorial-Slides.pdf
До сих пор в моей коллекции формул рекорд был у 5-этажной. Справедливости ради, авторы именно так эту теорему не формулировали. А скриншот я сделал отсюда: https://users.cs.duke.edu/~rupert/fair-division-aaai20/Tutorial-Slides.pdf
#вакансия
«Построить realtime персонализирующую систему» - такая задача стоит в этом году перед ds-командой в озоне.
Надо уметь для миллионов клиентов выбирать лучшие товары (а их миллионы), лучшие акции (а их тысячи), лучшие бренды, категории и много чего еще. Надо нагенерить сотни фич, перепробовать разные модели, состыковаться с бизнес-заказчиками и техническими экспертами, которые выкатят это добро в продакшн. Помимо этой задачи есть и другие, например, предсказание CTR или подбор оптимальной скидки для клиента.
Мы ищем сильного лида в группу DS на направление рекомендаций и маркетинга, который готов возглавить команду из 3-5 человек и довести все существующие бизнес-задачи до прода и по пути нагенерить новых.
Стек: PySpark, Airflow, Pytorch, Git, Confluence :)
Локация: Москва-Сити
Зп: 250-350
[email protected] , мессенджеры по номеру +7-909-688-36-48 (Ксюша, руководитель отдела DS)
«Построить realtime персонализирующую систему» - такая задача стоит в этом году перед ds-командой в озоне.
Надо уметь для миллионов клиентов выбирать лучшие товары (а их миллионы), лучшие акции (а их тысячи), лучшие бренды, категории и много чего еще. Надо нагенерить сотни фич, перепробовать разные модели, состыковаться с бизнес-заказчиками и техническими экспертами, которые выкатят это добро в продакшн. Помимо этой задачи есть и другие, например, предсказание CTR или подбор оптимальной скидки для клиента.
Мы ищем сильного лида в группу DS на направление рекомендаций и маркетинга, который готов возглавить команду из 3-5 человек и довести все существующие бизнес-задачи до прода и по пути нагенерить новых.
Стек: PySpark, Airflow, Pytorch, Git, Confluence :)
Локация: Москва-Сити
Зп: 250-350
[email protected] , мессенджеры по номеру +7-909-688-36-48 (Ксюша, руководитель отдела DS)
комментарий к предыдущей вакансии: когда-то я сам работал (причём лет 5, наверное) в группе аналитиков Озона - тогда и сама группа была существенно меньше и задач меньше и офис меньше;) Сейчас я с ребятами по работе никак не связан, но приятно, что осталось ядро старого коллектива, что огромный прогресс в организации работы, самих задачах и компании в целом, и что пришло много новых крутых DS. Думаю, что это одно из самых аппетитных предложений по совокупности разных факторов (если, конечно, Вы не фанат банковского сектора или китайских компаний). В вакансии есть один подвох - нужен Lead DS (т.е. человек с опытом и способный руководить).
#книга
Для начинающих - небольшой обзор matplotlib на русском языке:
https://devpractice.ru/files/books/python/Matplotlib.book.pdf
Для начинающих - небольшой обзор matplotlib на русском языке:
https://devpractice.ru/files/books/python/Matplotlib.book.pdf