#законы
В наше время анализа данных один из способов их получения - веб-скрейпинг, про законность которого есть разные мнения (естественно, в зависимости от того, владеете ли Вы интернет-ресурсом, или хотите получить данные). Вот последняя практика в США:
https://parsers.me/us-court-fully-legalized-website-scraping-and-technically-prohibited-it/
В наше время анализа данных один из способов их получения - веб-скрейпинг, про законность которого есть разные мнения (естественно, в зависимости от того, владеете ли Вы интернет-ресурсом, или хотите получить данные). Вот последняя практика в США:
https://parsers.me/us-court-fully-legalized-website-scraping-and-technically-prohibited-it/
Parsers
US court fully legalized website scraping and technically prohibited it - Parsers
- US court fully legalized website scraping and technically prohibited it Parsers
#интересно
Петиция за дистанционное участие в конференциях. Идея понятная, я ожидал, правда, более веских аргументов в обосновании...
https://www.change.org/p/organizers-of-data-science-and-machine-learning-conferences-neurips-icml-aistats-iclr-uai-allow-remote-paper-poster-presentations-at-conferences
Петиция за дистанционное участие в конференциях. Идея понятная, я ожидал, правда, более веских аргументов в обосновании...
https://www.change.org/p/organizers-of-data-science-and-machine-learning-conferences-neurips-icml-aistats-iclr-uai-allow-remote-paper-poster-presentations-at-conferences
Change.org
Sign the Petition
Allow remote paper & poster presentations at scientific conferences
#бизнес
На хабре недавно вышла очень хорошая и правдивая статья - здорово описывает большинство известных мне стартапов и ситуацию в медицине:
https://habr.com/ru/company/dcmiran/blog/483154/
На хабре недавно вышла очень хорошая и правдивая статья - здорово описывает большинство известных мне стартапов и ситуацию в медицине:
https://habr.com/ru/company/dcmiran/blog/483154/
Хабр
Я потратил $40 тыс. и запорол отличную идею для стартапа
Из хорошей идеи не всегда выходит бизнес Голова буквально раскалывается. Вы стоите в аптеке, массируете виски и ищете на витрине что-нибудь — что угодно — лишь б...
#конференция
Сейчас проходит AAAI-20, на сайте можно найти много любопытных материалов:
https://aaai.org/Conferences/AAAI-20/
Сейчас проходит AAAI-20, на сайте можно найти много любопытных материалов:
https://aaai.org/Conferences/AAAI-20/
#визуализация
Статистика фильмов-номинантов на Оскар за всё время:
https://app.powerbi.com/view?r=eyJrIjoiNTA3YTlmZjAtOTcwYy00NjUxLTk3OWItMGE0Zjc3ZGJiZmUzIiwidCI6ImU3N2EyNjdjLWE1ZjctNDQyNi1iYTA4LWM2ZTU5OWE2ZDExYiIsImMiOjl9
Статистика фильмов-номинантов на Оскар за всё время:
https://app.powerbi.com/view?r=eyJrIjoiNTA3YTlmZjAtOTcwYy00NjUxLTk3OWItMGE0Zjc3ZGJiZmUzIiwidCI6ImU3N2EyNjdjLWE1ZjctNDQyNi1iYTA4LWM2ZTU5OWE2ZDExYiIsImMiOjl9
#курсы
Посмотрел курс "Introduction to
Deep Learning" http://introtodeeplearning.com/ Из минусов - очень несбалансирвоан, первые лекции для совсем новичков, а последние больше для узких специалистов. Выбор тем тоже определялся вкусами авторов. Но из явных плюсов: подача материала продумана и слайды сделали хорошо. Это именно авторский курс (а не как сейчас часто делают - скопировали слайды из 2-3 известных курсов и сделали свой).
Посмотрел курс "Introduction to
Deep Learning" http://introtodeeplearning.com/ Из минусов - очень несбалансирвоан, первые лекции для совсем новичков, а последние больше для узких специалистов. Выбор тем тоже определялся вкусами авторов. Но из явных плюсов: подача материала продумана и слайды сделали хорошо. Это именно авторский курс (а не как сейчас часто делают - скопировали слайды из 2-3 известных курсов и сделали свой).
MIT Deep Learning 6.S191
MIT's introductory course on deep learning methods and applications
#конференция
В МГУ проходит ежегодная конференция для молодых учёных "Ломоносов"
http://lomonosov-msu.ru/rus/event/6500/
В МГУ проходит ежегодная конференция для молодых учёных "Ломоносов"
http://lomonosov-msu.ru/rus/event/6500/
lomonosov-msu.ru
Ломоносов 2020
Международная научная конференция студентов, аспирантов и молодых учёных «Ломоносов-2020» / Москва, Россия, МГУ, 10 - 27 Ноя 2020
#юмор
До сих пор в моей коллекции формул рекорд был у 5-этажной. Справедливости ради, авторы именно так эту теорему не формулировали. А скриншот я сделал отсюда: https://users.cs.duke.edu/~rupert/fair-division-aaai20/Tutorial-Slides.pdf
До сих пор в моей коллекции формул рекорд был у 5-этажной. Справедливости ради, авторы именно так эту теорему не формулировали. А скриншот я сделал отсюда: https://users.cs.duke.edu/~rupert/fair-division-aaai20/Tutorial-Slides.pdf
#вакансия
«Построить realtime персонализирующую систему» - такая задача стоит в этом году перед ds-командой в озоне.
Надо уметь для миллионов клиентов выбирать лучшие товары (а их миллионы), лучшие акции (а их тысячи), лучшие бренды, категории и много чего еще. Надо нагенерить сотни фич, перепробовать разные модели, состыковаться с бизнес-заказчиками и техническими экспертами, которые выкатят это добро в продакшн. Помимо этой задачи есть и другие, например, предсказание CTR или подбор оптимальной скидки для клиента.
Мы ищем сильного лида в группу DS на направление рекомендаций и маркетинга, который готов возглавить команду из 3-5 человек и довести все существующие бизнес-задачи до прода и по пути нагенерить новых.
Стек: PySpark, Airflow, Pytorch, Git, Confluence :)
Локация: Москва-Сити
Зп: 250-350
[email protected] , мессенджеры по номеру +7-909-688-36-48 (Ксюша, руководитель отдела DS)
«Построить realtime персонализирующую систему» - такая задача стоит в этом году перед ds-командой в озоне.
Надо уметь для миллионов клиентов выбирать лучшие товары (а их миллионы), лучшие акции (а их тысячи), лучшие бренды, категории и много чего еще. Надо нагенерить сотни фич, перепробовать разные модели, состыковаться с бизнес-заказчиками и техническими экспертами, которые выкатят это добро в продакшн. Помимо этой задачи есть и другие, например, предсказание CTR или подбор оптимальной скидки для клиента.
Мы ищем сильного лида в группу DS на направление рекомендаций и маркетинга, который готов возглавить команду из 3-5 человек и довести все существующие бизнес-задачи до прода и по пути нагенерить новых.
Стек: PySpark, Airflow, Pytorch, Git, Confluence :)
Локация: Москва-Сити
Зп: 250-350
[email protected] , мессенджеры по номеру +7-909-688-36-48 (Ксюша, руководитель отдела DS)
комментарий к предыдущей вакансии: когда-то я сам работал (причём лет 5, наверное) в группе аналитиков Озона - тогда и сама группа была существенно меньше и задач меньше и офис меньше;) Сейчас я с ребятами по работе никак не связан, но приятно, что осталось ядро старого коллектива, что огромный прогресс в организации работы, самих задачах и компании в целом, и что пришло много новых крутых DS. Думаю, что это одно из самых аппетитных предложений по совокупности разных факторов (если, конечно, Вы не фанат банковского сектора или китайских компаний). В вакансии есть один подвох - нужен Lead DS (т.е. человек с опытом и способный руководить).
#книга
Для начинающих - небольшой обзор matplotlib на русском языке:
https://devpractice.ru/files/books/python/Matplotlib.book.pdf
Для начинающих - небольшой обзор matplotlib на русском языке:
https://devpractice.ru/files/books/python/Matplotlib.book.pdf
#видео
Порекламирую-ка я доклад моего магистра, а то там меньше 200 просмотров. А доклад (и магистр) очень крутой - про обучение с подкреплением (RL), но не про всё, конечно, а про способы RL-обучения в режиме Self-Supervision (вместе с сопутствующими терминами: "без награды", "с виртуальной наградой", "с любопытством" и т.п.)
https://www.youtube.com/watch?v=8zZrciFXJM8
Порекламирую-ка я доклад моего магистра, а то там меньше 200 просмотров. А доклад (и магистр) очень крутой - про обучение с подкреплением (RL), но не про всё, конечно, а про способы RL-обучения в режиме Self-Supervision (вместе с сопутствующими терминами: "без награды", "с виртуальной наградой", "с любопытством" и т.п.)
https://www.youtube.com/watch?v=8zZrciFXJM8
YouTube
RL#1: Exploration in RL
Advanced Topics in Reinforcement Learning
https://deeppavlov.ai/rl_course_2020
Сергей Иванов рассказывает о том, что такое self-supervised режим в обучении с подкреплением и как с его помощью можно мотивировать агента исследовать окружающую среду. В лекции…
https://deeppavlov.ai/rl_course_2020
Сергей Иванов рассказывает о том, что такое self-supervised режим в обучении с подкреплением и как с его помощью можно мотивировать агента исследовать окружающую среду. В лекции…
#железо
О видеокартах для глубокого обучения:
https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/
О видеокартах для глубокого обучения:
https://lambdalabs.com/blog/choosing-a-gpu-for-deep-learning/
#визуализация
Люблю инфографику, особенно полезную, когда на ровном месте можно сделать так, чтобы было красиво и мир стал чуточку удобнее. Вот пример - карта проходных дворов Питера:
https://www.behance.net/gallery/91311791/karta-prohodnyh-dvorov-petrogradki
Люблю инфографику, особенно полезную, когда на ровном месте можно сделать так, чтобы было красиво и мир стал чуточку удобнее. Вот пример - карта проходных дворов Питера:
https://www.behance.net/gallery/91311791/karta-prohodnyh-dvorov-petrogradki
Behance
Карта проходных дворов Петроградки - Stanislav Chiganov
Альтернативные пешеходные тропы
#бизнес
Статья об одной из самых известных компаний, занимающихся ИИ - Open.AI - как принцип открытых научных исследований сменился секретностью и пиаром.
https://vc.ru/future/108206-ot-druzhelyubnogo-ii-k-monetizacii-i-oderzhimosti-imidzhem-pochemu-byvshiy-startap-ilona-maska-openai-predal-svoi-idealy
Статья об одной из самых известных компаний, занимающихся ИИ - Open.AI - как принцип открытых научных исследований сменился секретностью и пиаром.
https://vc.ru/future/108206-ot-druzhelyubnogo-ii-k-monetizacii-i-oderzhimosti-imidzhem-pochemu-byvshiy-startap-ilona-maska-openai-predal-svoi-idealy
vc.ru
От дружелюбного ИИ к монетизации и одержимости имиджем: почему бывший стартап Илона Маска OpenAI предал свои идеалы — Будущее на…
Компания хотела стать первой в создании безопасного искусственного интеллекта и выбрала закрытый и коммерческий путь вместо прозрачности и объединения усилий с другими разработчиками. Своё недоверие проекту высказал Илон Маск.