Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#конференции
Открыта регистрация на научную летнюю школу ssopt.org
Основной фокус: оптимизация
В этом году в основном будет про многоруких бандитов и опты (непрерывные и комбинаторные), но список спикеров еще не полный
Школа пройдет в подмосковном "Вороново" с 10 по 17 июня
Проживание, питание и т.д. включено
#книги
Посмотрел книгу «Learning theory from first principles». Для тех, кто любит математику в ML, по сути, это обзор теоретических результатов, приводятся теоремы с доказательствами. Из любопытного - у многих известных теорем указаны другие авторы - надо проверить, названия некоторых теорем тоже отличаются, например от википидийных. Из минусов - для практиков книга не очень полезная.
https://www.di.ens.fr/~fbach/ltfp_book.pdf
#новости
О лауреатах премии Абеля. Меня привлёк в первую очередь автор статьи - Разборов - крутой математик, о котором что-то в последнее время не было слышно:
https://trv-science.ru/2021/03/pervoproxodcy-teoreticheskoj-informatiki/
#забавно
Многие используют ирисы Фишера, но вот самого Фишера не многие...
(картинка их Хасти, Тибширани и Фридмана)
#обзор
Тренды на ближайшие годы... лучше не будет;) Полный обзор по ссылке:
https://www.dni.gov/files/ODNI/documents/assessments/GlobalTrends_2040.pdf
#визуализация
Очень нравится, когда оригинально и наглядно подают материал, даже если это лишено особого смысла. Например, такие вещи очень нравятся. Взято отсюда:
https://m.vk.com/wall-37160097_447822
#книги
Не очень понравилась книга «Mathematical Problems in Data Science». Темы интересные: топологический анализ данных, методы Монте-Карло в ML и т.п. Но главы писали разные люди, стиль не выдержан, и каких-то ценных знаний книга не даёт.
#конференция
Научная школа по алгоритмам, комбинаторике и сложности (конец мая, язык - английский, информацию взял с FB Юрия Дорна).
https://indico.eimi.ru/event/199/
#конференция
Митап про сбор данных в широком смысле.
22 апреля (18-30 MSK) будут следующие доклады:

1. "Еще одна архитектура системы мониторинга цен и место библиотеки ferret в ней"
2. "Кейс от mail.ru. Россети. Контроль качества данных"
3. "Автоматические регистрации на веб-порталах"
4. "Сбор данных с сейсмографов"
5. "Сбор данных о бумажных книгах"
6. "Парсинг через Tor: Как скачать 1.5 млн патентов за 2 недели, а не за 40 лет"

Вся информация в https://yangx.top/parsing_conf
#интересно
Отношение Рэлея много где встречается, даже в матфизике. Никогда не задумывался об её геометрическом смысле, а если в качестве матрицы выбрать гессиан, то всё просто...
Рис. из слайдов.
#история
Начинаю новую тему постов - истории из мира DS/MATH и т.п.
Есть такой мем как karpathy constant, он пошёл из приведённого твита уже далёкого 2016 года, который был шуткой. Самое интересное, что такой темп обучения часто действительно хорош.
Анонимный опрос о среднем месячном доходе (не зарплате) DS-специалиста (в тыс. руб)
Anonymous Poll
44%
Я не из мира DS (или пока не работаю)
2%
Меньше 50
7%
50 - 100
11%
100 - 150
11%
150 - 200
8%
200 - 250
6%
250 - 300
4%
300 - 400
2%
400 - 500
3%
Больше 500
#книги
Сборник полезных ресурсов для фанатов R:
https://www.bigbookofr.com
#идея
Есть предложение сделать более широкий опрос (аналогично зарплатному выше) в гугл-форме (но всё равно анонимный), в котором можно будет проанализировать ещё должности, опыт, страну и т.п. Но понятно, он должен быть не очень большой (иначе не будут проходить) и не персональный (иначе не будут заполнять). В комментариях пишите - какие вопросы следует в него включить...
Forwarded from Alex Ryzhkov
Коллеги, всем привет!
❗️Рады поделиться новостью: мы в Sber AI Lab запускаем практический курс 🎓 LightAutoML - фреймворк для автоматического построения моделей машинного обучения.

Фреймворк полностью открытый, так как opensource, работает пока на табличных данных, однако на этот год у нас достаточно плотный roadmap. Курс будут читать авторы и разработчики фреймворка - маcтера и градмастер Kaggle🥇🥇🎖. В конце всех лекций вас ждут лайфхаки и байки лучших практик Kaggle и анонс inclass-соревнования для слушателей курса🎁!

Фреймворк позволяет за короткий промежуток времени построить автоматически пайплайн модели, работающий на уровне топ-10% DS 🎰. Пока машина строит пайплайны за вас 🤖, можно продолжать работать осмысленно 🛀 над построением новых фичей, основанных на бизнес-знаниях, и получать результаты выше.

Курс состоит из 9 вебинаров 🧑‍💻, будет проходить еженедельно по средам с 28 апреля в 19.00 по Мск. Регистрация по ссылке

P.S. Много полезного по фреймворку есть на Github. Будем рады звездочкам ⭐️ и ждем всех на курсе.