Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#обзор
Тренды на ближайшие годы... лучше не будет;) Полный обзор по ссылке:
https://www.dni.gov/files/ODNI/documents/assessments/GlobalTrends_2040.pdf
#визуализация
Очень нравится, когда оригинально и наглядно подают материал, даже если это лишено особого смысла. Например, такие вещи очень нравятся. Взято отсюда:
https://m.vk.com/wall-37160097_447822
#книги
Не очень понравилась книга «Mathematical Problems in Data Science». Темы интересные: топологический анализ данных, методы Монте-Карло в ML и т.п. Но главы писали разные люди, стиль не выдержан, и каких-то ценных знаний книга не даёт.
#конференция
Научная школа по алгоритмам, комбинаторике и сложности (конец мая, язык - английский, информацию взял с FB Юрия Дорна).
https://indico.eimi.ru/event/199/
#конференция
Митап про сбор данных в широком смысле.
22 апреля (18-30 MSK) будут следующие доклады:

1. "Еще одна архитектура системы мониторинга цен и место библиотеки ferret в ней"
2. "Кейс от mail.ru. Россети. Контроль качества данных"
3. "Автоматические регистрации на веб-порталах"
4. "Сбор данных с сейсмографов"
5. "Сбор данных о бумажных книгах"
6. "Парсинг через Tor: Как скачать 1.5 млн патентов за 2 недели, а не за 40 лет"

Вся информация в https://yangx.top/parsing_conf
#интересно
Отношение Рэлея много где встречается, даже в матфизике. Никогда не задумывался об её геометрическом смысле, а если в качестве матрицы выбрать гессиан, то всё просто...
Рис. из слайдов.
#история
Начинаю новую тему постов - истории из мира DS/MATH и т.п.
Есть такой мем как karpathy constant, он пошёл из приведённого твита уже далёкого 2016 года, который был шуткой. Самое интересное, что такой темп обучения часто действительно хорош.
Анонимный опрос о среднем месячном доходе (не зарплате) DS-специалиста (в тыс. руб)
Anonymous Poll
44%
Я не из мира DS (или пока не работаю)
2%
Меньше 50
7%
50 - 100
11%
100 - 150
11%
150 - 200
8%
200 - 250
6%
250 - 300
4%
300 - 400
2%
400 - 500
3%
Больше 500
#книги
Сборник полезных ресурсов для фанатов R:
https://www.bigbookofr.com
#идея
Есть предложение сделать более широкий опрос (аналогично зарплатному выше) в гугл-форме (но всё равно анонимный), в котором можно будет проанализировать ещё должности, опыт, страну и т.п. Но понятно, он должен быть не очень большой (иначе не будут проходить) и не персональный (иначе не будут заполнять). В комментариях пишите - какие вопросы следует в него включить...
Forwarded from Alex Ryzhkov
Коллеги, всем привет!
❗️Рады поделиться новостью: мы в Sber AI Lab запускаем практический курс 🎓 LightAutoML - фреймворк для автоматического построения моделей машинного обучения.

Фреймворк полностью открытый, так как opensource, работает пока на табличных данных, однако на этот год у нас достаточно плотный roadmap. Курс будут читать авторы и разработчики фреймворка - маcтера и градмастер Kaggle🥇🥇🎖. В конце всех лекций вас ждут лайфхаки и байки лучших практик Kaggle и анонс inclass-соревнования для слушателей курса🎁!

Фреймворк позволяет за короткий промежуток времени построить автоматически пайплайн модели, работающий на уровне топ-10% DS 🎰. Пока машина строит пайплайны за вас 🤖, можно продолжать работать осмысленно 🛀 над построением новых фичей, основанных на бизнес-знаниях, и получать результаты выше.

Курс состоит из 9 вебинаров 🧑‍💻, будет проходить еженедельно по средам с 28 апреля в 19.00 по Мск. Регистрация по ссылке

P.S. Много полезного по фреймворку есть на Github. Будем рады звездочкам ⭐️ и ждем всех на курсе.
Forwarded from Sberloga (Alexander C)
🚀 "SBERLOGA" представляет необычнейший доклад - дата сайнс (NLP, граф-мл) и философия - присоединяйтесь.
👨‍🔬 Антон Костин (МФТИ) "Философия на графах"
⌚️ Вторник 27 апреля, 19.00 по Москве

Разберем блокнот с кодом построения графа поверх текстовых эмбеддингов (fasttext).
На примере Louvain посмотрим, как алгоритмы модульности находят философские школы.
В задаче Link Prediction подумаем над неочевидными связями между разными школами и философами.
А также обсудим, будут ли студенты ВУЗов делать домашку по философии с использованием NLP
и дискретной математики (спойлер: на Физтехе уже начали)? Рассказывает преподаватель философии.

Ноутбуки и данные доступы на каггле:
https://www.kaggle.com/visualcomments/philosophy-ru-large
Ваши апвоут, конечно, приветствуются.

Ссылка на зум будет доступна через чат тг чат https://yangx.top/kg_course ближе к началу доклада.
#код
Библиотека для активного обучения (пока не пробовал, да и задач таких сейчас у меня нет, но выглядит симпатично, самые известные подходы реализованы, заявлена совместимость с другими библиотеками)
modal-python.readthedocs.io
#видео
Здесь есть видео курса «Основы нейронауки» Института высшей нервной деятельности и нейрофизиологии РАН. Я сам пока не смотрел, но выглядит любопытно.
https://www.youtube.com/channel/UC_chHsPHVi8xwdVYgSwtgAA/videos
Forwarded from Chat Small Data Science for Russian Adventurers
картинка к следующему опросу
Forwarded from Chat Small Data Science for Russian Adventurers
Какой метод иллюстрирует картинка
Anonymous Quiz
5%
SVD
7%
PCA
15%
kernel PCA
29%
LLE
11%
SNE
33%
t-SNE