Small Data Science for Russian Adventurers

#реклама
Science Сlub от Machine Intelligence Laboratory Team (МФТИ) приглашает студентов поработать над задачами машинного обучения с топовыми научными руководителями.

Science Club – это объединение студентов, которые стремятся к научной карьере, и опытных менторов-исследователей в области Data Science. Вместе они проводят исследования, пишут статьи и выступают на конференциях.

Приглашаем студентов поработать над задачами машинного обучения с топовыми научными руководителями, такими как Михаил Бурцев, Юрий Куратов и Алексей Гончаров.

Участие бесплатное.

Выбери себе ментора и подай заявку: https://bit.ly/3gbPFxR

2.9K views18:40

#код
AutoML от Сбербанка в открытом доступе:
https://github.com/sberbank-ai-lab/LightAutoML

GitHub

GitHub - sberbank-ai-lab/LightAutoML: LAMA - automatic model creation framework

LAMA - automatic model creation framework. Contribute to sberbank-ai-lab/LightAutoML development by creating an account on GitHub.

3.4K views20:47

Small Data Science for Russian Adventurers

#визуализация
В одном из моих курсов есть игра "Что это за данные?" - в которой нужно догадаться, что изображено на визуализации. Вот, например, что изображено здесь? Ответы - в комментарии.

2.6K views11:15

Small Data Science for Russian Adventurers

#метод
Многие коллеги хвалили т.н. синтетический случайный лес, сегодня был повод в нём разобраться, поскольку готовил соответствующую лекцию. Оказалось, что термином Synthetic RF называется стекинг над случайными лесами, построенными с разными значениями параметра nodesize... Я всегда делал стекинг над RF с разными глубинами деревьев, наверняка это тоже как-то называется;)
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4279689/

PubMed Central (PMC)

Synthetic learning machines

Using a collection of different terminal nodesize constructed random forests, each generating a synthetic feature, a synthetic random forest is defined as a kind of hyperforest, calculated using the new input synthetic features, along with the original ...

2.7K views14:59

Small Data Science for Russian Adventurers

#метод
С помощью SVM можно решать задачи классификации, регрессии и поиска аномалий. Реализации всех этих алгоритмов есть, например, в scikit-learn. А вот чего нет, так это SVM-кластеризации, хотя такая существует...
* http://hanj.cs.illinois.edu/pdf/aistat13_qgu.pdf
* https://www.jmlr.org/papers/volume2/horn01a/horn01a.pdf
* https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-8-S7-S18

3.0K viewsedited 17:30

Small Data Science for Russian Adventurers

#образование
В МГУ открыта новая магистерская программа «Анализ данных в экономике» (на базе экономфака и ВМК).
https://cs.msu.ru/news/3417
Подробности можно также узнать из записи дня открытых дверей эконома:
https://www.youtube.com/watch?v=wMGn6XdMDVA
На всякий случай, я к этой программе отношения не имею.

YouTube

Виртуальный День открытых дверей для абитуриентов магистратуры экономического факультета 21.11.20

21 ноября 2020 года ЭФ МГУ провел День открытых дверей для абитуриентов магистратуры в формате онлайн-встреч с представителями управляющих советов магистерских программ.

Таймкоды:
0:00 Заставка
15:57 Начало трансляции, приветствие ведущей
17:04 Обращение…

2.7K views13:27

Small Data Science for Russian Adventurers

2.5K views20:50

Small Data Science for Russian Adventurers

Одна из научных статей начинается с истории про двух боксёров - Габриэля и Даниэля - о чём эта статья?

Anonymous Quiz

обучение с подкреплением

исследование / использование

763 voters2.6K views20:53

Small Data Science for Russian Adventurers

#метод
Если Вы захотите запихнуть в Трансформер что-то более экзотическое, чем последовательность, то потребуется придумать подходящий Positional Encoding (который бы ещё и структуру учитывал). Что-то мало статей на этот счёт, например, как лучше кодировать позицию, если подаём 2 связных текста (например, текст и его перевод). Из забавных работ по PE в нестандартных ситуациях нашёл эту - Novel positional encodings to enable tree-based transformers - скармливаем трансформеру дерево!
https://papers.nips.cc/paper/2019/file/6e0917469214d8fbd8c517dcdc6b8dcf-Paper.pdf

2.8K viewsedited 10:23

Small Data Science for Russian Adventurers

#реклама
13 декабря школа дизайна @bangbangeducation и проект Леkторuй проведут онлайн-фестиваль Человек: дизайн, технологии, наука, чувство.

Как мы существуем в онлайн-пространстве сегодня? Как презентовать себя в виртуальной реальности и как она способна изменить нашу идентичность? Какую роль в современных коммуникациях играют виртуальные артисты и блогеры? Как технологический прогресс влияет на наше ментальное здоровье? На эти и другие вопросы в рамках фестиваля вопросы ответят представители дизайн-индустрии, науки и искусства.

Вопросы спикерам можно будет задать в чате комьюнити Bang Bang Education Дизайн начинается с ⚫️.

Фестиваль бесплатный.

Расписание и регистрация

2.6K views10:12

Small Data Science for Russian Adventurers

2.7K views15:38

Small Data Science for Russian Adventurers

В некотором научном сообществе на крупных конференциях вручается приз - эта статуэтка - за то, что докладчик первым среди участников упомянит это...

Anonymous Quiz

название своего доклада

20%

первую статью про GAN

25%

слово "F**K"

823 voters2.8K views15:42

Small Data Science for Russian Adventurers

#реклама
👾❗️Уже в эту субботу в 12:00 (МСК) стартует чемпионат для Data Science Alfa Battle 2.0. Для того, чтобы погрузить участников в нюансы задач и рассказать, что интересного для дата сайентистов происходит в Альфа-Групп в формате стрима пройдет брифинг-конференция: “ОТ МОДЕЛИ К ПРОДУКТАМ” с экспертами из Альфа-Банка, X5 RG, Билайн и АльфаСтрахования.

Коротко о программе:
◾️Ошибки в А/В тестах — как не быть уволенным
◾️Кейс Action Recognition: как мы сделали +15% к Accuracy
◾️Кейс голосовых сервисов: робот Даша
◾️Редизайн Альфа-Мобайл — что изменилось?
◾️Дискуссионная панель “Будущее Data Science в Альфа-Групп”

Открывает конференцию — Владимир Верхошинский, главный управляющий директор Альфа-Банка, член Наблюдательного совета «Альфа-Групп».

😉 Участвуйте в эпической битве зимы за 1 000 000 рублей!

Подключайтесь и задавайте вопросы по задачам в прямом эфире.

Подробности и регистрация: https://link.alfabattle.ru/U5TXI

alfabattle.ru

Alfa Battle

3.5K views17:25

Small Data Science for Russian Adventurers

#конференции
семинар-школа для молодых ученых «Гены. Мозг. Поведение»:
https://rogaevlab.ru/gbb2020/

rogaevlab.ru

Лаборатория эволюционной геномики

Лаборатория эволюционной геномики ИОГен РАН

3.0K views21:54

Small Data Science for Russian Adventurers

#блог
Не знал, что у Владимира Игловикова есть блог:
https://ternaus.blog

Ternaus Blog

Free format blog of Vladimir Iglovikov

2.8K views21:10

Small Data Science for Russian Adventurers

#забавно
и залипательная гифка на ночь;)
https://mingyuliutw.github.io/gifs/pointflow.gif

3.2K viewsedited 21:19

Small Data Science for Russian Adventurers

В StyleGAN2 применяли т.н. "Lazy regularization", что это такое?

Anonymous Quiz

11%

регуляризация только в генераторе

11%

регуляризация только в дискриминаторе

17%

регуляризация попеременно только в генераторе или дискриминаторе

49%

регуляризация только в каждом k-м батче

13%

регуляризацию делает отдельная меленькая сеть "Lazy network"

425 voters2.9K views12:33

Small Data Science for Russian Adventurers

#обзор
Для тех, кто в чатике интересовался обзорами по Ганам. В принципе, их много хороших. Но для провокационности контента канала, скажу -
Посмотрите на Хуи Джонатана:
https://jonathan-hui.medium.com/gan-gan-series-2d279f906e7b

Medium

GAN — GAN Series (from the beginning to the end)

A full listing of our articles covers the applications of GAN, the issues, and the solutions.

2.9K viewsedited 14:33

Small Data Science for Russian Adventurers

#забавно
Ох уж эти переводы, "ПОЕЗД" - это train;)

2.6K views15:47

Small Data Science for Russian Adventurers

#обзор
Поискал какое-нибудь свежее независимое и более-менее приличное сравнение разных реализация градиентного бустинга. Нашёл только за 2019 год...
Выгоднее смотрится CatBoost, но автор контактировал с его создателями, как показывает практика, это действительно улучшает качество в экспериментах (имеется в виду, что создатели подсказывают, что в данном случае надо ещё подкрутить). Жалко, что у xgb и lgb нет такой помощи онлайн (у catboost-a есть, кстати, свой телеграм-канал).
https://medium.com/riskified-technology/xgboost-lightgbm-or-catboost-which-boosting-algorithm-should-i-use-e7fda7bb36bc

Medium

XGBoost, LightGBM or CatBoost — which boosting algorithm should I use?

Gradient boosted trees have become the go-to algorithms when it comes to training on tabular data. Over the past couple of years, we’ve…

2.9K views16:08

Small Data Science for Russian Adventurers

Forwarded from Chat Small Data Science for Russian Adventurers

Какой бустинг Вы считаете лучшим?

Anonymous Poll