Small Data Science for Russian Adventurers

#конференции
Есть такой симпатичный ресурс с докладами DS-конференций. Совсем свежих там нет, но всё равно много всего интересного (более 21 тыс. докладов и удобный интерфейс).
https://papertalk.org/

papertalk.org

Papertalk - the platform for scientific paper presentations

Papertalk is an open-source platform where scientists share video presentations about their newest scientific results - and watch, like + discuss them

👍26🔥4👏2

6.25K views14:43

Small Data Science for Russian Adventurers

Сейчас в топ-10 SuperGLUE (https://super.gluebenchmark.com/leaderboard) есть модель DeBERTa (превзошла точность человека). С каким эффектом боролись создатели её 3й версии (термин из статьи)?

Anonymous Quiz

замерзание конечностей

🤔21👍13👎4🤯4😁3

904 voters5.46K views20:44

Small Data Science for Russian Adventurers

#образование
Начался набор на лучшую во Вселенной бесплатную программу обучения в области анализа данных, регистрация по ссылке
https://ozonmasters.ru/submission

В Ozon Masters по-прежнему два направления (Data Science и Business Intelligence) с гибким набором курсов, где часть из них являются обязательными, а другие можно взять по выбору. Информацию об этапах поступления, описание курсов и требования к поступающим смотрите на нашем сайте.

🗓 14 мая (суббота) в 13.00 будет день открытых дверей. Чтобы зарегистрироваться на мероприятие - заполните форму.

Организаторы всегда на связи и рады ответить на любые вопросы - пишите на почту [email protected] или кураторам проекта (их контакты вы можете найти в соответствующем разделе на сайте).

👍36❤10🔥4🤯4🤔2🤮2👏1😁1

7.01K views09:30

Small Data Science for Russian Adventurers

#статьи
Подборка самых популярных статей по банковской тематике за последние 7 лет (указано число ссылок в гугл-академии).

545 ссылок, 2021 год
Dwivedi Y. K. et al. Artificial Intelligence (AI): Multidisciplinary perspectives on emerging challenges, opportunities, and agenda for research, practice and policy //International Journal of Information Management. – 2021. – Т. 57. – С. 101994.

434 ссылки, 2017 год
Xia Y. et al. A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring //Expert Systems with Applications. – 2017. – Т. 78. – С. 225-241.

235 ссылок, 2018 год
Alessi L., Detken C. Identifying excessive credit growth and leverage // Journal of Financial Stability. – 2018. – Т. 35. – С. 215-225.

206 ссылок, 2015 год
Iturriaga F. J. L., Sanz I. P. Bankruptcy visualization and prediction using neural networks: A study of US commercial banks // Expert Systems with applications. – 2015. – Т. 42. – №. 6. – С. 2857-2869.

183 ссылки, 2017 год
Abellán J., Castellano J. G. A comparative study on base classifiers in ensemble methods for credit scoring // Expert systems with applications. – 2017. – Т. 73. – С. 1-10.

153 ссылки, 2019 год
Kou G. et al. Machine learning methods for systemic risk analysis in financial sectors // Technological and Economic Development of Economy. – 2019. – Т. 25. – №. 5. – С. 716-742.

136 ссылок, 2017
Chakraborty C., Joseph A. Machine learning at central banks. – 2017.

👍28

8.28K viewsedited 20:07

Small Data Science for Russian Adventurers

#статьи
Карта центральных работ в области ИИ (какого-то ценного функционала нет, но просто познавательно и забавно):
https://60years.vizhub.ai

🔥12👍1

8.15K views15:06

Small Data Science for Russian Adventurers

#забавно
Давайте в комментах накидаем телеграм-стикеры, связанные в DS/ML/DL? (ну или IT/MATH, если сильно хорошие)

👍30

6.98K views10:06

Small Data Science for Russian Adventurers

#конференция
Дзен-митап: исследования в рекомендательных системах (мероприятие с легендой отечественного ML Евгением Соколовым не может быть неуспешным;)
https://events.yandex.ru/events/dzen-mitap-recsys-research

Дзен-митап: исследования в рекомендательных системах

19 мая приглашаем на первый в этом году офлайн-митап от Дзена.

Сначала рассмотрим алгоритмы матричной факторизации с адаптивным размером векторов, которые позволяют повысить качество ранжирования при меньшем числе параметров, после этого поговорим про то…

🔥9👍8😁3

7.58K views14:24

Small Data Science for Russian Adventurers

#книга
Dirk P. Kroese, Zdravko I. Botev, Thomas Taimre, Radislav Vaisman
Data Science and Machine Learning Mathematical and Statistical Methods

Книга по классическому ML (про нейронки тоже есть, но ничего ценного). Довольно симпатичная и аккуратная, есть интересные теоретические задачи, есть примеры кода. Оформление прям хорошее. Уровень скорее средний, т.к. в некоторых темах копают глубже чем обычно (например, объясняют проекционную матрицу в линейной регрессии). Из минусов - нашёл некоторые неточности в описаниях методов.

👍39

7.07K views13:40

Small Data Science for Russian Adventurers

#интересно
Выложены зарплаты руководителей и их замов учреждений, которые подчинены Минобрнауки (в принципе, их можно и по налоговым декларациям восстановить - они также в свободном доступе). Я сначала написал развёрнутый комментарий - что тут интересного, но потом подумал, что опять кто-то что-то посчитает некорректным, поэтому ограничусь только маленьким замечанием. Когда видите, что, например, ректор ИТМО получает больше 1 млн. в месяц, помните, что в ИТМО много внешних договоров (вместе с МФТИ они лидеры по привлечению этих средств, я давал ссылку выше). А самое интересное тут дисперсии зарплат в рамках отдельных учреждений;)
https://www.minobrnauki.gov.ru/documents/?ELEMENT_ID=51168

Министерство науки и высшего образования Российской Федерации

Документы

Министерство науки и высшего образования Российской Федерации осуществляет функции по выработке и реализации государственной политики и нормативно-правовому регулированию в сфере высшего образования, а также функции по нормативно-правовому регулированию и…

👍22

5.92K views22:17

Small Data Science for Russian Adventurers

#статьи
Сегодня я пытался разобраться, есть ли что-то интересное в российских научных журналах про машинное обучение. Выводы я пока писать не буду, но вот результат одного эксперимента: какая самая цитируемая статья в российском журнале, написанная в последние 3 года и выложенная в открытый доступ, в которой используется бустинг? Оказалось, что «Использование алгоритмов искусственного интеллекта в криминалистическом изучении преступной деятельности (на примере серийных преступлений)» https://www.elibrary.ru/download/elibrary_45719543_43573892.pdf

😢28🔥11👍6👎1

5.52K viewsedited 20:22

Small Data Science for Russian Adventurers

#статьи
А по нейронкам вроде бы самая цитируемая свежая статья в открытом доступе в российском журнале эта - Эффективность алгоритмов машинного обучения и свёрточной нейронной сети для обнаружения патологических изменений на магнитно-резонансных томограммах головного мозга (но тут сложно перебрать все ключевые слова, которые могут быть связаны с глубоким обучением)
https://www.elibrary.ru/download/elibrary_42845903_18431680.pdf

👍10👎2🤮2

5.45K views21:01

Small Data Science for Russian Adventurers

картинка к вопросу ниже

🤔27

5.02K views20:49

Small Data Science for Russian Adventurers

Каким архитектурам трансформеров соответствуют изображённые матрицы внимания?

Anonymous Quiz

23%

Longformer, Star-Transformer, BigBird, ETC

Star-Transformer, Longformer, ETC, BigBird

ETC, Longformer, Star-Transformer, BigBird

BigBird, ETC, Star-Transformer, Longformer

56%

я не понимаю, что от меня хотят

👍6

1.1K voters5.6K views20:52

Small Data Science for Russian Adventurers

#мысли
Понятно, когда в статье много соавторов и их долго перечислять, то выделяют основного и пишут "Хинтон и соавторы". Понятно, когда в разговоре забывается "кто ещё придумал". Но вот в научной статье так пренебрежительно... великий Хинтон и никому неизвестный чувак, имя которого даже не стоит упоминания.

Помню на одной конференции говорили VC-размерность - это размерность Вапника и его коллеги, т.к. "C" сокращение от colleague. А забытый Червоненкис, кстати, был очень скромным человеком:(

😢51👍18

5.85K viewsedited 09:55

Small Data Science for Russian Adventurers

#забавно
На видео несуществующая девушка - она синтезирована с помощью технологий стартапа pantheonlab. Выглядит действительно круто.
https://youtu.be/yGUaqXnaSzk

YouTube

The person in this video is not a real human!

She was created by Pantheon Lab, a Start-up at Hong Kong Science Park.

They have made a lot of progress in the past 2 years to make a very natural face, voice and lipsync using AI.

This will open up so many opportunities to generate AI characters in the…

🔥29👍4

6.17K viewsedited 20:39

Small Data Science for Russian Adventurers

#интересно
Ещё из чудес генеративных моделей, о которых пока не писали в других телеграм-каналах. Вот музыка, сгенерированная с помощью Permutation Invariant Language: https://youtu.be/ikmgqp3V7k8
Интересно, что результат подвергли критике из-за сходства с этой композицией: https://youtu.be/9kSf8w28Fs4
Возможно, просто использовался prompt из последней. Кроме того, отмечают, что на музыку это никак не похоже (хотя как фоновая в фильме слышится вполне неплохо).
Статью можно найти здесь: https://arxiv.org/abs/2205.05448
А код здесь: https://github.com/symphonynet/SymphonyNet

YouTube

SymphonyNet Video Demonstration

Symphony Generation with Permutation Invariant Language Model

👍6

5.46K views10:28

Small Data Science for Russian Adventurers

#задача
Простая задача по ML, которая заставляет людей зависнуть (проверено на нескольких экзаменах).

В задаче бинарной классификации используются следующие функционалы качества, далее идёт список, например, ROC AUC, BA (сбалансированная точность), F-мера (можно продолжать). Вопрос: какие них не зависят от того, какой класс считать позитивным?
Более формально, для каких f всегда f(y,a) = f(1-y, 1-a), где y - вектор целевых значений, a - вектор ответов алгоритма.

Предпосылка задачи понятна: Иван и Джон решают одну и ту же задачу с метками "дефолт"/"не дефолт" одним и тем же методом, у Ивана качество - 0.7, у Джона - 0.6, может ли это объясняться тем, как они представили (закодировали) целевые значения?

👍49

5.63K viewsedited 07:49

Small Data Science for Russian Adventurers

#конференции
Бесплатная летняя школа для выпускников, аспирантов и студентов старших курсов биотехнических специальностей.
https://cbai.endocrincentr.ru/school#reg

👍12🔥1

5.53K views11:03

Small Data Science for Russian Adventurers

#статьи
Подборка статей по рекомендательным системам 2021-22 годов (в основном, обзорные, по новым трендам и гибридным подходам).

TTRS: Tinkoff Transactions Recommender System Benchmark
Начнём с рекламы отечественного: статья от ребят из Тинькова. Представлен новый датасет - доступен по запросу.

Revisiting Popularity and Demographic Biases in Recommender Evaluation and Effectiveness
Как эффективность рекомендаций зависит от таких факторов как пол, возраст.

New Hybrid Techniques for Business Recommender Systems
Применение рекомендательных систем в бизнес-консалтинге.

Popularity Bias in Collaborative Filtering-Based Multimedia Recommender Systems
Проблема популярных товаров: оказывается, что для обучения более ценны пользователи, которые не интересуются популярными товарами и они же стандартными методами получают худшие рекомендации. Эксперименты с Last.fm, MovieLens, BookCrossing, MyAnimeList.

Recency Dropout for Recurrent Recommender Systems
Предлагают технику аугментации, которая позволяет более эффективно использовать RNN в рекомендациях.

Explainability in Music Recommender Systems
Как следует из заголовка - про объяснение музыкальных рекомендаций, но статья больше про проблематику.

Learning Robust Recommender from Noisy Implicit Feedback
Предложена новая техника обучения - получается более робастное решение. Эксперименты на Adressa, Amazon-book, Yelp. Довольно любопытная работа!

A Survey of Deep Reinforcement Learning in Recommender Systems: A Systematic Review and Future Directions
Обзор по обучению с подкреплением в рекомендациях.

Blockchain-based Recommender Systems: Applications, Challenges and Future Opportunities
Вместе сошлись рекомендации и блокчейн;) Но я в этом ничего не понимаю:(

A Comprehensive Overview of Recommender System and Sentiment Analysis
Можно почитать как не очень детальный обзор методов, обозначенных в заголовке. В целом, не очень интересно.

Advances and Challenges in Conversational Recommender Systems: A Survey
Большой обзор по новому тренду - разговорные (диалоговые) рекомендательные системы. Довольно неплохой!

Graph Neural Networks in Recommender Systems: A Survey
Обзор по ещё одному новому тренду - графовые сети в рекомендациях.

Automated Machine Learning for Deep Recommender Systems: A Survey
Небольшой озор по AutoML в рекомендациях, не очень ясный и подробный.

Measuring "Why" in Recommender Systems: a Comprehensive Survey on the Evaluation of Explainable Recommendation
Небольшой, но довольно "прозрачный" обзор по объяснениям в рекомендациях.

Trust your neighbors: A comprehensive survey of neighborhood-based methods for recommender systems
Из названия можно подумать, что статья про методы соседства в рекомендациях, но в ней довольно неплохой обзор и по смежным методам (например, по случайным блужданиям).

A Survey on Accuracy-oriented Neural Recommendation: From Collaborative Filtering to Information-rich Recommendation
Довольно хороший обзор методов рекомендации, почему-то авторы решили выделить методы, которые позволяют получить неплохую точность.

Efficient Mixed Dimension Embeddings for Matrix Factorization
И закончим статьёй, про которую рассказывали на последнем Дзен-митапе - пока проходит проверку на arxive. Как только пройдёт - дам ссылку.

🔥32👍11

7.91K views16:22

Small Data Science for Russian Adventurers

#книга
В книге Edward Raff «Inside Deep Learning, Math, Algorithms, Models» применяется интересный приём. Я и сам иногда формулы раскрашиваю и делаю цветную легенду с пояснениями. Но тут все центральные формулы полностью раскрашены, а в тексте идёт аналогичная подсветка описания, см. рис. В книге вообще очень хорошие рисунки и она довольно продумана для начального уровня, много примеров кода.

👍101🔥15

9.01K viewsedited 17:22

Small Data Science for Russian Adventurers

#конференция
Бесплатные летние образовательные проекты от научно-исследовательского института ИИ: летняя школа и конференция
https://airi.net/ru/summer-school/

airi.net

Лето с AIRI

Ежегодная Школа для молодых ученых — это глубокое погружение в работу с широким спектром современных методов искусственного интеллекта и машинного обучения.

👍13🔥2

5.82K viewsedited 17:25

About

Blog

Apps

Platform