Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#забавно
Удивительно, но у меня заработал без VPN https://www.slideshare.net
(я там когда-то любил выкладывать слайды).
Раньше он был заблокирован в РФ... Попытался понять почему разблокировали, оказалось, что
"On August 11, 2020, it was reported that Scribd, Inc. has acquired Slideshare from LinkedIn for an undisclosed amount."
Раньше SS принадлежал Linkedin и оба ресурса блокировались, теперь только Linkedin.
#образование
Хороший курс для начинающих по DL:
“Методы обработки и анализа больших данных”
(читался для МИЭТ). Автор - доктор технических наук Роман Соловьёв, известен на Kaggle под ником ZFTurbo (победами на кегле и на других платформах). Очень приятно читает, все лекции продуманы, примеры из своей практики. Правда, курс маленький и не все темы раскрыты достаточно подробно. Где-то, наверное, есть ещё ноутбуки автора (примеры показанные на лекции очень хорошо написаны).
https://youtube.com/playlist?list=PLMyPRULSXkaWaJrQOWCBw0nVVVydPsPPj
#метод
Из относительно последних интересных вещей в детекции объектов - на нескольких датасетах SOTA получена не с помощью новых методов, а с помощью аугментации. На картинке понятна идея - скопировать и вставить;)
Golnaz Ghiasi et al «Simple Copy-Paste is a Strong Data Augmentation Methodfor Instance Segmentation» // https://arxiv.org/pdf/2012.07177v1.pdf
Forwarded from Boosters.Lenta
ВТБ и «‎Сколково» приглашают вас принять участие в чемпионате по анализу данных.

Вас ждут 2 задачи:
Goodsification — определение категории товара по данным из смоделированных чеков.
Brandefine — извлечение бренда товара из названия продукта.

— Общий призовой фонд 2 000 000 рублей
— Уникальный датасет из 8 000 000 смоделированных чеков
— 2 актуальные задачи для оттачивания своих навыков

Регистрируйтесь: https://data-fusion.ru/

Также чемпионат доступен на Boosters.pro
#статьи
Простой обзор функций активаций, правда очень неполный (например, нет GELU):
https://arxiv.org/pdf/2101.09957v1.pdf
#статьи
Одна из последних статей про функции ошибки:
Nontawat Charoenphakdee "A Symmetric Loss Perspective of Reliable Machine Learning" // https://arxiv.org/pdf/2101.01366v1.pdf
#интересно
8 базовых эмоций // Plutchik (1980)
#статья
Ещё на тему функций ошибки. Интересное обобщение нескольких известных функций - alpha-loss:
https://arxiv.org/pdf/1906.02314v5.pdf
#книга
Очень понравилась книга: хорошо продумана, понятная подача материала, все рисунки сделаны специально для книги. Редко встретишь такой качественный продукт. Освещены некоторые тонкие моменты в архитектурах сетей. Должна быть полезна тем, кто начинает изучать DL, хотя мне сложно оценить, насколько там понятно для новичков. Из минусов: все примеры на Keras-е, покрыта только тема с изображениями (ну как и следует из названия).
#интересно
Немного устаревшая схема, но всё равно полезная.
#образование
На ВМК открылась специальная программа по ИИ. Суть: рассчитана на студентов факультета, сейчас целевая аудитория - второкурсники. Программа состоит из набора курсов по самым актуальным темам ИИ. Первый курс - обзорный по всему ИИ (материалы будут коррелировать со Стэнфордским аналогом). Остальные курсы пока разрабатываются - большинство будет предлагаться в виде дополнительных спецкурсов, несколько самых важных сделают обязательными для всех ВМКашников. Участники программы в конце обучения получают отдельный сертификат.
https://cs.msu.ru/ai
#вопрос
Задачка с собеседований... При стандартном умножении двух комплексных чисел надо выполнить 4 умножения и 3 сложения вещественных чисел. Предложите способ вычисления умножения комплексных чисел, требующий меньшего числа умножений вещественных частей.
#код
Какой потрясающий ресурс! Здесь примеры кода на Pytorch с разъяснением как по базовым конструкциям, так и по современным сетям.
https://nn.labml.ai/
#статья
На рис. кто откуда хантит профессоров. Из статьи Michael Gofman et al. Artificial Intelligence, Education, and Entrepreneurship // http://gofman.info/AI/AI_GofmanJin.pdf
#интересно
Где и как применяется распознавание лиц:
https://www.visualcapitalist.com/facial-recognition-world-map/