Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#конференция
Ещё одна бесплатная летняя научная школа «Сложные нейронные сети и когнитивно специализированные нейроны»:
https://brain.scientificideas.org/neuroscience-school-2022/ru
#книга
Посмотрел книжку Эйлин Магнелло «Статистика в комиксах». В целом, мне понравилась - хороший обзор для нематематиков, хотя не могу утверждать, что всё ясно изложено для неспециалистов. Несколько вещей открыл для себя: откуда взялся термин «статистика» и как появилась эта наука, чем были известны некоторые учёные до своих открытий. Не понравились сами картинки… ожидал большего.
#интервью
Интервью с Райгородским о его школе на Физтехе. Думаю, что у абитуриента, который это послушает, не будет вопросов куда поступать;) Андрей Михайлович и рассказывает зажигательно и делает очень много для образования вообще (не только в МФТИ).
https://youtu.be/eouUz_uPcBs
#канал
Добавил в описание канала "РЕКЛАМУ НЕ ПУБЛИКУЮ". Интересно, поможет ли? Слишком много писем "Опубликуйте ...". Например, письмо с предложением за плату опубликовать ссылку на ШАДовский учебник по ML через несколько часов после того, как я бесплатно уже её опубликовал.

Особо не слежу за статистикой канала, но заметил, как число подписчиков перевалило за 6 000 - хотя я его никак не пиарю - ссылку даю только студентам, да и вообще он всегда был ориентирован "на тех, кто со мною знаком". Из забавного - почти сотня отписалась, когда я скинул ссылку с описанием работы в PornHub.

Спасибо всем, кто ставит смайлики - можно проследить за интересами подписчиков. Странно, что не особо заходят объявления о разных научных школах. Если бы я был студентом, то не вылезал бы из них (столько возможностей узнать нового и пообщаться с интересными людьми, плюс подыскать себе что-то типа аспирантуры).
#интересно
Нашёл сегодня такой скатер-плот. Интересно, что тут есть противоречия с моим опытом и интуицией, но не с потолка же его взяли...
#новости
Прошли защиты бакалавров и магистров ММП. Из МГУ выпустилось ещё несколько десятков классных специалистов (что-то мы перестали выкладывать в открытый доступ выпускные работы, поэтому не могу похвастаться, насколько классных). Кстати, кафедре в этом году исполняется 25 лет! Всем выпускникам - удачной карьеры, постоянного саморазвития и реализации всех планов!
#данные
На этом ресурсе в свободном доступе выложено несколько десятков медицинских наборов данных (КТ, МРТ и т.п.):
https://mosmed.ai/datasets/
#новости
Печальная новость… Образовательная программа OzonMasters прекратила своё существование. Очень жаль. На мой взгляд, на старте это был самый удачный проект среди образовательных в DS/ML/BI.

Спасибо всем!
Юрию Дорну и организаторам программы - очень профессиональная работа! Мне никогда не было так комфортно преподавать.
Своим коллегам преподавателям - у нас собрался очень классный коллектив и потрясающая линейка курсов. Очень благодарен, что работал с вами.
Особенно своим семинаристам и лично Артёму Попову - самое лучшее в наших курсах было от вас.
Всем нашим студентам - за то, что выбрали нашу программу! Некоторые выпускники уже делают потрясающую карьеру, некоторые стали активно помогать на курсах программы, что очень ценно. Вы все очень классные! Надеюсь, будете с теплотой вспоминать Озонмастерс и не разрывать связи, особенно, со своими однокурсниками;) «Дружба заканчивается только, если она не была настоящей».
Всем, кто поддерживал OzonMasters! В том числе, коллегам из аналогичных образовательных программ за корректную конкуренцию и тёплое отношение - удачи вам и долгого существования!

«Счастливый конец — это когда вовремя опускаешь занавес. Чтобы закончить в момент наивысшего счастья, потому что потом всё будет опять плохо.» Чак Паланик

П.С. Мы, конечно, прикладываем все усилия, чтобы сохранить накопленный опыт - ищем партнёров и варианты существования.
#математика
Интересный научпоп ресурс, скорее для школьников, по разным разделам математики. Например,в разделе Data - про визуализацию и распределения (иногда попадаются картинки в стиле "Статистика и котики"), а в разделе Puzzles есть трёхмерный тетрис (на рис.)
https://www.mathsisfun.com/
#интересно
ОзонМастерса больше нет, но о некоторых недоделанных проектах можно написать... мало, кто знает, что у ОМ и Юрия Дорна не так давно появился подкаст "Рандомные дрова", и хотя успел выйти всего один выпуск "DS изнутри. Рассказываем как начать, куда расти и чего ожидать на карьерном пути датасаентиста", но он довольно интересный и гости хорошие;)
https://music.yandex.ru/album/22354556?dir=desc&activeTab=about
#конференция
А вот летняя школа от Сбера для преподавателей (не всё же студентам учиться):
https://sbergraduate.ru/digitalsummer/
#забавно
Какая долгая судьба у работы...
Статья Why Random Reshuffling Beats Stochastic Gradient Descent была впервые выложена на Arxiv в 2015 году
https://arxiv.org/abs/1510.08560
В 2019 она выложена на сайте журнала Mathematical Programming (с модификациями)
https://link.springer.com/article/10.1007/s10107-019-01440-w
Официально она опубликована в номере только 2021 года: Mathematical Programming volume 186, pages 49–84 (2021)
А последняя правка на Arxive сделана в этом году.
Статью пишут уже 7 лет;)
#забавно
В комментариях к предыдущему посту я поделился ссылкой, но надо бы её вынести на всеобщее обозрение - там есть любопытные статьи (с самым длинным названием, с самым коротким заголовком, с наибольшим числом ссылок и т.п.) А на картинке - мотивашка - такие статьи тоже бывают;) Кстати, я подобную диссертацию видел, и ничего, человек защитился. А через несколько лет он и подобную докторскую представил, точно не помню, вроде страниц 18 всего.
https://www.researchgate.net/post/Have_you_seen_these_strange_statistics_in_scientific_publications
#мысли
У меня есть приятель, который получил такое же образование как я и даже работает формально DS-ом (точнее научным сотрудником в одном институте, но его отдел решает релевантные задачи), но совершенно не держит руку на пульсе современного машинного обучения. В частности, весь DL прошёл мимо нет - по работе это ему не нужно. Но иногда он всё-таки натыкается на какую-нибудь современную статью. Иногда он мне звонит и консультируется. И в принципе, задаёт вполне логичные вопросы для математика. Например, "слушай, тут написано CrossEntropyLoss, но это же вообще не похоже на перекрёстную энтропию, походу они ошиблись?" Кстати, хороший вопрос для экзамена/собеса, а почему не похоже;) Я тут решил подумать, а есть ли какой-то лёгкий путь "из математики в DS". Обнаружил, что создатели англоязычной Wiki (на русском этого нет) уже позаботились о людях. Например, в статье Cross Entropy есть специальный раздел про применение в машинном обучении (а ведь не так давно не было).
#юмор
Одним из моих старых увлечений были "странные тесты" - когда составляешь тест с виду из вполне корректных вопросов, они реально где-то как-то возникают и задаются, но каждый вопрос очень нестандартный, неожиданный и отпугивающий.

Вот, например, по мотивам этой статьи рождается вопрос: какой из представленный вероятностных симплексов соответствует распределению Дирихле?
#соревнование
Список текущих соревнований по анализу данных и машинному обучению на российских платформах (если что-то забыл - кидайте в комментарии):

Антихакатон от ВкусВилла
задача - увеличение выручки
специфика - на последнем этапе тестирование идей в торговых точках сети
окончание регистрации - 21 июня
старт - 23 июня
приз - 150 000
https://data-hackathon.vkusvill.ru

Всероссийский чемпИИонат по Computer Vision и Big Data
три задачи - предотвращение чс на жд, тенденции новостей, привязка аэроснимков к местности
окончание регистрации - 18 июля
старт - 26 июня
приз - 250 000 за 1 место
https://hacks-ai.ru/championships/758453

Искусственный интеллект в химии (для школьников)
задача - предсказание биологических свойств наночастиц
специфика - есть ещё воркшоп
окончание регистрации - 27 июля
приз - стажировка / поступление в ИТМО
https://scamt.ifmo.ru/datacon/

Machines Can See
задача - верификация моделей автомобилей
окончание регистрации - 24 июня (соревнование уже идёт)
окончание соревнования - 1 июля (осталась всего 1 неделя активной фазы соревнования)
приз - 300 000 за 1 место
https://ods.ai/competitions/mcs_car_verification

Соревнование на данных кредитных историй
задача - предсказание кредитного дефолта
окончание регистрации - можно до конца (соревнование уже идёт)
окончание соревнования - 31 июля
приз - 300 000 за 1 место
https://ods.ai/competitions/dl-fintech-bki
#юмор
На тему соавторства...