Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#конференция
Сейчас проходит мероприятие Intersections between Control, Learning and Optimization, которое интересно, в первую очередь, любителям обучения с подкреплением, оптимизации, диффуров и робототехники. Здесь можно посмотреть доклады (часть выложена, остальная - чуть позже, т.к. воркшоп в разгаре):
http://www.ipam.ucla.edu/programs/workshops/intersections-between-control-learning-and-optimization/?tab=schedule
#статья
Небольшое социологическое исследование: молодых людей из нескольких университетов США спрашивали о приоритетах при выборе партнёров. Интересно, что особой разницы в ответах юношей и девушек я не увидел:
https://www.researchgate.net/profile/Mary_Noonan/publication/275010298_Measuring_Mate_Preferences_A_Replication_and_Extension/links/5919a9e64585159b1a4b99c4/Measuring-Mate-Preferences-A-Replication-and-Extension.pdf
#данные
Смитсонианский институт (США) предоставил для свободного доступа почти 3 млн изображений. На самом деле, выложено больше, но примерно столько имеют пометку «свободное использование», есть и 3D-изображения, и платформа для доступа к ним.
https://www.smithsonianmag.com/smithsonian-institution/smithsonian-releases-28-million-images-public-domain-180974263/
#оптимизация
Немного баян, но вдруг не все знают - хороший небольшой обзор по методам оптимизации. Есть приятный бонус - интерактивность графиков сходимости (можно подвигать начальную точку)
http://fa.bianp.net/teaching/2018/COMP-652/
#ПО
Обзор библиотек, которые используют Pytorch, но предоставляют более удобные функции и возможности простого написания и контроля пайплайнов:
https://neptune.ai/blog/model-training-libraries-pytorch-ecosystem
#олимпиада
Олимпиада для студентов выпускных курсов бакалавриата и выпускников по направлению «Прикладная математика и информатика» или смежным специальностям.

https://hse.skoltech.ru
#соревнования
Список хакатонов по DS:

21-22 марта, Хакатон от Яндекс-недвижимости, 500 000 руб
https://yandex.ru/promo/realty/hacktherealty

13-15 марта, Санкт-Петербург, MLHack, 425 000 руб (DS)
http://mlhack.tech/#/

25-28 марта, Санкт-Петербург, StarLine, какие-то призы обещали
https://robofinist.ru/event/info/short/id/339

4-5 апреля, Москва, Agro Hack, за идею (?)
https://agro-code.ru/#about

10-17 марта, онлайн, Cup IT, за идею (?)
https://1.changellenge.com/cup-it?utm
#интересно
Лаборатория Касперского разработала систему электронного голосования на базе блокчейна:
https://polys.me/ru/voting-machines
#CV
Примеры ноутбуков, в которых на Pytorch показаны решения нескольких ключевых задач в CV: классификация, сходство, детектирование и т.п.
https://github.com/microsoft/computervision-recipes
#интересно
В МК написали об «удивительном эксперименте», в котором с помощью анализа сигналов головного мозга установили отличия между мужчинами и женщинами:

https://www.mk.ru/science/2020/03/05/uchenye-nashli-razlichiya-v-zrenii-muzhchin-i-zhenshhin.html

На самом деле, уже давно существует целая область науки, которая этим занимается. Статья в Вики переведена на 9 языков, но не на русский. Может поэтому в наших газетах до сих пор пишут, что наши учёные первые решили проверить всё экспериментально;)

https://en.wikipedia.org/wiki/Neuroscience_of_sex_differences
#визуализации
Пока готовился к лекции по визуализации, нашёл интересный ресурс "Бессмысленные визуализации":
https://viz.wtf/
В моих курсах есть такая игра «что изображено?» Попробуйте догадаться, о чём речь на этой инфографике?
#интересно
Недавно Yoshua Bengio сделал пост про несовершенство системы рецензирования и публикации. Он очень сильно коррелирует с моим мнением: в науке приняты "научные публикации" в рецензируемых журналах (!), журналы дорожат своей репутацией, их рейтинги зависят от ссылок на публикуемые в них статьи, поэтому организуют тщательную экспертизу статей. Каждый журнал имеет редколлегию, которая принимает ключевые решения о публикации и назначает рецензентов. Так происходит везде, кроме DS/ML... здесь всё публикуется на Arxive (что само по себе неплохо, поскольку открыто и доступно) - даже в очень сыром виде, а престижность зависит от конференции, где сделан доклад. При этом мода на конкретные конференции сильно меняется (достаточно сравнить аудитории и доклады конференций 90х, 00х, 10х и настоящего времени), многие сильные группы и компании часто подают слабые статьи и доклады (и их принимают!) и т.д. Ещё печальный момент - возникновение "монополии престижности". Например, сейчас модно DL, которое полностью стёрло интересные и практически важные направления DS (и переформатировало программы многих конференций). Yoshua Bengio, конечно, волнует не столько последнее, сколько уровень публикаций... тем не менее, здорово, что на проблемы стали обращать внимание авторитетные люди.
https://yoshuabengio.org/2020/02/26/time-to-rethink-the-publication-process-in-machine-learning/
#конференции
Из-за коронавируса ICLR-2020 будет проходить в режиме онлайн:
https://iclr.cc/Conferences/2020/virtual
#юмор
Слайд из одного ML-курса...