Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#визуализации
Пока готовился к лекции по визуализации, нашёл интересный ресурс "Бессмысленные визуализации":
https://viz.wtf/
В моих курсах есть такая игра «что изображено?» Попробуйте догадаться, о чём речь на этой инфографике?
#интересно
Недавно Yoshua Bengio сделал пост про несовершенство системы рецензирования и публикации. Он очень сильно коррелирует с моим мнением: в науке приняты "научные публикации" в рецензируемых журналах (!), журналы дорожат своей репутацией, их рейтинги зависят от ссылок на публикуемые в них статьи, поэтому организуют тщательную экспертизу статей. Каждый журнал имеет редколлегию, которая принимает ключевые решения о публикации и назначает рецензентов. Так происходит везде, кроме DS/ML... здесь всё публикуется на Arxive (что само по себе неплохо, поскольку открыто и доступно) - даже в очень сыром виде, а престижность зависит от конференции, где сделан доклад. При этом мода на конкретные конференции сильно меняется (достаточно сравнить аудитории и доклады конференций 90х, 00х, 10х и настоящего времени), многие сильные группы и компании часто подают слабые статьи и доклады (и их принимают!) и т.д. Ещё печальный момент - возникновение "монополии престижности". Например, сейчас модно DL, которое полностью стёрло интересные и практически важные направления DS (и переформатировало программы многих конференций). Yoshua Bengio, конечно, волнует не столько последнее, сколько уровень публикаций... тем не менее, здорово, что на проблемы стали обращать внимание авторитетные люди.
https://yoshuabengio.org/2020/02/26/time-to-rethink-the-publication-process-in-machine-learning/
#конференции
Из-за коронавируса ICLR-2020 будет проходить в режиме онлайн:
https://iclr.cc/Conferences/2020/virtual
#юмор
Слайд из одного ML-курса...
Для специалистов по CV. Что показано на рисунке?
Anonymous Quiz
15%
Selective search
3%
Beam search
4%
Genetic search
35%
Semantic segmentation
24%
Object detection
20%
Instance segmentation
Для знатоков архитектур нейросетей: что это?
Anonymous Quiz
12%
Кофе
21%
Бисквит
21%
Наполеон
31%
Тирамису
11%
Чизкейк
4%
Карамель
#курсы
Из занятных курсов для начинающих, которые "не на слуху", можно отметить курс Стивена Скиены (да, у этого легендарного алгоритмиста есть курс и по DS). Из минусов - плохая ML-часть (последние лекции совсем примитивные), из плюсов - часть про визуализацию (кстати, там хорошая корреляция с моим курсом).
https://www3.cs.stonybrook.edu/~skiena/519/
#TeX
Забавная штука - когда-то мне это было нужно. Рисуешь математический символ, он распознаётся и подсказывается LaTeX-команда. Только, если честно, я ожидал, что можно рисовать целую формулу.
http://detexify.kirelabs.org/classify.html
#курсы
Ещё про нераскрученные курсы... У всем известного Эндрю Ына был научный руководитель - Майкл Джордан. Свои первые курсы Эндрю во многом скопировал у учителя (это на мой субъективный взгляд). Сейчас курсы Эндрю всемирно известны, а про первоисточник многие забыли... Можно посмотреть - CS 281A / Stat 241A Statistical Learning Theory (Fall 2002). Курс старый, но большинство тем не потеряли актуальности.
https://people.eecs.berkeley.edu/~jordan/courses/281A-fall02/