Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#забавно
На рисунке изображён не просто какой-то человек, а Бёр Сеттлс (Burr Settles) - автор одной из лучших (но уже немного старой) книг по активному обучению.
#длясправки
Есть Semi-supervised Learning - довольно известный вид обучения, когда дана выборка, часть которой имеет метки (поэтому можно сказать, что это "промежуточная" задача между Supervised Learning и Unsupervised Learning). Но есть ещё Semi-Unsupervised Learning - и мало кто знает, что это за зверь. На самом деле, этот термин разные исследователи пытались ввести по-разному. Мне понравилась такая формализация - обучение по неразмеченной выборке, для которой есть некоторая дополнительная информация о разметке (например, такие-то объекты имеют одинаковые метки, всего 3 класса, пропорции классов 3:2:1).
картинка к вопросу
Как называется приведённый классический метод из категории Semi-Supervised Learning?
Anonymous Quiz
13%
bi-Training
31%
Co-Training
23%
Self-Training
8%
Propagating
9%
Transductive SVM
17%
нет правильного варианта
#книги
Симпатично оформлена и интересно написана. Для профессионалов она бесполезна, и уж точно там нет каких-то практических советов и приёмов. Но вот для менеджеров или людей из смежных специальностей, которые хотят больше узнать о DS, самое то. Тут о том, чем информация отличается от данных, о чём надо спросить у заказчика DS-проекта, что такое «утечка данных», какие есть подводные камни в реальных проектах и т.п.
#жзл
Интересный факт из жизни Рональда Фишера, которого статистики знают по тесту Фишера, аналитики по ирисам Фишера, а биологи по принципу Фишера. Оказывается, он считал, что курение не приводит к раку лёгких, а во всех исследованиях путают «следствие» и «сопутствие». Например, если мы видим, что среди больных больший процент курящих, то это может быть потому, что они были генетически предрасположены к болезни и в курении нашли облегчение её начальных симптомов. Кстати, вроде он был первый, кто заговорил о генетической предрасположенности к курению. Как нетрудно догадаться, учёный был заядлый курильщик. Умер от рака, но не лёгких.
#опрос
Обещанный опрос про работу в DS и зарплаты (для тех, кто уже работает). Прохождение не должно занять много времени. Чем больше человек пройдёт, тем адекватнее будут результаты. Потом будут выложены агрегаты (деанонимизация будет невозможно, хотя и так вопросы подбирались, чтобы её максимально затруднить).
https://docs.google.com/forms/d/e/1FAIpQLSe_GOFCltIjDfNs6TqnxKzlh_lMSV0vy_HD0-mXFFuqWqkl1w/viewform
Памятка_по_написанию_ВКР_и_диссертаций.pdf
637.5 KB
#образование
Недавно написал памятку для студентов, чтобы минимизировать замечания по пунктуации, оформлению формул, использованию терминов и т.п. Может, кому-то будет полезно. Некоторые советы актуальны в учебных заведениях с большой бюрократией, но некоторые универсальны и годятся при написании статей.
#обмен_опытом
Предлагаю ввести новую рубрику для выходных, не связанную с основными темами канала. Задаётся тема и каждый может что-то набросить. Тема этих выходных - смешные книги. Какую самую смешную и позитивную книгу Вы читали? Дайте название и краткий комментарий, что в ней весёлого.
#полезно
Классные материалы по написанию научных статей, подготовке ревью (это основная тема мероприятия), учёту замечаний рецензентов и принятию решений к публикации. Есть видео-записи докладов по данным темам.
https://sites.google.com/view/making-reviews-great-again/
#юмор
По поводу шуток в научных статьях... я сейчас нашёл такую (автор - Linderholm). Вроде как почти на грани:)