Small Data Science for Russian Adventurers
11.2K subscribers
303 photos
3 videos
13 files
705 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#юмор
Как всё-таки игры напоминают жизнь...
https://www.youtube.com/watch?v=rTK3tYRd3ds
#курс
Курс Леонида Жукова «Анализ данных в бизнесе»
http://www.leonidzhukov.net/hse/2020/datascience/
Forwarded from Food&Science
​​Как математики смотрят на кондитеров?

Как на тетраэдры с лепестковыми диаграммами.

Несколько лет назад в Гарварде решили скачать несколько тысяч рецептов блинов, печений, бисквитов с сайта allrecipes и построить диаграммы.

Представьте себе яйца, молоко, муку: каждый ингредиент на своей оси. Там, где они пересекаются, стоит точка. Каждая точка означает определённые пропорции трёх ингредиентов.

Например, кто-то готовит блины в пропорциях 2:2:1. Но рецептов блинов много, пропорции могут до определённой степени отличаться. А раз пропорции отличаются, то и точки будут в разных местах стоять.

При этом все точки будут ограничены какой-то областью, за рамками которой будет уже не блин, а что-то другое. К примеру, если в пропорции увеличить число яиц, то будет не блин, а омлет.

В Гарварде проанализировали несколько кондитерских изделий и сделали цветные области с точками, расположив их на тетраэдре. Если его собрать, то очень удобно смотреть на рецепты и размышлять о природе брауни или сконов.

Но главное – это пустые места. Вот куда нужно смотреть – это пустоты, которые можно заполнить своим креативом.

Такой дата сайнс можно проводить более точечно: с бисквитами, тестом на пиццу, шоколадными печеньями.

#scientificbreakfast
#статья
Обзор по представлениям в обработке аудио
Deep Representation Learning in Speech Processing:Challenges, Recent Advances, and Future Trends:
https://arxiv.org/abs/2001.00378
#интересно
Не изобретайте алгоритмы, они пригодятся лишь через 18 лет, собирайте данные! ;)
ссылка на источник: https://www.kdnuggets.com/2016/05/datasets-over-algorithms.html
#интересно
Среди студентов сделали опрос по привлекательным работодателям. Надо сказать, что он соответствует моим ощущениям. Например, ВМКашников не затащишь в Газпром (у нас даже какие-то простые проекты не идут, поскольку студенты не хотят слышать о подобных компаниях и их задачах). Удивительна для меня только популярность Intel, раньше я много знал людей оттуда, но сейчас у меня, вроде, ни одного знакомого там не работает.
https://www.rbc.ru/business/16/07/2020/5f0f426a9a794765fcca1154
#забавно
Что привлекательно в анализе данных, можно взять ну прям что-нибудь, например «побратимость городов», формализовать это, например в виде графа, а потом применить стандартные методы анализа, кластеризацию, и сразу вскрывается география стран, отношения между ними и т.п. И вроде никакой существенной информации на входе не использовали...
https://arxiv.org/abs/1301.6900
#забавно
Мир как нейросеть (если честно, я почти ничего не понял из статьи)
https://arxiv.org/pdf/2008.01540.pdf