#интересно
Построение эго-графа по Гугл-запросу вида « ... vs ... »... это же просто и гениально:
https://medium.com/applied-data-science/the-google-vs-trick-618c8fd5359f
Построение эго-графа по Гугл-запросу вида « ... vs ... »... это же просто и гениально:
https://medium.com/applied-data-science/the-google-vs-trick-618c8fd5359f
Medium
The Google ‘vs’ Trick
How ego graphs can help you learn about AI, play chess, eat healthier, buy a dog and find love.
#забавно
Один из классических датасетов изображений был удалён MIT, более того, всех призвали удалить его копии, поскольку там есть что-то околорасистское...
https://venturebeat.com/2020/07/01/mit-takes-down-80-million-tiny-images-data-set-due-to-racist-and-offensive-content/
Один из классических датасетов изображений был удалён MIT, более того, всех призвали удалить его копии, поскольку там есть что-то околорасистское...
https://venturebeat.com/2020/07/01/mit-takes-down-80-million-tiny-images-data-set-due-to-racist-and-offensive-content/
VentureBeat
MIT takes down 80 Million Tiny Images data set due to racist and offensive content
The 80 Million Tiny Images data set was taken offline following an audit that found images labelled with racist, sexist, or otherwise offensive words.
Forwarded from Food&Science
Как математики смотрят на кондитеров?
Как на тетраэдры с лепестковыми диаграммами.
Несколько лет назад в Гарварде решили скачать несколько тысяч рецептов блинов, печений, бисквитов с сайта allrecipes и построить диаграммы.
Представьте себе яйца, молоко, муку: каждый ингредиент на своей оси. Там, где они пересекаются, стоит точка. Каждая точка означает определённые пропорции трёх ингредиентов.
Например, кто-то готовит блины в пропорциях 2:2:1. Но рецептов блинов много, пропорции могут до определённой степени отличаться. А раз пропорции отличаются, то и точки будут в разных местах стоять.
При этом все точки будут ограничены какой-то областью, за рамками которой будет уже не блин, а что-то другое. К примеру, если в пропорции увеличить число яиц, то будет не блин, а омлет.
В Гарварде проанализировали несколько кондитерских изделий и сделали цветные области с точками, расположив их на тетраэдре. Если его собрать, то очень удобно смотреть на рецепты и размышлять о природе брауни или сконов.
Но главное – это пустые места. Вот куда нужно смотреть – это пустоты, которые можно заполнить своим креативом.
Такой дата сайнс можно проводить более точечно: с бисквитами, тестом на пиццу, шоколадными печеньями.
#scientificbreakfast
Как на тетраэдры с лепестковыми диаграммами.
Несколько лет назад в Гарварде решили скачать несколько тысяч рецептов блинов, печений, бисквитов с сайта allrecipes и построить диаграммы.
Представьте себе яйца, молоко, муку: каждый ингредиент на своей оси. Там, где они пересекаются, стоит точка. Каждая точка означает определённые пропорции трёх ингредиентов.
Например, кто-то готовит блины в пропорциях 2:2:1. Но рецептов блинов много, пропорции могут до определённой степени отличаться. А раз пропорции отличаются, то и точки будут в разных местах стоять.
При этом все точки будут ограничены какой-то областью, за рамками которой будет уже не блин, а что-то другое. К примеру, если в пропорции увеличить число яиц, то будет не блин, а омлет.
В Гарварде проанализировали несколько кондитерских изделий и сделали цветные области с точками, расположив их на тетраэдре. Если его собрать, то очень удобно смотреть на рецепты и размышлять о природе брауни или сконов.
Но главное – это пустые места. Вот куда нужно смотреть – это пустоты, которые можно заполнить своим креативом.
Такой дата сайнс можно проводить более точечно: с бисквитами, тестом на пиццу, шоколадными печеньями.
#scientificbreakfast
#статья
Обзор по представлениям в обработке аудио
Deep Representation Learning in Speech Processing:Challenges, Recent Advances, and Future Trends:
https://arxiv.org/abs/2001.00378
Обзор по представлениям в обработке аудио
Deep Representation Learning in Speech Processing:Challenges, Recent Advances, and Future Trends:
https://arxiv.org/abs/2001.00378
#курс
Бесплатный курс от Авито по аналитике данных (никакого фидбэка о качестве программы у меня нет):
https://avito-analytics-academy.ru
Бесплатный курс от Авито по аналитике данных (никакого фидбэка о качестве программы у меня нет):
https://avito-analytics-academy.ru
avito-analytics-academy.ru
Академия Аналитиков Авито
Академия Аналитиков Авито — это образовательная среда и программа, созданные в Авито для подготовки аналитиков данных и DS инженеров
#курс
Неплохой курс по обработке сигналов - собрано основное с примерами на питоне:
https://habr.com/ru/post/460445/
Неплохой курс по обработке сигналов - собрано основное с примерами на питоне:
https://habr.com/ru/post/460445/
Хабр
Курс лекций «Основы цифровой обработки сигналов»
Всем привет! Часто ко мне обращаются люди с вопросами по задачам из области цифровой обработки сигналов (ЦОС). Я подробно рассказываю нюансы, подсказываю нужные...
За что Бенжио, Хинтон и ЛеКун получили премию Тьюрига? (какая упрощённая официальная формулировка)
Anonymous Quiz
27%
За вклад в развитие искуственного интеллекта
17%
За концептуальные и инженерные прорывы, позволившие применять DNN в компьютерных вычислениях
18%
За научный вклад в теоретическое обоснование нейронных сетей, а также дифф-ых суперпозиций функций
19%
За создание нового научного направления - глубоких вычислений и автоматического дифференцирования
19%
За выдающиеся заслуги, которые приближают учёных к прохождению теста Тьюринга
#статья
Ещё один ответ на популярный вопрос студентов: «Какая математика используется в ML?» Серия постов про теорию решёток (!) в машинном обучении:
https://habr.com/ru/post/510808/
Ещё один ответ на популярный вопрос студентов: «Какая математика используется в ML?» Серия постов про теорию решёток (!) в машинном обучении:
https://habr.com/ru/post/510808/
Хабр
Представление объектов для машинного обучения, основанного на теории решеток
Это четвертая статья из серии работ (ссылки на первую , вторую и третью статьи), посвященных системе машинного обучения, основанного на теории решеток, названной "ВКФ-система". Программа...
#интересно
Не изобретайте алгоритмы, они пригодятся лишь через 18 лет, собирайте данные! ;)
ссылка на источник: https://www.kdnuggets.com/2016/05/datasets-over-algorithms.html
Не изобретайте алгоритмы, они пригодятся лишь через 18 лет, собирайте данные! ;)
ссылка на источник: https://www.kdnuggets.com/2016/05/datasets-over-algorithms.html
#интересно
Меня как-то спрашивали про национальные стратегии ИИ, есть такой, интересный в этом плане, сайт:
https://futureoflife.org/ai-policy/
Меня как-то спрашивали про национальные стратегии ИИ, есть такой, интересный в этом плане, сайт:
https://futureoflife.org/ai-policy/
Future of Life Institute
Global AI Policy - Future of Life Institute
Need help navigating the AI policy sphere? Here's a map of national and international strategies, a list of challenges and recommendations, and a set of resources.
Это картинка как-то связана с
Anonymous Quiz
9%
CNN
13%
RNN
28%
Трансформерами
20%
Прокидыванием связей
16%
Нормировкой по батчам
14%
Темпами обучения
#интересно
Среди студентов сделали опрос по привлекательным работодателям. Надо сказать, что он соответствует моим ощущениям. Например, ВМКашников не затащишь в Газпром (у нас даже какие-то простые проекты не идут, поскольку студенты не хотят слышать о подобных компаниях и их задачах). Удивительна для меня только популярность Intel, раньше я много знал людей оттуда, но сейчас у меня, вроде, ни одного знакомого там не работает.
https://www.rbc.ru/business/16/07/2020/5f0f426a9a794765fcca1154
Среди студентов сделали опрос по привлекательным работодателям. Надо сказать, что он соответствует моим ощущениям. Например, ВМКашников не затащишь в Газпром (у нас даже какие-то простые проекты не идут, поскольку студенты не хотят слышать о подобных компаниях и их задачах). Удивительна для меня только популярность Intel, раньше я много знал людей оттуда, но сейчас у меня, вроде, ни одного знакомого там не работает.
https://www.rbc.ru/business/16/07/2020/5f0f426a9a794765fcca1154
РБК
Студенты назвали самые привлекательные места для работы
Компания Universum выяснила, что пандемия почти не изменила предпочтения выпускников
#статья
Почему сильный ИИ никогда не будет создан. Статья авторитетного учёного в Nature:
https://www.nature.com/articles/s41599-020-0494-4
Почему сильный ИИ никогда не будет создан. Статья авторитетного учёного в Nature:
https://www.nature.com/articles/s41599-020-0494-4
Nature
Why general artificial intelligence will not be realized
Humanities and Social Sciences Communications - Why general artificial intelligence will not be realized
Что такое "iterated loss"?
Anonymous Quiz
23%
ошибка, которая меняется в зависимости от итерации
10%
ошибка в RL
16%
сумма ошибок на нескольких слоях сети (например, трансформера)
16%
ошибка, которая минимизируется итерационным алгоритмом (например, SGD)
9%
мета-градиент от обычной ошибки
27%
ошибка равная сумме ошибок на разных итерациях
#статья
Неплохой обзор современных методов синтеза и клонирования. Правда, после его написания вышли ещё:
Mellotron, WaveGlow (вокодер)
FlowTron
Glow-TTS
EATS
https://heartbeat.fritz.ai/a-2019-guide-to-speech-synthesis-with-deep-learning-630afcafb9dd#2a7a
Неплохой обзор современных методов синтеза и клонирования. Правда, после его написания вышли ещё:
Mellotron, WaveGlow (вокодер)
FlowTron
Glow-TTS
EATS
https://heartbeat.fritz.ai/a-2019-guide-to-speech-synthesis-with-deep-learning-630afcafb9dd#2a7a
Fritz ai
A 2019 Guide to Speech Synthesis with Deep Learning - Fritz ai
Artificial production of human speech is known as speech synthesis. This machine learning-based technique is applicable in text-to-speech, music generation, speech generation, speech-enabled devices, navigation systems, and accessibility for visually-impaired…
#забавно
Что привлекательно в анализе данных, можно взять ну прям что-нибудь, например «побратимость городов», формализовать это, например в виде графа, а потом применить стандартные методы анализа, кластеризацию, и сразу вскрывается география стран, отношения между ними и т.п. И вроде никакой существенной информации на входе не использовали...
https://arxiv.org/abs/1301.6900
Что привлекательно в анализе данных, можно взять ну прям что-нибудь, например «побратимость городов», формализовать это, например в виде графа, а потом применить стандартные методы анализа, кластеризацию, и сразу вскрывается география стран, отношения между ними и т.п. И вроде никакой существенной информации на входе не использовали...
https://arxiv.org/abs/1301.6900
#забавно
Мир как нейросеть (если честно, я почти ничего не понял из статьи)
https://arxiv.org/pdf/2008.01540.pdf
Мир как нейросеть (если честно, я почти ничего не понял из статьи)
https://arxiv.org/pdf/2008.01540.pdf
#вакансия
... на проект по развитию системы геоаналитики по недвижимости
https://hh.ru/vacancy/38185445
... на проект по развитию системы геоаналитики по недвижимости
https://hh.ru/vacancy/38185445
hh.ru
Вакансия Team Lead разработки ArcGIS в Москве, работа в компании Сбер для экспертов (вакансия в архиве)
Зарплата: не указана. Москва. Требуемый опыт: 3–6 лет. Полная занятость. Дата публикации: 09.11.2020.
#интересно
Наверное, самая известная девушка в Российском DS:
https://daily.afisha.ru/relationship/16562-kak-rossiyanka-sozdala-metod-mashinnogo-obucheniya-kotorym-polzuyutsya-netflix-i-aviasales/
Наверное, самая известная девушка в Российском DS:
https://daily.afisha.ru/relationship/16562-kak-rossiyanka-sozdala-metod-mashinnogo-obucheniya-kotorym-polzuyutsya-netflix-i-aviasales/
Афиша
Как россиянка создала метод машинного обучения, которым пользуются Netflix и Aviasales
После университета Анна Вероника Дорогуш поработала в Microsoft, Google и «Яндексе». В последнем она создала библиотеку машинного обучения CatBoost, ее скачивают около 100 тыс. раз в неделю. «Афиша Daily» поговорила с Анной Вероникой о профессии, жизни в США…