#данные
Для тех, кому нужны датасеты - обновление известного поиска:
https://blog.google/products/search/discovering-millions-datasets-web/
Для тех, кому нужны датасеты - обновление известного поиска:
https://blog.google/products/search/discovering-millions-datasets-web/
Google
Discovering millions of datasets on the web
Dataset Search launches publicly with an index of 25 million datasets, helping scientists, journalists, students, data geeks to find data.
#работа
Много всего про soft-skills. Вроде, местами неплохие материалы попадаются...
https://vc.ru/learn/101011-samaya-bolshaya-podborka-po-prokachke-soft-skills-hvatit-na-vsyu-zhizn
Много всего про soft-skills. Вроде, местами неплохие материалы попадаются...
https://vc.ru/learn/101011-samaya-bolshaya-podborka-po-prokachke-soft-skills-hvatit-na-vsyu-zhizn
vc.ru
Самая большая подборка по прокачке soft skills. Хватит на всю жизнь — Образование на vc.ru
Чтобы развивать инновационную среду в компании, нужно начать с развития собственных навыков. Конечно, вы слышали про soft skills и уже знаете шутку, что за hard skills вас берут на работу, а за soft skills увольняют. Но что вас точно удивит, так это количество…
#соревнование
Конкурс "VoicePrivacy" при конференции Interspeech 2020:
https://www.voiceprivacychallenge.org/
Конкурс "VoicePrivacy" при конференции Interspeech 2020:
https://www.voiceprivacychallenge.org/
#статья
Статья со ссылкой на соответствующий сервис. Идея - облегчить трансферное обучения. Если Вы решаете задачу, в которой мало данных, то стандартный приём - взять предобученную на большом наборе данных нейросеть и "дотьюнить" её на Вашу задачу. Авторы задались вопросами: как выбрать подходящий большой датасет для первичного обучения нейросети, можно ли из него выделить подвыборку, максимально релевантную нашей задаче. Они даже сделали сервис с подобным функционалом;)
https://arxiv.org/abs/2001.02799
Статья со ссылкой на соответствующий сервис. Идея - облегчить трансферное обучения. Если Вы решаете задачу, в которой мало данных, то стандартный приём - взять предобученную на большом наборе данных нейросеть и "дотьюнить" её на Вашу задачу. Авторы задались вопросами: как выбрать подходящий большой датасет для первичного обучения нейросети, можно ли из него выделить подвыборку, максимально релевантную нашей задаче. Они даже сделали сервис с подобным функционалом;)
https://arxiv.org/abs/2001.02799
#математика
К вопросу о том, что в классической математике "совсем свежего": например, тропическая геометрия - она появилась уже в этом веке, всякие тропические полукольца применяются в экономике (считается, что с их помощью лучше формализуются процессы типа объединения компаний и т.п.), а также в ИИ (например, в т.н. Weighted Finite-State Transducers). Бегло ознакомиться с тропической геометрией можно с помощью этой небольшой книги:
https://www.mccme.ru/dubna/2006/notes/Kazaryan.pdf
К вопросу о том, что в классической математике "совсем свежего": например, тропическая геометрия - она появилась уже в этом веке, всякие тропические полукольца применяются в экономике (считается, что с их помощью лучше формализуются процессы типа объединения компаний и т.п.), а также в ИИ (например, в т.н. Weighted Finite-State Transducers). Бегло ознакомиться с тропической геометрией можно с помощью этой небольшой книги:
https://www.mccme.ru/dubna/2006/notes/Kazaryan.pdf
#конференции
Конференция «Оптимизация и приложения» в Черногории в конце сентября
http://agora.guru.ru/display.php?conf=optima-2020
Конференция «Оптимизация и приложения» в Черногории в конце сентября
http://agora.guru.ru/display.php?conf=optima-2020
#книга
Фантастика! Новая книга Нассима Талеба Статистические последствия тяжелых хвостов: преасимптотика, эпистемология и приложения просто выложена на Arxiv-е. Можно читать не дожидаясь, пока какое-нибудь модное издательство переведёт;)
https://arxiv.org/abs/2001.10488
Фантастика! Новая книга Нассима Талеба Статистические последствия тяжелых хвостов: преасимптотика, эпистемология и приложения просто выложена на Arxiv-е. Можно читать не дожидаясь, пока какое-нибудь модное издательство переведёт;)
https://arxiv.org/abs/2001.10488
#визуализация
Как сделать визуализацию огромной коллекции бабочек (всем, кто в душе немного Хемуль ;)
https://marian42.de/article/butterflies/
Как сделать визуализацию огромной коллекции бабочек (всем, кто в душе немного Хемуль ;)
https://marian42.de/article/butterflies/
Marian's Blog
Visualizing 150000 butterflies from the Natural History Museum
Visualizing 150000 butterflies from the Natural History Museum - Personal blog about game development, programming and making
#книга
Небольшая брошюра от "Касперского" про использование ML в кибербезопасности:
https://media.kaspersky.com/en/enterprise-security/Kaspersky-Lab-Whitepaper-Machine-Learning.pdf
Небольшая брошюра от "Касперского" про использование ML в кибербезопасности:
https://media.kaspersky.com/en/enterprise-security/Kaspersky-Lab-Whitepaper-Machine-Learning.pdf
#вакансия
Нужен человек, хорошо разбирающийся в прикладной дискретной оптимизации (в идеале - желающий работать и в DS) на проекты, в которых упрощённая математическая постановка задач выглядит так:
1) оптимизация разборки и сборки составов (условно: есть поезда с вагонами ABBBC, BAAC, AACCC, надо их превратить в поезда с вагонами AAAAA, BBBB, CCCCC + куча всяких условий на то, когда каждый из поездов вида XXXX должен быть готов и т.п.)
2) оптимизация нескольких коммивояжёров (есть транспортные средства, которые в совокупности в течение дня должны посетить все заранее заданные пункты и вернуться на базу, желательно использовать минимальное число транспортных средств + есть ограничения на перемещения каждого из них).
Можно в личке задать вопросы, резюме на [email protected] (в теме письма напишите: «вакансия на задачи оптимизации»)
Нужен человек, хорошо разбирающийся в прикладной дискретной оптимизации (в идеале - желающий работать и в DS) на проекты, в которых упрощённая математическая постановка задач выглядит так:
1) оптимизация разборки и сборки составов (условно: есть поезда с вагонами ABBBC, BAAC, AACCC, надо их превратить в поезда с вагонами AAAAA, BBBB, CCCCC + куча всяких условий на то, когда каждый из поездов вида XXXX должен быть готов и т.п.)
2) оптимизация нескольких коммивояжёров (есть транспортные средства, которые в совокупности в течение дня должны посетить все заранее заданные пункты и вернуться на базу, желательно использовать минимальное число транспортных средств + есть ограничения на перемещения каждого из них).
Можно в личке задать вопросы, резюме на [email protected] (в теме письма напишите: «вакансия на задачи оптимизации»)
#интересно
Вчерашняя красивая новость про то, как искусственно сделать пробки. Я про это как раз рассказываю в рамках одного из своих курсов. Раз уж это сделал художник, то можно было бы пойти дальше и пробками чертить на Гугл-карте узоры, но потребовалось бы существенно больше ресурсов...
https://tjournal.ru/internet/140483-nemeckiy-hudozhnik-sozdal-virtualnye-probki-v-google-maps-on-vozil-po-dorogam-telezhku-s-99-telefonami
Вчерашняя красивая новость про то, как искусственно сделать пробки. Я про это как раз рассказываю в рамках одного из своих курсов. Раз уж это сделал художник, то можно было бы пойти дальше и пробками чертить на Гугл-карте узоры, но потребовалось бы существенно больше ресурсов...
https://tjournal.ru/internet/140483-nemeckiy-hudozhnik-sozdal-virtualnye-probki-v-google-maps-on-vozil-po-dorogam-telezhku-s-99-telefonami
TJ
Немецкий художник создал виртуальные пробки в Google Maps. Он возил по дорогам тележку с 99 телефонами — Интернет на TJ
Автор обманул алгоритмы Google, чтобы продемонстрировать влияние виртуальных карт на реальный мир.
#код
Пример использования библиотеки RAPIDS от NVIDIA от победителя соревнования IEEE-CIS Fraud Detection
https://www.kaggle.com/cdeotte/rapids-feature-engineering-fraud-0-96
Пример использования библиотеки RAPIDS от NVIDIA от победителя соревнования IEEE-CIS Fraud Detection
https://www.kaggle.com/cdeotte/rapids-feature-engineering-fraud-0-96
Kaggle
RAPIDS - Feature Engineering - Fraud - [0.96]
Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources
#статья
Работа From local explanations to global understanding with explainable AI for trees опубликованная в Nature Machine Intelligence про интерпретацию алгоритмов, основанных на решающих деревьях, с помощью SHAP-подхода
https://www.nature.com/articles/s42256-019-0138-9.epdf
Работа From local explanations to global understanding with explainable AI for trees опубликованная в Nature Machine Intelligence про интерпретацию алгоритмов, основанных на решающих деревьях, с помощью SHAP-подхода
https://www.nature.com/articles/s42256-019-0138-9.epdf
Nature
From local explanations to global understanding with explainable AI for trees
Nature Machine Intelligence - Tree-based machine learning models are widely used in domains such as healthcare, finance and public services. The authors present an explanation method for trees that...
#математика
Некоммерческий проект - электронная математическая библиотека. Например, нашёл там интересный перевод 1923 года книги Эмиля Бореля «Случай». Можно почитать, как рассказывали о вероятности до трудов Колмогорова.
https://www.mathedu.ru
Некоммерческий проект - электронная математическая библиотека. Например, нашёл там интересный перевод 1923 года книги Эмиля Бореля «Случай». Можно почитать, как рассказывали о вероятности до трудов Колмогорова.
https://www.mathedu.ru
Библиотека Mathedu.Ru
Главная // Библиотека Mathedu.Ru
«Математическое образование» — общедоступная сетевая электронная библиотека. Содержит учебную, методическую и популярную литературу по математике.
#законы
В наше время анализа данных один из способов их получения - веб-скрейпинг, про законность которого есть разные мнения (естественно, в зависимости от того, владеете ли Вы интернет-ресурсом, или хотите получить данные). Вот последняя практика в США:
https://parsers.me/us-court-fully-legalized-website-scraping-and-technically-prohibited-it/
В наше время анализа данных один из способов их получения - веб-скрейпинг, про законность которого есть разные мнения (естественно, в зависимости от того, владеете ли Вы интернет-ресурсом, или хотите получить данные). Вот последняя практика в США:
https://parsers.me/us-court-fully-legalized-website-scraping-and-technically-prohibited-it/
Parsers
US court fully legalized website scraping and technically prohibited it - Parsers
- US court fully legalized website scraping and technically prohibited it Parsers