#обзор
Вроде уже не пополняемый сборник ссылок, но есть ссылки на интересные старые материалы
https://mlpapers.org/
Вроде уже не пополняемый сборник ссылок, но есть ссылки на интересные старые материалы
https://mlpapers.org/
mlpapers.github.io
Machine learning papers
Machine Learning papers (landing page)
#видео
Махин Артём "Fake News Detection using XLMNet"
определение фейковости новостей с помощью современных NLP-моделей
https://youtu.be/vufHs2iQfpI
Махин Артём "Fake News Detection using XLMNet"
определение фейковости новостей с помощью современных NLP-моделей
https://youtu.be/vufHs2iQfpI
YouTube
SEM2021: Махин Артём "Fake News Detection using XLMNet"
06.05.2021 Махин Артём - доклад об обнаружении фейков
докладчик: Махин Артём (317 группа ВМК МГУ)
слайды: https://github.com/Dyakonov/MSU/blob/master/SEMINARS/20210302_MahinA_covid-fake.pdf
руководитель семинара: Дьяконов Александр (https://dyakonov.org/ag/)…
докладчик: Махин Артём (317 группа ВМК МГУ)
слайды: https://github.com/Dyakonov/MSU/blob/master/SEMINARS/20210302_MahinA_covid-fake.pdf
руководитель семинара: Дьяконов Александр (https://dyakonov.org/ag/)…
C4. Data Science Interview.pdf
15.6 MB
#карьера
Вопросы для DS-собеседования
Вопросы для DS-собеседования
#блог
Есть такой блог одного сообщества. Там не очень часто, но регулярно выходят небольшие обзоры ярких статей из мира DS:
https://www.topbots.com/
Есть такой блог одного сообщества. Там не очень часто, но регулярно выходят небольшие обзоры ярких статей из мира DS:
https://www.topbots.com/
TOPBOTS
TOPBOTS | Applied AI for Business - TOPBOTS
Read More Articles >
#забавно
Наблюдение...
Когда говорят об открытиях прошлого, то прежде всего называют фамилии создателей, например "нейрон" прочно ассоциируется с МакКаллоком и Питсом, неокогнитрон с Фукусимой, LSTM с Шмидхубером, LeNet с ЛеКуном, при этом мало кто может ответить, а где же работали эти исследователи, когда это всё создавали. Современные открытия ассоциируются с компаниями, например BERT с Google, Alpha* с DeepMind, GPT2/3 c OpenAI. И при этом почти никто не назовёт, например, фамилии авторов статьи про BERT...
Наблюдение...
Когда говорят об открытиях прошлого, то прежде всего называют фамилии создателей, например "нейрон" прочно ассоциируется с МакКаллоком и Питсом, неокогнитрон с Фукусимой, LSTM с Шмидхубером, LeNet с ЛеКуном, при этом мало кто может ответить, а где же работали эти исследователи, когда это всё создавали. Современные открытия ассоциируются с компаниями, например BERT с Google, Alpha* с DeepMind, GPT2/3 c OpenAI. И при этом почти никто не назовёт, например, фамилии авторов статьи про BERT...
#блог
У Андрея Лукьяненко есть очень симпатичный блог. Большая часть постов - обзор свежих научных работ.
https://andlukyane.com/blog/
У Андрея Лукьяненко есть очень симпатичный блог. Большая часть постов - обзор свежих научных работ.
https://andlukyane.com/blog/
Andlukyane
Andrey Lukyanenko's personal site – Andrey Lukyanenko
Information about me, my blogposts and projects.
#забавно
На рисунке изображён не просто какой-то человек, а Бёр Сеттлс (Burr Settles) - автор одной из лучших (но уже немного старой) книг по активному обучению.
На рисунке изображён не просто какой-то человек, а Бёр Сеттлс (Burr Settles) - автор одной из лучших (но уже немного старой) книг по активному обучению.
#длясправки
Есть Semi-supervised Learning - довольно известный вид обучения, когда дана выборка, часть которой имеет метки (поэтому можно сказать, что это "промежуточная" задача между Supervised Learning и Unsupervised Learning). Но есть ещё Semi-Unsupervised Learning - и мало кто знает, что это за зверь. На самом деле, этот термин разные исследователи пытались ввести по-разному. Мне понравилась такая формализация - обучение по неразмеченной выборке, для которой есть некоторая дополнительная информация о разметке (например, такие-то объекты имеют одинаковые метки, всего 3 класса, пропорции классов 3:2:1).
Есть Semi-supervised Learning - довольно известный вид обучения, когда дана выборка, часть которой имеет метки (поэтому можно сказать, что это "промежуточная" задача между Supervised Learning и Unsupervised Learning). Но есть ещё Semi-Unsupervised Learning - и мало кто знает, что это за зверь. На самом деле, этот термин разные исследователи пытались ввести по-разному. Мне понравилась такая формализация - обучение по неразмеченной выборке, для которой есть некоторая дополнительная информация о разметке (например, такие-то объекты имеют одинаковые метки, всего 3 класса, пропорции классов 3:2:1).
#образование
Никогда не пользовался, но вроде с помощью этого ресурса можно найти интересную PhD-позицию:
https://www.findaphd.com/
Никогда не пользовался, но вроде с помощью этого ресурса можно найти интересную PhD-позицию:
https://www.findaphd.com/
www.FindAPhD.com
PhD Programmes, Research Projects & Studentships in the UK & Europe
FindAPhD is a comprehensive guide to PhD studentships and postgraduate research degrees
Как называется приведённый классический метод из категории Semi-Supervised Learning?
Anonymous Quiz
13%
bi-Training
31%
Co-Training
23%
Self-Training
8%
Propagating
9%
Transductive SVM
17%
нет правильного варианта
#вакансия
Хорошая исследовательская вакансия в Genome Biology Unit at EMBL, рекомендую!
https://www.linkedin.com/jobs/view/2522538280/
Хорошая исследовательская вакансия в Genome Biology Unit at EMBL, рекомендую!
https://www.linkedin.com/jobs/view/2522538280/
Linkedin
26 Bioinformatiker jobs in Germany (1 new)
Today’s top 26 Bioinformatiker jobs in Germany. Leverage your professional network, and get hired. New Bioinformatiker jobs added daily.
#книги
Собраны доказательства классических фактов в теории вероятностей и статистке:
https://github.com/StatProofBook/StatProofBookTools/blob/master/write_book/StatProofBook.pdf
Собраны доказательства классических фактов в теории вероятностей и статистке:
https://github.com/StatProofBook/StatProofBookTools/blob/master/write_book/StatProofBook.pdf
GitHub
StatProofBookTools/write_book/StatProofBook.pdf at master · StatProofBook/StatProofBookTools
Tools for The Book of Statistical Proofs. Contribute to StatProofBook/StatProofBookTools development by creating an account on GitHub.
#книги
Симпатично оформлена и интересно написана. Для профессионалов она бесполезна, и уж точно там нет каких-то практических советов и приёмов. Но вот для менеджеров или людей из смежных специальностей, которые хотят больше узнать о DS, самое то. Тут о том, чем информация отличается от данных, о чём надо спросить у заказчика DS-проекта, что такое «утечка данных», какие есть подводные камни в реальных проектах и т.п.
Симпатично оформлена и интересно написана. Для профессионалов она бесполезна, и уж точно там нет каких-то практических советов и приёмов. Но вот для менеджеров или людей из смежных специальностей, которые хотят больше узнать о DS, самое то. Тут о том, чем информация отличается от данных, о чём надо спросить у заказчика DS-проекта, что такое «утечка данных», какие есть подводные камни в реальных проектах и т.п.
#жзл
Интересный факт из жизни Рональда Фишера, которого статистики знают по тесту Фишера, аналитики по ирисам Фишера, а биологи по принципу Фишера. Оказывается, он считал, что курение не приводит к раку лёгких, а во всех исследованиях путают «следствие» и «сопутствие». Например, если мы видим, что среди больных больший процент курящих, то это может быть потому, что они были генетически предрасположены к болезни и в курении нашли облегчение её начальных симптомов. Кстати, вроде он был первый, кто заговорил о генетической предрасположенности к курению. Как нетрудно догадаться, учёный был заядлый курильщик. Умер от рака, но не лёгких.
Интересный факт из жизни Рональда Фишера, которого статистики знают по тесту Фишера, аналитики по ирисам Фишера, а биологи по принципу Фишера. Оказывается, он считал, что курение не приводит к раку лёгких, а во всех исследованиях путают «следствие» и «сопутствие». Например, если мы видим, что среди больных больший процент курящих, то это может быть потому, что они были генетически предрасположены к болезни и в курении нашли облегчение её начальных симптомов. Кстати, вроде он был первый, кто заговорил о генетической предрасположенности к курению. Как нетрудно догадаться, учёный был заядлый курильщик. Умер от рака, но не лёгких.