#образование
Сейчас в аспирантурах страны будет использоваться новая номенклатура специальностей, по которым можно защищать диссертации. Она стала более современной, например, появился раздел 1.2 "Компьютерные науки и информатика", в котором есть специальность 1.2.1 "Искусственный интеллект и машинное обучение". Раньше у всех, кто занимался машинным обучением были проблемы с тем, по какой специальности защищаться. Теперь её нет.
Из интересного, есть и раздел 5.11. "Теология" (почему-то соседний с когнитивными науками) и три специальности, оказывается, теология может быть теоретической, исторической и практической;)
https://vak.minobrnauki.gov.ru/uploader/loader?type=1&name=91506173002&f=7892
Сейчас в аспирантурах страны будет использоваться новая номенклатура специальностей, по которым можно защищать диссертации. Она стала более современной, например, появился раздел 1.2 "Компьютерные науки и информатика", в котором есть специальность 1.2.1 "Искусственный интеллект и машинное обучение". Раньше у всех, кто занимался машинным обучением были проблемы с тем, по какой специальности защищаться. Теперь её нет.
Из интересного, есть и раздел 5.11. "Теология" (почему-то соседний с когнитивными науками) и три специальности, оказывается, теология может быть теоретической, исторической и практической;)
https://vak.minobrnauki.gov.ru/uploader/loader?type=1&name=91506173002&f=7892
#интересно
Рассказ модератора контента порнхаба. Довольно познавательно «как там всё устроено»:
https://www.theverge.com/c/22925906/pornhub-mindgeek-content-moderation
Рассказ модератора контента порнхаба. Довольно познавательно «как там всё устроено»:
https://www.theverge.com/c/22925906/pornhub-mindgeek-content-moderation
The Verge
Confessions of a Pornhub moderator
I wasn’t even supposed to be a moderator. It’s what I was doing in between writing tweets.
#книга
Питер Брайан Медавар «Советы молодому ученому»
Классика - книга о науке, в форме монолога о разных аспектах научной деятельности (где взять задачу, что такое публичность в науке, этика ссылок на первоисточники, какие бывают эксперименты и многое другое). Все вещи довольно простые, но собраны в одном месте и написаны хорошим языком.
Питер Брайан Медавар «Советы молодому ученому»
Классика - книга о науке, в форме монолога о разных аспектах научной деятельности (где взять задачу, что такое публичность в науке, этика ссылок на первоисточники, какие бывают эксперименты и многое другое). Все вещи довольно простые, но собраны в одном месте и написаны хорошим языком.
#визуализация
У этой научной группы довольно интересные представления проектов (есть с интересными визуализациями):
https://poloclub.github.io/
Например, одна из самых известных визуализаций - CNN-Explainer https://poloclub.github.io/cnn-explainer/
У этой научной группы довольно интересные представления проектов (есть с интересными визуализациями):
https://poloclub.github.io/
Например, одна из самых известных визуализаций - CNN-Explainer https://poloclub.github.io/cnn-explainer/
Polo Club of Data Science @ Georgia Tech: Human-Centered AI, Deep Learning Interpretation & Visualization, Cybersecurity, Large Graph Visualization and Mining Georgia Tech Atlanta, GA 30332, United States
At Georgia Tech, we innovate scalable, interactive, and interpretable tools that amplify human’s ability to understand and interact with billion-scale data and machine learning models. Our current research thrusts: human-centered AI (interpretable, fair,…
#интересно
Довольно любопытный график. Чемпион до-глубокого периода (если измерять во FLOP-сах) – решение задачи на конкурсе Netflix (это к вопросу, что нельзя было просто так взять и выиграть). Чемпион глубокого – GloVe (никогда не подумал бы). А текущего чемпиона попробуем угадать в голосовалке ниже...
Оригинал здесь. Смотреть после голосования;)
Довольно любопытный график. Чемпион до-глубокого периода (если измерять во FLOP-сах) – решение задачи на конкурсе Netflix (это к вопросу, что нельзя было просто так взять и выиграть). Чемпион глубокого – GloVe (никогда не подумал бы). А текущего чемпиона попробуем угадать в голосовалке ниже...
Оригинал здесь. Смотреть после голосования;)
Кто текущий чемпион (см. пост выше)?
Anonymous Quiz
4%
Yuan 1.0
8%
ERNIE 3.0
6%
RETRO-7B
29%
GPT-Neo
9%
M6-T
44%
я не хочу в этом участвовать
#интересно
Появилась тенденция кроме своего резюме на персональный сайт выкладывать ещё и развёрнутое описание научных интересов. Иногда его оформляют в виде статьи:
https://epsilon-lee.github.io/static/Research_Interests_and_Statement_glli2020.pdf
Появилась тенденция кроме своего резюме на персональный сайт выкладывать ещё и развёрнутое описание научных интересов. Иногда его оформляют в виде статьи:
https://epsilon-lee.github.io/static/Research_Interests_and_Statement_glli2020.pdf
#диссертация
Вот все боятся ликов, а некоторые с их помощью научные степени получают;) А хорошая тема, между прочим!
Tribhuvanesh Orekondy "Understanding and controlling leakage in machine learning"
https://publikationen.sulb.uni-saarland.de/bitstream/20.500.11880/30989/1/dissertation_final.pdf
Вот все боятся ликов, а некоторые с их помощью научные степени получают;) А хорошая тема, между прочим!
Tribhuvanesh Orekondy "Understanding and controlling leakage in machine learning"
https://publikationen.sulb.uni-saarland.de/bitstream/20.500.11880/30989/1/dissertation_final.pdf
#полезно
Для МГУшников…
МГУ и Яндекс предлагают возможность завести почтовый ящик в домене @my.msu.ru, доступ к Яндекс.диску объемом 1 Тб без рекламы, Онлайн-редактору документов, Календарю, Мессенджеру, cистеме видеоконференции связи Телемост для ведения семинарских занятий.
https://my.msu.ru
Для МГУшников…
МГУ и Яндекс предлагают возможность завести почтовый ящик в домене @my.msu.ru, доступ к Яндекс.диску объемом 1 Тб без рекламы, Онлайн-редактору документов, Календарю, Мессенджеру, cистеме видеоконференции связи Телемост для ведения семинарских занятий.
https://my.msu.ru
#юмор
Раз сегодня 1 апреля, то надо что-нибудь "весёлое" рассказать...
Я несколько лет подряд в начале обучения магистратуры ММП ВМК МГУ устраивал тест по машинному обучению: где-то порядка 50 вопросов, не очень сложных, на совершенно разные темы ML (чтобы понять, а что поступившие магистры знают). В каждом вопросе надо было выбрать один из 4х ответов. А ещё в каждом вопросе правильным был второй ответ. За 4 года моих экспериментов с тестом никто не нашёл закономерности (т.е. не "обучился"), хотя все в среднем хорошо отвечали (почти все больше 50% вопросов правильно, а четверть около 80% правильно).
А ещё я когда-то делал тесты с вопросами, на которые не было правильного ответа... но это уже другая история;)
На всякий случай, все описанные здесь тесты несли исследовательский характер и не влияли на оценки студентов.
Раз сегодня 1 апреля, то надо что-нибудь "весёлое" рассказать...
Я несколько лет подряд в начале обучения магистратуры ММП ВМК МГУ устраивал тест по машинному обучению: где-то порядка 50 вопросов, не очень сложных, на совершенно разные темы ML (чтобы понять, а что поступившие магистры знают). В каждом вопросе надо было выбрать один из 4х ответов. А ещё в каждом вопросе правильным был второй ответ. За 4 года моих экспериментов с тестом никто не нашёл закономерности (т.е. не "обучился"), хотя все в среднем хорошо отвечали (почти все больше 50% вопросов правильно, а четверть около 80% правильно).
А ещё я когда-то делал тесты с вопросами, на которые не было правильного ответа... но это уже другая история;)
На всякий случай, все описанные здесь тесты несли исследовательский характер и не влияли на оценки студентов.
#юмор
Ну и тогда ещё одна история (вообще-то у меня их довольно много). Как-то я принимал так экзамен:
- кто хочет удовл. автоматом?
(часть людей получает тройки и уходит)
- кто хочет хор. автоматом?
(часть людей получает четвёрки и уходит, но уже чувствуется напряжённость, кто-то хочет получить "хор", но его останавливают друзья со словами "Ты что, не понимаешь, просто надо перетерпеть?")
А вот что было дальше я пока не скажу:)
Ну и тогда ещё одна история (вообще-то у меня их довольно много). Как-то я принимал так экзамен:
- кто хочет удовл. автоматом?
(часть людей получает тройки и уходит)
- кто хочет хор. автоматом?
(часть людей получает четвёрки и уходит, но уже чувствуется напряжённость, кто-то хочет получить "хор", но его останавливают друзья со словами "Ты что, не понимаешь, просто надо перетерпеть?")
А вот что было дальше я пока не скажу:)
#юмор
Ну и последняя история, давайте, уже из области бизнеса.
Как-то, уже очень давно, я работал в компании N. Наш CEO ждал на переговоры представителя другой компании, мы располагались на верхних этажах пафосного бизнес-центра, в назначенный час помощница руководителя спустилась и проводила представителя другой компании в переговорку, в которой его уже ждал наш CEO, они поздоровались и начали переговоры. Стенки были прозрачные и всё было видно: они шутили, о чём-то спорили и т.п. Я, проходя мимо переговорки, спросил "а с кем это беседуют?" Мне ответили, я удивился, т.к. вроде представлял, как выглядит переговорщик с их стороны - этот был не похож. Через полчаса оживлённая беседа вдруг резко завершилась, CEO и представитель спешно попрощались...
Что произошло? Оказалось, наша помощница руководителя привела не того. Она спустилась, спросила "кто на встречу?" И повела в переговорку. А он пришёл на другую встречу! Но я хохотал весь день... они беседовали полчаса! Успели рассказать о своих компаниях, обсудить условия будущего договора и т.п. В какой момент они что-то заподозрили, мне так и не сказали;)
Ну и последняя история, давайте, уже из области бизнеса.
Как-то, уже очень давно, я работал в компании N. Наш CEO ждал на переговоры представителя другой компании, мы располагались на верхних этажах пафосного бизнес-центра, в назначенный час помощница руководителя спустилась и проводила представителя другой компании в переговорку, в которой его уже ждал наш CEO, они поздоровались и начали переговоры. Стенки были прозрачные и всё было видно: они шутили, о чём-то спорили и т.п. Я, проходя мимо переговорки, спросил "а с кем это беседуют?" Мне ответили, я удивился, т.к. вроде представлял, как выглядит переговорщик с их стороны - этот был не похож. Через полчаса оживлённая беседа вдруг резко завершилась, CEO и представитель спешно попрощались...
Что произошло? Оказалось, наша помощница руководителя привела не того. Она спустилась, спросила "кто на встречу?" И повела в переговорку. А он пришёл на другую встречу! Но я хохотал весь день... они беседовали полчаса! Успели рассказать о своих компаниях, обсудить условия будущего договора и т.п. В какой момент они что-то заподозрили, мне так и не сказали;)
#новости
Поскольку мой первоначальный комментарий к этой ссылке не все посчитали корректным, оставляю только ссылку:
https://www.kommersant.ru/doc/5292131
Поскольку мой первоначальный комментарий к этой ссылке не все посчитали корректным, оставляю только ссылку:
https://www.kommersant.ru/doc/5292131
Коммерсантъ
МГУ получит 2,4 млрд руб. на изучение искусственного интеллекта
Подробнее на сайте
#новости
Есть ещё крупные мероприятия, на которые допущены россияне, например Европейская олимпиада по математике среди девушек. Кстати, если удивлены - то да, для девушек есть отдельные олимпиады по математике, хотя они, конечно, могут быть и участницами основных. Выиграли наши школьницы (из Питера и Казани): https://edu.gov.ru/press/4981/chetyre-zolotye-medali-poluchili-rossiyskie-shkolnicy-na-11-y-evropeyskoy-olimpiade-po-matematike-dlya-devushek/
Впереди международная олимпиада (интересно, допустят ли туда участников из России).
Есть ещё крупные мероприятия, на которые допущены россияне, например Европейская олимпиада по математике среди девушек. Кстати, если удивлены - то да, для девушек есть отдельные олимпиады по математике, хотя они, конечно, могут быть и участницами основных. Выиграли наши школьницы (из Питера и Казани): https://edu.gov.ru/press/4981/chetyre-zolotye-medali-poluchili-rossiyskie-shkolnicy-na-11-y-evropeyskoy-olimpiade-po-matematike-dlya-devushek/
Впереди международная олимпиада (интересно, допустят ли туда участников из России).
#новости
Начали выкладывать какие-то (я сам пока не смотрел) городские данные. Сам факт, что подобные данные выкладываются в общий доступ радует. Мэрии некоторых американских и европейских городов уже давно выкладывают, например, данные, какие преступления были совершены, когда и где. У нас пока такое невозможно представить.
https://ai.mos.ru
Начали выкладывать какие-то (я сам пока не смотрел) городские данные. Сам факт, что подобные данные выкладываются в общий доступ радует. Мэрии некоторых американских и европейских городов уже давно выкладывают, например, данные, какие преступления были совершены, когда и где. У нас пока такое невозможно представить.
https://ai.mos.ru
#видео
В прошлом году самым популярным видео на моём ютуб-канале неожиданно стал разбор данных одного Kaggle-соревнования. Возможно, это действительно интересно общественности. Поэтому я сделал разбор задачи с ещё одного соревнования, которую мы решали вместе со студентами осенью (руки не доходили, а тут я решил эту же задачу дать для студентов, которым читаю ML, заодно и записал лекцию).
Итак, никаких современных трансформеров и мультимодальности, тупо смотрим табличные данные и придумываем признаки на протяжении 1 часа:
https://youtu.be/LDSMqYSE1vI
В прошлом году самым популярным видео на моём ютуб-канале неожиданно стал разбор данных одного Kaggle-соревнования. Возможно, это действительно интересно общественности. Поэтому я сделал разбор задачи с ещё одного соревнования, которую мы решали вместе со студентами осенью (руки не доходили, а тут я решил эту же задачу дать для студентов, которым читаю ML, заодно и записал лекцию).
Итак, никаких современных трансформеров и мультимодальности, тупо смотрим табличные данные и придумываем признаки на протяжении 1 часа:
https://youtu.be/LDSMqYSE1vI
YouTube
EDA на примере соревнования MKB
Описание разведочного анализа данных соревнования МКБ.
Автор: Александр Дьяконов (https://dyakonov.org/)
Автор: Александр Дьяконов (https://dyakonov.org/)
#полезно
Вчера просматривал DS-чаты, которые обычно не особо мониторю, ответил на несколько вопросов из серии "а почему у меня этот код не работает". Сегодня утром в личку стучится рекрутер с предложением о работе (судя по общим подпискам, как раз из-за вчерашней активности - до этого никогда не стучались). Вакансия на мидла в крупной компании, вилку не называют. Но в целом, мне идея понравилась - отлавливать кандидатов в профильных чатах (не тех, кто все вопросы к политике сводят или про будущее ИИ разглагольствуют, а тех, кто что-то дельное пишет, хоть в телеграме и нет кармы). Интересно только, насколько это действенный способ?
Вчера просматривал DS-чаты, которые обычно не особо мониторю, ответил на несколько вопросов из серии "а почему у меня этот код не работает". Сегодня утром в личку стучится рекрутер с предложением о работе (судя по общим подпискам, как раз из-за вчерашней активности - до этого никогда не стучались). Вакансия на мидла в крупной компании, вилку не называют. Но в целом, мне идея понравилась - отлавливать кандидатов в профильных чатах (не тех, кто все вопросы к политике сводят или про будущее ИИ разглагольствуют, а тех, кто что-то дельное пишет, хоть в телеграме и нет кармы). Интересно только, насколько это действенный способ?
#длясправки
В машинном обучении (и много где ещё) любят аббревиатуры, интересно, когда такие аббревиатуры одновременно обозначают два разных понятия. Есть избитые примеры типа NLP (Natural Language Processing, NonLinear Programming, Neuro-Linguistic Programming), но всё таки это расшифровки из совершенно разных областей (и в ML путаницы нет), а вот несколько "внутриобластных" примеров.
SOTA – Вы, конечно, сразу подумали про State of the Art (тогда правильнее писать SotA), но есть ещё такой алгоритм Self Organizing Tree Algorithm. И самое забавное, что если Вы хотите погуглить, какой сейчас самый лучший алгоритм кластеризации, то на запрос "SOTA clustering" в гугле будет выдаваться именно этот. Неплохой маркетинговый ход;)
SGD – на ум приходит Stochastic gradient descent, но некоторые NLP-шники скажут, что есть такой набор данных Schema-Guided Dialogue dataset (SGD), в статьях и блог-постах гугла на него ссылаются как на SGD.
LDA – это классика: Latent Dirichlet Allocation и Linear Discriminant Analysis, хотя, кто в современном мире вспоминает термин "линейный дискриминантный анализ"?
Какие Вы ещё знаете "накладки" в аббревиатурах?
В машинном обучении (и много где ещё) любят аббревиатуры, интересно, когда такие аббревиатуры одновременно обозначают два разных понятия. Есть избитые примеры типа NLP (Natural Language Processing, NonLinear Programming, Neuro-Linguistic Programming), но всё таки это расшифровки из совершенно разных областей (и в ML путаницы нет), а вот несколько "внутриобластных" примеров.
SOTA – Вы, конечно, сразу подумали про State of the Art (тогда правильнее писать SotA), но есть ещё такой алгоритм Self Organizing Tree Algorithm. И самое забавное, что если Вы хотите погуглить, какой сейчас самый лучший алгоритм кластеризации, то на запрос "SOTA clustering" в гугле будет выдаваться именно этот. Неплохой маркетинговый ход;)
SGD – на ум приходит Stochastic gradient descent, но некоторые NLP-шники скажут, что есть такой набор данных Schema-Guided Dialogue dataset (SGD), в статьях и блог-постах гугла на него ссылаются как на SGD.
LDA – это классика: Latent Dirichlet Allocation и Linear Discriminant Analysis, хотя, кто в современном мире вспоминает термин "линейный дискриминантный анализ"?
Какие Вы ещё знаете "накладки" в аббревиатурах?