#интересно
Довольно любопытный график. Чемпион до-глубокого периода (если измерять во FLOP-сах) – решение задачи на конкурсе Netflix (это к вопросу, что нельзя было просто так взять и выиграть). Чемпион глубокого – GloVe (никогда не подумал бы). А текущего чемпиона попробуем угадать в голосовалке ниже...
Оригинал здесь. Смотреть после голосования;)
Довольно любопытный график. Чемпион до-глубокого периода (если измерять во FLOP-сах) – решение задачи на конкурсе Netflix (это к вопросу, что нельзя было просто так взять и выиграть). Чемпион глубокого – GloVe (никогда не подумал бы). А текущего чемпиона попробуем угадать в голосовалке ниже...
Оригинал здесь. Смотреть после голосования;)
Кто текущий чемпион (см. пост выше)?
Anonymous Quiz
4%
Yuan 1.0
8%
ERNIE 3.0
6%
RETRO-7B
29%
GPT-Neo
9%
M6-T
44%
я не хочу в этом участвовать
#интересно
Появилась тенденция кроме своего резюме на персональный сайт выкладывать ещё и развёрнутое описание научных интересов. Иногда его оформляют в виде статьи:
https://epsilon-lee.github.io/static/Research_Interests_and_Statement_glli2020.pdf
Появилась тенденция кроме своего резюме на персональный сайт выкладывать ещё и развёрнутое описание научных интересов. Иногда его оформляют в виде статьи:
https://epsilon-lee.github.io/static/Research_Interests_and_Statement_glli2020.pdf
#диссертация
Вот все боятся ликов, а некоторые с их помощью научные степени получают;) А хорошая тема, между прочим!
Tribhuvanesh Orekondy "Understanding and controlling leakage in machine learning"
https://publikationen.sulb.uni-saarland.de/bitstream/20.500.11880/30989/1/dissertation_final.pdf
Вот все боятся ликов, а некоторые с их помощью научные степени получают;) А хорошая тема, между прочим!
Tribhuvanesh Orekondy "Understanding and controlling leakage in machine learning"
https://publikationen.sulb.uni-saarland.de/bitstream/20.500.11880/30989/1/dissertation_final.pdf
#полезно
Для МГУшников…
МГУ и Яндекс предлагают возможность завести почтовый ящик в домене @my.msu.ru, доступ к Яндекс.диску объемом 1 Тб без рекламы, Онлайн-редактору документов, Календарю, Мессенджеру, cистеме видеоконференции связи Телемост для ведения семинарских занятий.
https://my.msu.ru
Для МГУшников…
МГУ и Яндекс предлагают возможность завести почтовый ящик в домене @my.msu.ru, доступ к Яндекс.диску объемом 1 Тб без рекламы, Онлайн-редактору документов, Календарю, Мессенджеру, cистеме видеоконференции связи Телемост для ведения семинарских занятий.
https://my.msu.ru
#юмор
Раз сегодня 1 апреля, то надо что-нибудь "весёлое" рассказать...
Я несколько лет подряд в начале обучения магистратуры ММП ВМК МГУ устраивал тест по машинному обучению: где-то порядка 50 вопросов, не очень сложных, на совершенно разные темы ML (чтобы понять, а что поступившие магистры знают). В каждом вопросе надо было выбрать один из 4х ответов. А ещё в каждом вопросе правильным был второй ответ. За 4 года моих экспериментов с тестом никто не нашёл закономерности (т.е. не "обучился"), хотя все в среднем хорошо отвечали (почти все больше 50% вопросов правильно, а четверть около 80% правильно).
А ещё я когда-то делал тесты с вопросами, на которые не было правильного ответа... но это уже другая история;)
На всякий случай, все описанные здесь тесты несли исследовательский характер и не влияли на оценки студентов.
Раз сегодня 1 апреля, то надо что-нибудь "весёлое" рассказать...
Я несколько лет подряд в начале обучения магистратуры ММП ВМК МГУ устраивал тест по машинному обучению: где-то порядка 50 вопросов, не очень сложных, на совершенно разные темы ML (чтобы понять, а что поступившие магистры знают). В каждом вопросе надо было выбрать один из 4х ответов. А ещё в каждом вопросе правильным был второй ответ. За 4 года моих экспериментов с тестом никто не нашёл закономерности (т.е. не "обучился"), хотя все в среднем хорошо отвечали (почти все больше 50% вопросов правильно, а четверть около 80% правильно).
А ещё я когда-то делал тесты с вопросами, на которые не было правильного ответа... но это уже другая история;)
На всякий случай, все описанные здесь тесты несли исследовательский характер и не влияли на оценки студентов.
#юмор
Ну и тогда ещё одна история (вообще-то у меня их довольно много). Как-то я принимал так экзамен:
- кто хочет удовл. автоматом?
(часть людей получает тройки и уходит)
- кто хочет хор. автоматом?
(часть людей получает четвёрки и уходит, но уже чувствуется напряжённость, кто-то хочет получить "хор", но его останавливают друзья со словами "Ты что, не понимаешь, просто надо перетерпеть?")
А вот что было дальше я пока не скажу:)
Ну и тогда ещё одна история (вообще-то у меня их довольно много). Как-то я принимал так экзамен:
- кто хочет удовл. автоматом?
(часть людей получает тройки и уходит)
- кто хочет хор. автоматом?
(часть людей получает четвёрки и уходит, но уже чувствуется напряжённость, кто-то хочет получить "хор", но его останавливают друзья со словами "Ты что, не понимаешь, просто надо перетерпеть?")
А вот что было дальше я пока не скажу:)
#юмор
Ну и последняя история, давайте, уже из области бизнеса.
Как-то, уже очень давно, я работал в компании N. Наш CEO ждал на переговоры представителя другой компании, мы располагались на верхних этажах пафосного бизнес-центра, в назначенный час помощница руководителя спустилась и проводила представителя другой компании в переговорку, в которой его уже ждал наш CEO, они поздоровались и начали переговоры. Стенки были прозрачные и всё было видно: они шутили, о чём-то спорили и т.п. Я, проходя мимо переговорки, спросил "а с кем это беседуют?" Мне ответили, я удивился, т.к. вроде представлял, как выглядит переговорщик с их стороны - этот был не похож. Через полчаса оживлённая беседа вдруг резко завершилась, CEO и представитель спешно попрощались...
Что произошло? Оказалось, наша помощница руководителя привела не того. Она спустилась, спросила "кто на встречу?" И повела в переговорку. А он пришёл на другую встречу! Но я хохотал весь день... они беседовали полчаса! Успели рассказать о своих компаниях, обсудить условия будущего договора и т.п. В какой момент они что-то заподозрили, мне так и не сказали;)
Ну и последняя история, давайте, уже из области бизнеса.
Как-то, уже очень давно, я работал в компании N. Наш CEO ждал на переговоры представителя другой компании, мы располагались на верхних этажах пафосного бизнес-центра, в назначенный час помощница руководителя спустилась и проводила представителя другой компании в переговорку, в которой его уже ждал наш CEO, они поздоровались и начали переговоры. Стенки были прозрачные и всё было видно: они шутили, о чём-то спорили и т.п. Я, проходя мимо переговорки, спросил "а с кем это беседуют?" Мне ответили, я удивился, т.к. вроде представлял, как выглядит переговорщик с их стороны - этот был не похож. Через полчаса оживлённая беседа вдруг резко завершилась, CEO и представитель спешно попрощались...
Что произошло? Оказалось, наша помощница руководителя привела не того. Она спустилась, спросила "кто на встречу?" И повела в переговорку. А он пришёл на другую встречу! Но я хохотал весь день... они беседовали полчаса! Успели рассказать о своих компаниях, обсудить условия будущего договора и т.п. В какой момент они что-то заподозрили, мне так и не сказали;)
#новости
Поскольку мой первоначальный комментарий к этой ссылке не все посчитали корректным, оставляю только ссылку:
https://www.kommersant.ru/doc/5292131
Поскольку мой первоначальный комментарий к этой ссылке не все посчитали корректным, оставляю только ссылку:
https://www.kommersant.ru/doc/5292131
Коммерсантъ
МГУ получит 2,4 млрд руб. на изучение искусственного интеллекта
Подробнее на сайте
#новости
Есть ещё крупные мероприятия, на которые допущены россияне, например Европейская олимпиада по математике среди девушек. Кстати, если удивлены - то да, для девушек есть отдельные олимпиады по математике, хотя они, конечно, могут быть и участницами основных. Выиграли наши школьницы (из Питера и Казани): https://edu.gov.ru/press/4981/chetyre-zolotye-medali-poluchili-rossiyskie-shkolnicy-na-11-y-evropeyskoy-olimpiade-po-matematike-dlya-devushek/
Впереди международная олимпиада (интересно, допустят ли туда участников из России).
Есть ещё крупные мероприятия, на которые допущены россияне, например Европейская олимпиада по математике среди девушек. Кстати, если удивлены - то да, для девушек есть отдельные олимпиады по математике, хотя они, конечно, могут быть и участницами основных. Выиграли наши школьницы (из Питера и Казани): https://edu.gov.ru/press/4981/chetyre-zolotye-medali-poluchili-rossiyskie-shkolnicy-na-11-y-evropeyskoy-olimpiade-po-matematike-dlya-devushek/
Впереди международная олимпиада (интересно, допустят ли туда участников из России).
#новости
Начали выкладывать какие-то (я сам пока не смотрел) городские данные. Сам факт, что подобные данные выкладываются в общий доступ радует. Мэрии некоторых американских и европейских городов уже давно выкладывают, например, данные, какие преступления были совершены, когда и где. У нас пока такое невозможно представить.
https://ai.mos.ru
Начали выкладывать какие-то (я сам пока не смотрел) городские данные. Сам факт, что подобные данные выкладываются в общий доступ радует. Мэрии некоторых американских и европейских городов уже давно выкладывают, например, данные, какие преступления были совершены, когда и где. У нас пока такое невозможно представить.
https://ai.mos.ru
#видео
В прошлом году самым популярным видео на моём ютуб-канале неожиданно стал разбор данных одного Kaggle-соревнования. Возможно, это действительно интересно общественности. Поэтому я сделал разбор задачи с ещё одного соревнования, которую мы решали вместе со студентами осенью (руки не доходили, а тут я решил эту же задачу дать для студентов, которым читаю ML, заодно и записал лекцию).
Итак, никаких современных трансформеров и мультимодальности, тупо смотрим табличные данные и придумываем признаки на протяжении 1 часа:
https://youtu.be/LDSMqYSE1vI
В прошлом году самым популярным видео на моём ютуб-канале неожиданно стал разбор данных одного Kaggle-соревнования. Возможно, это действительно интересно общественности. Поэтому я сделал разбор задачи с ещё одного соревнования, которую мы решали вместе со студентами осенью (руки не доходили, а тут я решил эту же задачу дать для студентов, которым читаю ML, заодно и записал лекцию).
Итак, никаких современных трансформеров и мультимодальности, тупо смотрим табличные данные и придумываем признаки на протяжении 1 часа:
https://youtu.be/LDSMqYSE1vI
YouTube
EDA на примере соревнования MKB
Описание разведочного анализа данных соревнования МКБ.
Автор: Александр Дьяконов (https://dyakonov.org/)
Автор: Александр Дьяконов (https://dyakonov.org/)
#полезно
Вчера просматривал DS-чаты, которые обычно не особо мониторю, ответил на несколько вопросов из серии "а почему у меня этот код не работает". Сегодня утром в личку стучится рекрутер с предложением о работе (судя по общим подпискам, как раз из-за вчерашней активности - до этого никогда не стучались). Вакансия на мидла в крупной компании, вилку не называют. Но в целом, мне идея понравилась - отлавливать кандидатов в профильных чатах (не тех, кто все вопросы к политике сводят или про будущее ИИ разглагольствуют, а тех, кто что-то дельное пишет, хоть в телеграме и нет кармы). Интересно только, насколько это действенный способ?
Вчера просматривал DS-чаты, которые обычно не особо мониторю, ответил на несколько вопросов из серии "а почему у меня этот код не работает". Сегодня утром в личку стучится рекрутер с предложением о работе (судя по общим подпискам, как раз из-за вчерашней активности - до этого никогда не стучались). Вакансия на мидла в крупной компании, вилку не называют. Но в целом, мне идея понравилась - отлавливать кандидатов в профильных чатах (не тех, кто все вопросы к политике сводят или про будущее ИИ разглагольствуют, а тех, кто что-то дельное пишет, хоть в телеграме и нет кармы). Интересно только, насколько это действенный способ?
#длясправки
В машинном обучении (и много где ещё) любят аббревиатуры, интересно, когда такие аббревиатуры одновременно обозначают два разных понятия. Есть избитые примеры типа NLP (Natural Language Processing, NonLinear Programming, Neuro-Linguistic Programming), но всё таки это расшифровки из совершенно разных областей (и в ML путаницы нет), а вот несколько "внутриобластных" примеров.
SOTA – Вы, конечно, сразу подумали про State of the Art (тогда правильнее писать SotA), но есть ещё такой алгоритм Self Organizing Tree Algorithm. И самое забавное, что если Вы хотите погуглить, какой сейчас самый лучший алгоритм кластеризации, то на запрос "SOTA clustering" в гугле будет выдаваться именно этот. Неплохой маркетинговый ход;)
SGD – на ум приходит Stochastic gradient descent, но некоторые NLP-шники скажут, что есть такой набор данных Schema-Guided Dialogue dataset (SGD), в статьях и блог-постах гугла на него ссылаются как на SGD.
LDA – это классика: Latent Dirichlet Allocation и Linear Discriminant Analysis, хотя, кто в современном мире вспоминает термин "линейный дискриминантный анализ"?
Какие Вы ещё знаете "накладки" в аббревиатурах?
В машинном обучении (и много где ещё) любят аббревиатуры, интересно, когда такие аббревиатуры одновременно обозначают два разных понятия. Есть избитые примеры типа NLP (Natural Language Processing, NonLinear Programming, Neuro-Linguistic Programming), но всё таки это расшифровки из совершенно разных областей (и в ML путаницы нет), а вот несколько "внутриобластных" примеров.
SOTA – Вы, конечно, сразу подумали про State of the Art (тогда правильнее писать SotA), но есть ещё такой алгоритм Self Organizing Tree Algorithm. И самое забавное, что если Вы хотите погуглить, какой сейчас самый лучший алгоритм кластеризации, то на запрос "SOTA clustering" в гугле будет выдаваться именно этот. Неплохой маркетинговый ход;)
SGD – на ум приходит Stochastic gradient descent, но некоторые NLP-шники скажут, что есть такой набор данных Schema-Guided Dialogue dataset (SGD), в статьях и блог-постах гугла на него ссылаются как на SGD.
LDA – это классика: Latent Dirichlet Allocation и Linear Discriminant Analysis, хотя, кто в современном мире вспоминает термин "линейный дискриминантный анализ"?
Какие Вы ещё знаете "накладки" в аббревиатурах?
#новости
Результаты проверок счётной палатой МГУ и СПбГУ. Много довольно интересных цифр, причём не только по этим вузам (там есть НИОКРы ведущих вузов, в доп. документах рейтинги российских суперкомпьютеров и т.п. )
https://ach.gov.ru/checks/razvitiye-mgu-i-spbgu
Результаты проверок счётной палатой МГУ и СПбГУ. Много довольно интересных цифр, причём не только по этим вузам (там есть НИОКРы ведущих вузов, в доп. документах рейтинги российских суперкомпьютеров и т.п. )
https://ach.gov.ru/checks/razvitiye-mgu-i-spbgu
ach.gov.ru
Официальный сайт Счетной палаты Российской Федерации
#конференции
Есть такой симпатичный ресурс с докладами DS-конференций. Совсем свежих там нет, но всё равно много всего интересного (более 21 тыс. докладов и удобный интерфейс).
https://papertalk.org/
Есть такой симпатичный ресурс с докладами DS-конференций. Совсем свежих там нет, но всё равно много всего интересного (более 21 тыс. докладов и удобный интерфейс).
https://papertalk.org/
papertalk.org
Papertalk - the platform for scientific paper presentations
Papertalk is an open-source platform where scientists share video presentations about their newest scientific results - and watch, like + discuss them
Сейчас в топ-10 SuperGLUE (https://super.gluebenchmark.com/leaderboard) есть модель DeBERTa (превзошла точность человека). С каким эффектом боролись создатели её 3й версии (термин из статьи)?
Anonymous Quiz
23%
поднятие за волосы
26%
перетягивание каната
21%
замерзание конечностей
16%
стрижка налысо
14%
пожимание рук
#образование
Начался набор на лучшую во Вселенной бесплатную программу обучения в области анализа данных, регистрация по ссылке
https://ozonmasters.ru/submission
В Ozon Masters по-прежнему два направления (Data Science и Business Intelligence) с гибким набором курсов, где часть из них являются обязательными, а другие можно взять по выбору. Информацию об этапах поступления, описание курсов и требования к поступающим смотрите на нашем сайте.
🗓 14 мая (суббота) в 13.00 будет день открытых дверей. Чтобы зарегистрироваться на мероприятие - заполните форму.
Организаторы всегда на связи и рады ответить на любые вопросы - пишите на почту [email protected] или кураторам проекта (их контакты вы можете найти в соответствующем разделе на сайте).
Начался набор на лучшую во Вселенной бесплатную программу обучения в области анализа данных, регистрация по ссылке
https://ozonmasters.ru/submission
В Ozon Masters по-прежнему два направления (Data Science и Business Intelligence) с гибким набором курсов, где часть из них являются обязательными, а другие можно взять по выбору. Информацию об этапах поступления, описание курсов и требования к поступающим смотрите на нашем сайте.
🗓 14 мая (суббота) в 13.00 будет день открытых дверей. Чтобы зарегистрироваться на мероприятие - заполните форму.
Организаторы всегда на связи и рады ответить на любые вопросы - пишите на почту [email protected] или кураторам проекта (их контакты вы можете найти в соответствующем разделе на сайте).
#статьи
Подборка самых популярных статей по банковской тематике за последние 7 лет (указано число ссылок в гугл-академии).
545 ссылок, 2021 год
Dwivedi Y. K. et al. Artificial Intelligence (AI): Multidisciplinary perspectives on emerging challenges, opportunities, and agenda for research, practice and policy //International Journal of Information Management. – 2021. – Т. 57. – С. 101994.
434 ссылки, 2017 год
Xia Y. et al. A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring //Expert Systems with Applications. – 2017. – Т. 78. – С. 225-241.
235 ссылок, 2018 год
Alessi L., Detken C. Identifying excessive credit growth and leverage // Journal of Financial Stability. – 2018. – Т. 35. – С. 215-225.
206 ссылок, 2015 год
Iturriaga F. J. L., Sanz I. P. Bankruptcy visualization and prediction using neural networks: A study of US commercial banks // Expert Systems with applications. – 2015. – Т. 42. – №. 6. – С. 2857-2869.
183 ссылки, 2017 год
Abellán J., Castellano J. G. A comparative study on base classifiers in ensemble methods for credit scoring // Expert systems with applications. – 2017. – Т. 73. – С. 1-10.
153 ссылки, 2019 год
Kou G. et al. Machine learning methods for systemic risk analysis in financial sectors // Technological and Economic Development of Economy. – 2019. – Т. 25. – №. 5. – С. 716-742.
136 ссылок, 2017
Chakraborty C., Joseph A. Machine learning at central banks. – 2017.
Подборка самых популярных статей по банковской тематике за последние 7 лет (указано число ссылок в гугл-академии).
545 ссылок, 2021 год
Dwivedi Y. K. et al. Artificial Intelligence (AI): Multidisciplinary perspectives on emerging challenges, opportunities, and agenda for research, practice and policy //International Journal of Information Management. – 2021. – Т. 57. – С. 101994.
434 ссылки, 2017 год
Xia Y. et al. A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring //Expert Systems with Applications. – 2017. – Т. 78. – С. 225-241.
235 ссылок, 2018 год
Alessi L., Detken C. Identifying excessive credit growth and leverage // Journal of Financial Stability. – 2018. – Т. 35. – С. 215-225.
206 ссылок, 2015 год
Iturriaga F. J. L., Sanz I. P. Bankruptcy visualization and prediction using neural networks: A study of US commercial banks // Expert Systems with applications. – 2015. – Т. 42. – №. 6. – С. 2857-2869.
183 ссылки, 2017 год
Abellán J., Castellano J. G. A comparative study on base classifiers in ensemble methods for credit scoring // Expert systems with applications. – 2017. – Т. 73. – С. 1-10.
153 ссылки, 2019 год
Kou G. et al. Machine learning methods for systemic risk analysis in financial sectors // Technological and Economic Development of Economy. – 2019. – Т. 25. – №. 5. – С. 716-742.
136 ссылок, 2017
Chakraborty C., Joseph A. Machine learning at central banks. – 2017.