Small Data Science for Russian Adventurers
11.2K subscribers
300 photos
3 videos
13 files
702 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
加入频道
#забавно
Когда-то гугл ругали за это - по запросу "CEO" в гугл-картинках выводились практически одни мужчины, а первая женщина-CEO в выдаче была Барби. Сейчас это пофиксили, но легко "взломать систему" - немного исправив запрос "CEO" добиться гендерного перекоса.
#юмор
Эту историю постоянно пересказывают, причём почти всегда сильно перевирая и добавляя деталей, которых не было (хотя, возможно, есть несколько схожих историй - но я сомневаюсь).

Ссылка на интервью с Марвином Минским: https://www.webofstories.com/play/marvin.minsky/122
#курс
У Себастьяна Рашки есть очень симпатичный вводный в DL курс. Он довольно хорошо продуман, рассчитан на относительно начальный уровень, много хорошего кода, почти все классические темы покрыты (до трансформеров), без копания в тонкости (например, нет ничего про сегментацию или детектирование объектов в CV).
https://sebastianraschka.com/blog/2021/dl-course.html
#блог
В комментариях скинули ссылку на один любопытный материал. Оказалось, что она ведёт на довольно оригинальный блог (он довольно известный, но я, например, уже больше года его не читал). По-моему, есть ещё один - аналогичный по стилю изложения и охвату тем (а может, просто у этого дизайн поменялся). Давайте его порекламируем (но мне читать материалы оттуда почему-то сложно):
https://www.gwern.net/
#курс
В эту пятницу стартует курс OzonMasters по Продуктовой аналитике от Кирилла Кочнева (https://koch-kir.medium.com/). В отличии от большинства курсов OzonMasters этот курс открыт для всех!
Если Вы
- хотите прослушать курс,
- знаете python,
- знаете статистику хотя бы на базовом уровне,
- хотите развиваться в роли аналитика данных/бизнес-аналитика
пишите на [email protected] до четверга (24 февраля) включительно или заполните короткую регистрационную форму
https://forms.gle/pXyyNpyskyHr8p2W9

Программа курса:
Блок Введение
Занятие 1: Зачем нужна аналитика, виды аналитиков
Занятие 2: Метрики
Блок по БД
Занятие 3: Зачем нужны БД и какие они бывают
Занятие 4: Введение в SQL
Занятие 5: Типы данных, подзапросы и view
Занятие 6: Оконные функции и оптимизация запросов
Занятие 7: Фишки Clickhouse
Занятие 8: Типичные задачи в аналитике
Блок по фреймворкам:
Занятие 9: сегментация, RFM-анализ
Занятие 10: экономика продукта, Когорты, LTV
Блок по визуализации:
Занятие 11: Инструменты визуализации, Tableau
Занятие 12: Представление результатов работы
Занятие 13: Airflow
#образование
Сейчас в аспирантурах страны будет использоваться новая номенклатура специальностей, по которым можно защищать диссертации. Она стала более современной, например, появился раздел 1.2 "Компьютерные науки и информатика", в котором есть специальность 1.2.1 "Искусственный интеллект и машинное обучение". Раньше у всех, кто занимался машинным обучением были проблемы с тем, по какой специальности защищаться. Теперь её нет.

Из интересного, есть и раздел 5.11. "Теология" (почему-то соседний с когнитивными науками) и три специальности, оказывается, теология может быть теоретической, исторической и практической;)

https://vak.minobrnauki.gov.ru/uploader/loader?type=1&name=91506173002&f=7892
#книга
Питер Брайан  Медавар «Советы молодому ученому»
Классика - книга о науке, в форме монолога о разных аспектах научной деятельности (где взять задачу, что такое публичность в науке, этика ссылок на первоисточники, какие бывают эксперименты и многое другое). Все вещи довольно простые, но собраны в одном месте и написаны хорошим языком.
#интересно
Довольно любопытный график. Чемпион до-глубокого периода (если измерять во FLOP-сах) – решение задачи на конкурсе Netflix (это к вопросу, что нельзя было просто так взять и выиграть). Чемпион глубокого – GloVe (никогда не подумал бы). А текущего чемпиона попробуем угадать в голосовалке ниже...
Оригинал здесь. Смотреть после голосования;)
#ссылка
Агрегатор блог-постов по языку Julia:
https://www.juliabloggers.com/
#интересно
Появилась тенденция кроме своего резюме на персональный сайт выкладывать ещё и развёрнутое описание научных интересов. Иногда его оформляют в виде статьи:
https://epsilon-lee.github.io/static/Research_Interests_and_Statement_glli2020.pdf
#диссертация
Вот все боятся ликов, а некоторые с их помощью научные степени получают;) А хорошая тема, между прочим!
Tribhuvanesh Orekondy "Understanding and controlling leakage in machine learning"
https://publikationen.sulb.uni-saarland.de/bitstream/20.500.11880/30989/1/dissertation_final.pdf
#полезно
Для МГУшников…
МГУ и Яндекс предлагают возможность завести почтовый ящик в домене @my.msu.ru, доступ к Яндекс.диску объемом 1 Тб без рекламы, Онлайн-редактору документов, Календарю, Мессенджеру, cистеме видеоконференции связи Телемост для ведения семинарских занятий.
https://my.msu.ru
#юмор
Раз сегодня 1 апреля, то надо что-нибудь "весёлое" рассказать...
Я несколько лет подряд в начале обучения магистратуры ММП ВМК МГУ устраивал тест по машинному обучению: где-то порядка 50 вопросов, не очень сложных, на совершенно разные темы ML (чтобы понять, а что поступившие магистры знают). В каждом вопросе надо было выбрать один из 4х ответов. А ещё в каждом вопросе правильным был второй ответ. За 4 года моих экспериментов с тестом никто не нашёл закономерности (т.е. не "обучился"), хотя все в среднем хорошо отвечали (почти все больше 50% вопросов правильно, а четверть около 80% правильно).

А ещё я когда-то делал тесты с вопросами, на которые не было правильного ответа... но это уже другая история;)
На всякий случай, все описанные здесь тесты несли исследовательский характер и не влияли на оценки студентов.
#юмор
Ну и тогда ещё одна история (вообще-то у меня их довольно много). Как-то я принимал так экзамен:
- кто хочет удовл. автоматом?
(часть людей получает тройки и уходит)
- кто хочет хор. автоматом?
(часть людей получает четвёрки и уходит, но уже чувствуется напряжённость, кто-то хочет получить "хор", но его останавливают друзья со словами "Ты что, не понимаешь, просто надо перетерпеть?")

А вот что было дальше я пока не скажу:)
#юмор
Ну и последняя история, давайте, уже из области бизнеса.
Как-то, уже очень давно, я работал в компании N. Наш CEO ждал на переговоры представителя другой компании, мы располагались на верхних этажах пафосного бизнес-центра, в назначенный час помощница руководителя спустилась и проводила представителя другой компании в переговорку, в которой его уже ждал наш CEO, они поздоровались и начали переговоры. Стенки были прозрачные и всё было видно: они шутили, о чём-то спорили и т.п. Я, проходя мимо переговорки, спросил "а с кем это беседуют?" Мне ответили, я удивился, т.к. вроде представлял, как выглядит переговорщик с их стороны - этот был не похож. Через полчаса оживлённая беседа вдруг резко завершилась, CEO и представитель спешно попрощались...

Что произошло? Оказалось, наша помощница руководителя привела не того. Она спустилась, спросила "кто на встречу?" И повела в переговорку. А он пришёл на другую встречу! Но я хохотал весь день... они беседовали полчаса! Успели рассказать о своих компаниях, обсудить условия будущего договора и т.п. В какой момент они что-то заподозрили, мне так и не сказали;)
#новости
Поскольку мой первоначальный комментарий к этой ссылке не все посчитали корректным, оставляю только ссылку:
https://www.kommersant.ru/doc/5292131
#юмор
На выходные - лучшее объяснение, что такое полный граф
(автора не знаю)