litovka.data | Data science, ML, AI
371 subscribers
23 photos
1 video
2 files
72 links
All about DATA
Data science, AI, BigData, hard skills

Здесь будут с любовью собраны🤓:

🚀Лучшие статьи
🚀Курсы, интенсивы, вебинары
🚀Конференции
🚀Хакатоны

📍по вопросам сотрудничества: @tanyalitdmit
加入频道
Читала как-то похожие статьи 😁. Надеюсь, через 10 лет мы будем ещё нужны 😂. По крайней мере, я всегда утешаю себя тем, что, если уж разобралась в математике и программировании, то разберусь в чем УГОДНО 🤪

https://habr.com/ru/company/ruvds/blog/576206/
Голосование показало, что всё-таки roadmap карьеры в DS - не так прост и прозрачен

Начинаем глубокое погружение 🤿. Планирую структурировать всё, с чем когда-либо сталкивалась я, мои коллеги, мой кот🐈

📍В инстаграм это будут:
▪️Актульное - Roadmap DS
▪️Инстаграм гид (есть отдельная вкладка, где публикации) - Roadmap DS

📍В телеграмме по хештегу #RoadMapDS

Пристегните ремни! Сегодня на ваш завтрак/обед/ужин статья с подробным описанием из чего состоят компетенции, как делать можно, но не нужно, как делать лучше и т. д. Щепотка юмора и суровой жизни DS:

https://vas3k.club/post/9904/

P. S. Все, кто проголосовал за конкретные компетенции: мат. статистика, алгоритмы и т. д. - в статье выше вы ещё раз пробежитесь по компетенциям и где их улучшать🚀
#PythonUtilits
Отличная альтернатива Jupyter Notebook - DataSpell от JetBrains
Уже успела немного потестить, любителям Jupyter за его легкость в использовании и интерактивность должно понравится (по сути тот же Jupyter,  но с дебаггером и прочими плюшками как в PyCharm)
https://www.jetbrains.com/ru-ru/dataspell/
Карьерный путь в DATA SCIENCE часть 2
#RoadmapDS

Продолжаем погружение 🤿 …. Вы уже поняли, что не обойтись без плавного движения от теории к практике:
🔺Без статистики вы полагаетесь на интуицию и палец в небе
🔺Без высшей математики не понять как работают ML алгоритмы
🔺Без основ SQL, Python в принципе нечего делать в сфере DS

Сохраняем подборку, анализируем какие курсы закроют пробелы и двигаемся к цели🎯:

🟢бесплатные (на coursera можно бесплатно просматривать специализации, но я советую потратить 5 тыс. в мес. ради проверки домашек :))
🟣платные

БАЗА:

🟢Специализация Математика для анализа данных (ВШЭ)
https://www.coursera.org/specializations/maths-for-data-analysis

🟢Математика и Python для анализа данных (Яндекс, МФТИ)
https://www.coursera.org/learn/mathematics-and-python

🟢SQL for Data Science
https://www.coursera.org/learn/sql-for-data-science

🟣Karpov.courses: Data analytics
https://karpov.courses/analytics

ML:

Junior
🟢Open Data Science - Открытый курс машинного обучения
https://habr.com/ru/company/ods/blog/322626/
https://mlcourse.ai

Junior
🟢Специализация Машинное обучение и анализ данных (Яндекс, МФТИ)
https://www.coursera.org/specializations/machine-learning-data-analysis

Junior/middle
🟢Специализация Машинное обучение: от статистики до нейросетей
https://www.coursera.org/specializations/machine-learning-from-statistics-to-neural-networks

Junior/middle/advanced
🟢Open Data Science - Course Fest #1
Серия бесплатных курсов от сообщества ODS
https://ods.ai/tracks

Junior/middle/advanced
🟣Otus
https://otus.ru/categories/data-science/

middle/advanced
🟣Karpov.courses
https://karpov.courses/ml-hard

🟣 есть еще курсы у geekbrains и skillbox, лично не общалась с теми, кто полностью проходил их и не проходила сама, поэтому не могу советовать, но ссылки вот:
https://skillfactory.ru/data-science
https://gb.ru/courses/analytics


В части 3 будет еще интересней, не переключаемся :)
ГОТОВИМСЯ К СОБЕСЕДОВАНИЯМ НА DS

- Data analysts обратите внимание на SQL, статистику + А/В тесты, если вакансия на продуктового аналитика (знания ML обычно как плюс, а не требование, bigdata опционально (где-то как требование, где-то как плюс))
- Data scientists - обратите внимание на теорию вероятности и мат. статистику, теорию ML (на пальцах уметь объяснять как работает какой-либо алгоритм, их принципиальные отличия, метрики) + помните, что чем больше кодинга и продакшена подразумевает вакансия, тем серьезнее секция с алгоритмами

HR чаще всего рассказывает вам подробно про каждый этап и вы знаете, что вас ждет на собеседовании

Чуть позже буду кидать сюда примеры заданий 🙂

Полезные статьи для подготовки к собеседованиям в Data Science:
https://tproger.ru/translations/preparing-for-data-science-interview/
https://www.tinkoff.ru/career/it/interview/ml/
https://prog-help.ru/data-science/sobesedovanie-na-vashu-pervuju-rabotu-data-scientist-om-chego-ozhidat-i-k-chemu-gotovitsja/
🤓Красота. Родной Ставрополь💜
Обещала кинуть ссылку на телеграм канал с вакансиями DS:
https://yangx.top/foranalysts

Вступайте в сообщество ODS. В slack сможете найти канал #_jobs с вакансиям (там в целом много всего полезного и интересного):
https://ods.ai/
Карьерный путь в DATA SCIENCE часть 3
#RoadmapDS

Что происходит после того, как вы подтянули математическую базу, освоили SQL, Python, ML и уже получаете опыт в индустрии?

Прокачиваемся дальше🚀:

1️⃣Изучаем глубже нейронные сети, рекомендательные системы и другие подвинутые ML и DL (DEEP LEARNING) алгоритмы

https://www.coursera.org/specializations/deep-learning
https://www.coursera.org/specializations/aml?skipBrowseRedirect=true
https://stepik.org/course/401/promo


2️⃣AutoML, MLOps
Нажимаем на кнопочку - *вжух* - прогнозы готовы - *берем печеньку*

https://www.coursera.org/specializations/machine-learning-engineering-for-production-mlops
https://www.coursera.org/learn/deploying-machine-learning-models-in-production
https://www.coursera.org/professional-certificates/preparing-for-google-cloud-machine-learning-engineer-professional-certificate
https://www.coursera.org/projects/spark-machine-learning-pipeline-python?skipBrowseRedirect=true


3️⃣BigData
Надо понимать, что биг дата - это способ хранения/обработки/распределения данных и ресурсов. С этим надо уметь работать, уметь оптимизировать расчёты, выводить в прод и т. д.

https://www.coursera.org/learn/big-data-analysis
https://stepik.org/course/150/promo


Учить всё-всё подряд и сразу нет смысла. Если вы дошли до части 3 в карьере DS, значит уже понимаете из каких частей состоит мир DS и в зависимости от работы и практики - можете сфокусироваться на конкретной области
👍1
Сегодня со студентами разбирали вопросы по статистике: что такое нормальное распределение, распределение t-Стьюдента и что такое эти мистические степени свободы...чтобы лучше понять и осознать это, можете поиграться с распределениями и со степенями свободы здесь (обратите внимание как меняется форма t-распределения в зависимости от степеней свободы):
https://gallery.shinyapps.io/dist_calc/

Тонна ссылок и полезных ресурсов по А/В тестам:
https://habr.com/ru/post/242701/
В это ВС в 12:15 ☄️
#хакатоны2021

Data Science битва 😎
P. S. Только индивидуальное участие (без команд)

https://open-data-battle.geecko.com/