litovka.data | Data science, ML, AI
371 subscribers
23 photos
1 video
2 files
72 links
All about DATA
Data science, AI, BigData, hard skills

Здесь будут с любовью собраны🤓:

🚀Лучшие статьи
🚀Курсы, интенсивы, вебинары
🚀Конференции
🚀Хакатоны

📍по вопросам сотрудничества: @tanyalitdmit
加入频道
Обещала кинуть ссылку на телеграм канал с вакансиями DS:
https://yangx.top/foranalysts

Вступайте в сообщество ODS. В slack сможете найти канал #_jobs с вакансиям (там в целом много всего полезного и интересного):
https://ods.ai/
Карьерный путь в DATA SCIENCE часть 3
#RoadmapDS

Что происходит после того, как вы подтянули математическую базу, освоили SQL, Python, ML и уже получаете опыт в индустрии?

Прокачиваемся дальше🚀:

1️⃣Изучаем глубже нейронные сети, рекомендательные системы и другие подвинутые ML и DL (DEEP LEARNING) алгоритмы

https://www.coursera.org/specializations/deep-learning
https://www.coursera.org/specializations/aml?skipBrowseRedirect=true
https://stepik.org/course/401/promo


2️⃣AutoML, MLOps
Нажимаем на кнопочку - *вжух* - прогнозы готовы - *берем печеньку*

https://www.coursera.org/specializations/machine-learning-engineering-for-production-mlops
https://www.coursera.org/learn/deploying-machine-learning-models-in-production
https://www.coursera.org/professional-certificates/preparing-for-google-cloud-machine-learning-engineer-professional-certificate
https://www.coursera.org/projects/spark-machine-learning-pipeline-python?skipBrowseRedirect=true


3️⃣BigData
Надо понимать, что биг дата - это способ хранения/обработки/распределения данных и ресурсов. С этим надо уметь работать, уметь оптимизировать расчёты, выводить в прод и т. д.

https://www.coursera.org/learn/big-data-analysis
https://stepik.org/course/150/promo


Учить всё-всё подряд и сразу нет смысла. Если вы дошли до части 3 в карьере DS, значит уже понимаете из каких частей состоит мир DS и в зависимости от работы и практики - можете сфокусироваться на конкретной области
👍1
Сегодня со студентами разбирали вопросы по статистике: что такое нормальное распределение, распределение t-Стьюдента и что такое эти мистические степени свободы...чтобы лучше понять и осознать это, можете поиграться с распределениями и со степенями свободы здесь (обратите внимание как меняется форма t-распределения в зависимости от степеней свободы):
https://gallery.shinyapps.io/dist_calc/

Тонна ссылок и полезных ресурсов по А/В тестам:
https://habr.com/ru/post/242701/
В это ВС в 12:15 ☄️
#хакатоны2021

Data Science битва 😎
P. S. Только индивидуальное участие (без команд)

https://open-data-battle.geecko.com/
Вчера в прямом эфире говорила про эти сайты:

- сообщество open data science
https://ods.ai

- changellenge (следите за мероприятиями, IT кейсами, которые периодически выкладывают компании, предложениями о стажировках и т. д.)
https://changellenge.com/event/
#хакатоны2021

Приглашаем принять участие в двух онлайн соревнованиях - Wildhack от международного интернет-магазина Wildberries и BCS Coding Days от «БКС Мир инвестиций», которые проводятся при поддержке Технопарка «Сколково».

https://hack.wildberries.ru/
https://bcscd.sk.ru/
Завтра в 20:00 проведу вебинар "Все, что вы хотите знать про DATA SCIENCE"
Ссылка на зум конференцию придет на указанный e-mail за 1 час до события

https://litovkadata.timepad.ru/event/1827873/
Бибилиотеки Python, о которых должен знать каждый DS 🤓


Pandas: работа с данными (анализ, обработка, работа с csv/excel)
https://pandas.pydata.org

NumPy: работа с массивами, матрицами
https://numpy.org

SciPy: предназначенная для выполнения научных и инженерных расчётов, оптимизационных задач, стат. тестов
https://scipy.org

Statsmodels: позволяет исследовать данные, оценивать статистические модели и выполнять статистические тесты
https://www.statsmodels.org/stable/index.html

Matplotlib, Seaborn, Plotly, Bokeh: визуализация данных
https://matplotlib.org
https://seaborn.pydata.org
https://plotly.com/python/
https://bokeh.org

Scikit-learn, LightGBM, XGBoost, Catboost, prophet: Машинное обучение

https://scikit-learn.org/stable/
https://lightgbm.readthedocs.io/en/latest/
https://xgboost.readthedocs.io/en/latest/
https://catboost.ai
https://facebook.github.io/prophet/docs/quick_start.html

TensorFlow, Keras, PyTorch: Deep Learning
https://www.tensorflow.org/learn
https://keras.io
https://pytorch.org

Shap, Lime, Yellowbrick: Интерпретация ML
https://shap.readthedocs.io/en/latest/index.html
https://lime-ml.readthedocs.io/en/latest/
https://www.scikit-yb.org/en/latest/