litovka.data | Data science, ML, AI
372 subscribers
23 photos
1 video
2 files
72 links
All about DATA
Data science, AI, BigData, hard skills

Здесь будут с любовью собраны🤓:

🚀Лучшие статьи
🚀Курсы, интенсивы, вебинары
🚀Конференции
🚀Хакатоны

📍по вопросам сотрудничества: @tanyalitdmit
加入频道
Перехожу на подкасты🎧. Книги читать в моем положении всё тяжелее, а вот подкасты под часовые прогулки с сыном 👍🏼.

https://music.yandex.ru/album/13299622?utm_medium=copy_link

Делюсь ссылкой на YaTalks 2022. IT - марафон Яндекса, который был в декабре. Полезно не только разработчикам, но и всем, кто хоть как-то причастен/интересуется it сферой, важно понимать что происходит и держать руку на пульсе 😜
🔥8👍3
💻Возникла необходимость работать с большим датасетом (около 300 млн строк).
Привыкла я конечно же к рабочей инфраструктуре, но пришло время что-то придумать для ML без рабочей инф-ры

И так, 2 проблемы, с которыми я столкнулась:
🆘У меня макбук air и надо придумать где делать ML штуки и не потратить много денег

Google Colab - вообще фигня (бесплатный лимит очень низкий)
Kaggle - более менее тянет, но иногда падает
Яндекс еще не пробовала, пока держусь за бесплатный Kaggle

Делитесь в комментариях где вы юзаете ML/DL?

🆘Оптимизация работы
Нашла крутую бибилиотеку polars, которая работает в разы быстрее pandas
Статья на хабре про нее: https://habr.com/ru/post/710240/
И на towardsdatascience: https://towardsdatascience.com/pandas-vs-polars-a-syntax-and-speed-comparison-5aa54e27497e
🤔2
И еще одна интересная конференция этой весны🤓

Data Fusion 2023 — это точка сближения науки и бизнеса. Конференция будет полезна разработчикам и специалистам в области Data Science, CDO, бизнес-заказчикам DS-продуктов и сервисов, представителям государства и науки.

Первый день конференции будет посвящен аспектам управления данными, практикам перехода на доверенные технологии, доступности дата-сетов для ИИ и другим темам, актуальным для CDO и руководителей бизнес-подразделений.

Программа 14 апреля адресована data science специалистам и исследователям. Темы докладов и сессий распределены по трем стримам. «ML+» для тех, кто мыслит за рамками ML, тут представлены темы ML+Physics, диффузионные модели, мультимодальный ML. В стриме «AI Classic» темы от NLP до рекомендательных систем, третий стрим — «ML Environment» — объединит такие темы как MLops, инструменты open source, новые технологии передачи данных.

Участие в конференции бесплатное. Необходима регистрация.
https://data-fusion.ru/conference
👍2🔥21👌1
Недавно я спрашивала у вас какой контент интересует больше всего + по своему менторскому опыту заметила, что многим не хватает хорошей базы скриптов - примеров (я про python, sql)

Надеюсь, что однажды смогу собрать свой сундучок на гитхабе, но есть ведь Kaggle!!!!! 🤍

Я почему-то была уверена, что про него все знают с самого первого дня, когда начинают интересоваться сферой data science. Но нет!)

Рассказываю:
Kaggle - это платформа, на которой размещают ML/DL соревнования. И не просто платформа, а комьюнити DS специалистов со всего мира. Там есть система рейтинга (самый высокий уровень - grand master), вы запросто сможете найти крутых спецов и посмотреть их открытые решения.

Чтобы найти скрипт - перейдите в раздел “Code”. Можно пройтись по рейтинговым публикациям или найти что-то точечно (например: конкретная задача, пайплайны и т. д.)

Там же можно найти классные датасеты для ваших pet-projects!)

https://www.kaggle.com/notebooks
🔥91👍1😱1
Там, кстати, есть и бесплатные курсы! 🔥 (раздел Learn)
👌7
litovka.data | Data science, ML, AI
Вдруг вы не знаете чем заняться 1 апреля😁 (уже следующая суббота) https://techtrain.ru/
Не люблю начинать неделю с чего-то сложного 😁👌🏼. Поэтому, планирую сегодня досмотреть/дослушать выступления спикеров, которые не удалось в субботу (там есть в записи + презентация). Если совсем нет времени, то хотя бы скачайте презентации, темы стоящие 🔥
🔥3
Где решать задачи на Python 🐍?

И так, основы Python пройдены, а может и не только основы 👀. Значит, пора тренироваться!)

Вот где это можно сделать:
📌Питонтьютор
📌 Школа программиста
📌 Wiki: Volumes - CodeAbbey
📌 py.CheckiO - Python coding challenges and exercises with solutions for beginners and advanced
📌 HackerRank - Online Coding Tests and Technical Interviews
📌 Codewars - Achieve mastery through coding practice and developer mentorship

Небольшое пояснение для новичков:
Решение задач НЕ равно алгоритмической секции на собеседовании (для неё есть отдельные ресурсы для практики, хотя на некоторых из тех, которые я перечислила алгоритмы тоже есть)

Решение задач в первую очередь нужно для:
✔️практики на python
✔️практики основ программирования
✔️подготовки к собеседованиям (задачи могут давать аналитикам данных, DS-ам в том числе, всегда уточняйте у hr что будет на собеседовании, чтобы подготовиться. Всё зависит от требований: где-то дают и на python, и на sql, где-то по желанию, где-то только sql/python)
🔥8👍5🕊2
Новинки моей домашней библиотеки 📚

Соскучилась по такому формату, электронные книги конечно must have, но мистическим образом чаще всего я дочитываю именно печатный формат. Скорее всего потому что всегда перед глазами и мне нравится делать заметки, закладки.

P. S. Планирую в Notion завести страницу с книгами и делать заметки. Раньше я делала это в заметках телефона, но не всегда и некоторые пропали (не все выгрузились, когда меняла телефон)…
P. S. S. Готова петь оды этому ноушену. 👀🌟🙌🏼 Потрясающее приложение абсолютно для всего: заметки, планирование, чек-листы и пр.

А вам какой формат чтения ближе? Делаете заметки? Используете их потом?
🔥132👍2
☄️Data Fest Online 2023
Ежегодное мероприятие сообщества Open Data Science
Даты феста: с 20 мая по 4 июня – 2 недели и 3 пары выходных

https://ods.ai/events/datafestonline2023
👏4🔥2
26 апреля 2023г - бесплатная онлайн-конференция DataStart по Data Science, машинному обучению и нейросетям. Скорей регистрируйтесь - https://clck.ru/34Etzn!

Более 1000 участников, крутой состав спикеров, возможность задавать вопросы, найти ментора и многое другое. 🔥

Для кого:
- Data Scientist, Data Analyst и Data Engineer
- Computer Vision Engineer и NLP Engineer
- Machine Learning Engineer
- Руководителям бизнеса
- Все, кто так или иначе связан с большими данными.

Мероприятие предназначено для обучения и вдохновения – создано для людей, увлеченных большими данными и исследованием данных. Ждем вас с нетерпением!

Что вас ждет на конференции?
— Только спикеры-практики, готовые делиться своими знаниями с вами.
— Подробные кейсы без воды с конкретными результатами.
— Обмен опытом, контактами и просто неформальное общение.
— Мощное открытое комьюнити, где люди говорят на одном языке

Встречаемся 26 апреля - https://clck.ru/34Etzn
🔥2👌1
Недавно заказала мерч в SATOSHI
Была в полном восторге от качества и стиля худи и шоппера💯

У меня уже был негативный опыт с другой компанией, поэтому была очень рада найти бренд, где наши ценности совпадают:

📌SATOSHI делают кастомизированный мерч, в котором ходят сотрудники известных айти компаний. 
📌Делают не просто бесплатный дизайн, а создают концептуальные и интересные решения для каждого клиента.
Кейсы можно посмотреть в их аккаунте👌
📌Перед оформлением заказа отправляют образцы, чтобы клиент мог оценить качество ткани, фурнитуры, посадку. Satoshi сами разрабатывают модели и реализовывают любые пожелания, если это технически возможно.

И вам от меня подарок🎁

По промокоду litovka.data при заказе получайте в подарок фирменный шоппер Satoshi для каждого сотрудника
https://satoshibrand.studio/
🔥43