💻 Улучшаем навыки программирования!
💬 Уже занимаюсь DS наверное лет 10, еще с тех пор когда слова "Data Science" даже не употреблялись. И, как мне видится, за все это время мало что изменилось с точки зрения написания кода - сложно читаемый, не воспроизводимый и непригодный для использования в production-системах. Кроме этого выявляются многочисленные проблемы, такие как нарушение логики, лики, ошибки реализации тех или иных функций которые в конечном счете влияют на результат.
💬 Хочу поговорить о том как можно улучшить свои скилы в плане написания production ready кода.
Ниже представлены несколько ресурсов, которые помогут систематизировать информацию, понять текущие пробелы в знаниях и начать их изучение:
1⃣ https://goodresearch.dev/
Сайт с базовыми знаниями о том как создавать и вести любой научный проект. От создания структуры проекта, работы с git, написание кода, документации, тестов и т.д. Кратко, понятно, а главное все по делу. Где нужно - есть дополнительные ссылки с более детальной информацией.
В общем если вы видели в своей жизни только jupyter notebook и не знаете с чего начать более сложный проект - начните с этого сайта.
2⃣ https://refactoring.guru/
Паттерны проектирования - нужно знать. Вы же на python код пишите все-таки. Кроме этого есть отдельный раздел по рефакторингу кода, который содержит типичные ошибки при написании кода и принципы которые помогут избегать их.
У меня сложная история с изучением этого материала, связанная с написанием проекта по парсингу документов судебных решений. История полная боли, ошибок, самоосознания насколько фиговый код я пишу, и в итоге - переписыванием кода с нуля, причем 2 или 3 раза. После переработки, код стал чище, понятнее, а главное - можно было легко его доработать.
Мой совет - изучите тему, даже если не все запомните, при реализации проекта вам будут приходить правильные мысли и возможно не потратите уйму времени на переписывание собственного кода.
3⃣ Lott Phillips - Python Object Oriented Programming 4th Edition (2021, Packt)
ООП в python. Конечно я считаю, что посмотрев 2 скринкаста ниже можно основную информацию подчерпнуть сразу потратив всего 2 часа
https://www.youtube.com/watch?v=r1Y7m5bB7l8
https://www.youtube.com/watch?v=Eetg5HIxNow
Прочитать книгу все равно рекомендую если вы хотите улучшить свои хард скилы
4⃣ Luciano Ramalho - Fluent Python- Clear, Concise, and Effective Programming (2022, O'Reilly Media)
Думаю эта книга станет отличным дополнением для людей которые уже знают python и хотят узнать что-то новое. Там с первых строк будет понятно, что книга не для новичка - concurrency, async, метапрограммирование, датаклассы, ООП, функции, структуры данных. Вас ждет погружение в мир Python на максималках
🧑💻 Напишите в комментах свои рекомендации и чем вы пользовались
💬 Уже занимаюсь DS наверное лет 10, еще с тех пор когда слова "Data Science" даже не употреблялись. И, как мне видится, за все это время мало что изменилось с точки зрения написания кода - сложно читаемый, не воспроизводимый и непригодный для использования в production-системах. Кроме этого выявляются многочисленные проблемы, такие как нарушение логики, лики, ошибки реализации тех или иных функций которые в конечном счете влияют на результат.
💬 Хочу поговорить о том как можно улучшить свои скилы в плане написания production ready кода.
Ниже представлены несколько ресурсов, которые помогут систематизировать информацию, понять текущие пробелы в знаниях и начать их изучение:
1⃣ https://goodresearch.dev/
Сайт с базовыми знаниями о том как создавать и вести любой научный проект. От создания структуры проекта, работы с git, написание кода, документации, тестов и т.д. Кратко, понятно, а главное все по делу. Где нужно - есть дополнительные ссылки с более детальной информацией.
В общем если вы видели в своей жизни только jupyter notebook и не знаете с чего начать более сложный проект - начните с этого сайта.
2⃣ https://refactoring.guru/
Паттерны проектирования - нужно знать. Вы же на python код пишите все-таки. Кроме этого есть отдельный раздел по рефакторингу кода, который содержит типичные ошибки при написании кода и принципы которые помогут избегать их.
У меня сложная история с изучением этого материала, связанная с написанием проекта по парсингу документов судебных решений. История полная боли, ошибок, самоосознания насколько фиговый код я пишу, и в итоге - переписыванием кода с нуля, причем 2 или 3 раза. После переработки, код стал чище, понятнее, а главное - можно было легко его доработать.
Мой совет - изучите тему, даже если не все запомните, при реализации проекта вам будут приходить правильные мысли и возможно не потратите уйму времени на переписывание собственного кода.
3⃣ Lott Phillips - Python Object Oriented Programming 4th Edition (2021, Packt)
ООП в python. Конечно я считаю, что посмотрев 2 скринкаста ниже можно основную информацию подчерпнуть сразу потратив всего 2 часа
https://www.youtube.com/watch?v=r1Y7m5bB7l8
https://www.youtube.com/watch?v=Eetg5HIxNow
Прочитать книгу все равно рекомендую если вы хотите улучшить свои хард скилы
4⃣ Luciano Ramalho - Fluent Python- Clear, Concise, and Effective Programming (2022, O'Reilly Media)
Думаю эта книга станет отличным дополнением для людей которые уже знают python и хотят узнать что-то новое. Там с первых строк будет понятно, что книга не для новичка - concurrency, async, метапрограммирование, датаклассы, ООП, функции, структуры данных. Вас ждет погружение в мир Python на максималках
🧑💻 Напишите в комментах свои рекомендации и чем вы пользовались
goodresearch.dev
The Good Research Code Handbook
This handbook is for grad students, postdocs and PIs who do a lot of programming as part of their research. It will teach you, in a practical manner, how to organize your code so that it is easy to understand and works reliably.
Forwarded from Reliable ML
Секция Career от Reliable ML на Data Fest 2024
25 мая в офисе VK, Москва
Всем привет!
Есть у нас с Димой такая традиция, каждый год в конце мая мы организуем секцию Reliable ML на Data Fest. А в этом году делаем аж три секции.
А все почему? Потому что очень много крутых докладов. Приходите послушать и обсудить!
Публикуем расписание секции Карьера, которая пройдет 25 мая офлайн в офисе VK в Москве.
Сначала поговорим с вами о рынке труда и карьерных вопросах со стороны работника/кандидата, а потом - со стороны руководителей команд.
Регистрация на площадку на 25 мая тут.
В этот же день после обеда будет вторая наша офлайн секция - Data Strategy. Расписание опубликуем чуть позже.
Ваш @Reliable ML
#datafest #offline #ods #career #reliable_ml #business
25 мая в офисе VK, Москва
Всем привет!
Есть у нас с Димой такая традиция, каждый год в конце мая мы организуем секцию Reliable ML на Data Fest. А в этом году делаем аж три секции.
А все почему? Потому что очень много крутых докладов. Приходите послушать и обсудить!
Публикуем расписание секции Карьера, которая пройдет 25 мая офлайн в офисе VK в Москве.
Сначала поговорим с вами о рынке труда и карьерных вопросах со стороны работника/кандидата, а потом - со стороны руководителей команд.
Регистрация на площадку на 25 мая тут.
В этот же день после обеда будет вторая наша офлайн секция - Data Strategy. Расписание опубликуем чуть позже.
Ваш @Reliable ML
#datafest #offline #ods #career #reliable_ml #business
Друг из сообщества написал статью о том как начать работать с GNN для временных рядов. В комментариях можно найти ссылки на статьи, книги, доки. 👏
Лайк, репост статьи приветствуются 👍
https://www.linkedin.com/posts/nikita-iserson_graphneuralnetworks-gnn-timeseriesforecasting-activity-7199312050571866113-kImK
Так же у нас есть чатик для обсуждения графов
https://yangx.top/sberlogawithgraphs на случай если вы захотите в эту тему погрузиться и нужна будет помощь 💪
Лайк, репост статьи приветствуются 👍
https://www.linkedin.com/posts/nikita-iserson_graphneuralnetworks-gnn-timeseriesforecasting-activity-7199312050571866113-kImK
Так же у нас есть чатик для обсуждения графов
https://yangx.top/sberlogawithgraphs на случай если вы захотите в эту тему погрузиться и нужна будет помощь 💪
Linkedin
#graphneuralnetworks #gnn #timeseriesforecasting #ml #ai #machinelearning… | Nikita I. | 22 comments
🔍 How to Start with Graph Neural Networks for Time Series Forecasting❓
📈 As Large Language Models continue to evolve, there are many debates about whether… | 22 comments on LinkedIn
📈 As Large Language Models continue to evolve, there are many debates about whether… | 22 comments on LinkedIn
Уже не новость, что
Docker hub перестал работать в России
И сразу же начали появляться зеркала, чтобы все работало, например
🤣
А вот чего я еще не встречал, так это российские аналоги докера:
Коробки — российский аналог Docker
Ну что, на Коробки переходим?🤣
Docker hub перестал работать в России
И сразу же начали появляться зеркала, чтобы все работало, например
хуёкер.io
В принципе какое решение, такое и названиеА вот чего я еще не встречал, так это российские аналоги докера:
Коробки — российский аналог Docker
Ну что, на Коробки переходим?
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
Docker hub перестал работать в России
При открытии сайта появляется надпись: 403 Forbidden Since Docker is a US company, we must comply with US export control regulations. In an effort to comply with these, we now block all IP addresses...
Подборка статей от друга сообщества
Лайк, репост статьи приветствуются 👍
🔍 How to Detect Causal Lead-Lag Relationship in Multivariate Time-Series❓
https://www.linkedin.com/posts/nikita-iserson_causality-leadlag-finance-activity-7201121191581900800-P9Qa
про lead-lag зависимости во временных рядах
🔍 Large Language Models for Alternative Financial Data Extraction❓
https://www.linkedin.com/posts/nikita-iserson_topicmodeling-namedentityrecognition-relationextraction-activity-7208718110554566656-5Owl
про всякие последние подходы / библиотеки экстракции финансовых данных из текста (NER, REL, ABSA) с помощью LLM.
🔍 How to Avoid Overfitting and Spurious Correlations with Domain Knowledge?❓
https://www.linkedin.com/posts/nikita-iserson_benignoverfitting-spuriouscorrelations-domainknowledge-activity-7202199071636307969-t8oR
про монотонные ограничения в разных типах моделей, упомянул AutoWOE
Лайк, репост статьи приветствуются 👍
🔍 How to Detect Causal Lead-Lag Relationship in Multivariate Time-Series❓
https://www.linkedin.com/posts/nikita-iserson_causality-leadlag-finance-activity-7201121191581900800-P9Qa
про lead-lag зависимости во временных рядах
🔍 Large Language Models for Alternative Financial Data Extraction❓
https://www.linkedin.com/posts/nikita-iserson_topicmodeling-namedentityrecognition-relationextraction-activity-7208718110554566656-5Owl
про всякие последние подходы / библиотеки экстракции финансовых данных из текста (NER, REL, ABSA) с помощью LLM.
🔍 How to Avoid Overfitting and Spurious Correlations with Domain Knowledge?❓
https://www.linkedin.com/posts/nikita-iserson_benignoverfitting-spuriouscorrelations-domainknowledge-activity-7202199071636307969-t8oR
про монотонные ограничения в разных типах моделей, упомянул AutoWOE
Linkedin
#causality #leadlag #finance #marketreasearch #sentimentanalysis… | Nikita I. | 23 comments
🔍 How to Detect Causal Lead-Lag Relationship in Multivariate Time-Series❓
📈 Large Language Models have opened many new opportunities for extracting signals from alternative data (news, earning calls, investment research, financial events). At the same time…
📈 Large Language Models have opened many new opportunities for extracting signals from alternative data (news, earning calls, investment research, financial events). At the same time…
Forwarded from AIRI Institute
Открыт прием заявок на Лето с AIRI!⚡️
В этом году мы запускаем Школу совместно с Передовой Инженерной Школой ИТМО. Программа пройдет в Санкт-Петербурге с 20 по 30 августа.
🗓 Подать заявку можно по ссылке до 23:59 14 июля 2024 года.
Школа включает в себя лекции, семинары и практическую работу по направлениям:
— Мультимодальные архитектуры и генеративный ИИ в промышленности
— Модели воплощенного ИИ и обучение с подкреплением в робототехнике
— Искусственный интеллект и химия
— Доверенный искусственный интеллект
📍Питание, обучение и проживание бесплатное, оплатить самим нужно будет только проезд.
Подавайте заявки и делитесь постом с друзьями и коллегами!
В этом году мы запускаем Школу совместно с Передовой Инженерной Школой ИТМО. Программа пройдет в Санкт-Петербурге с 20 по 30 августа.
🗓 Подать заявку можно по ссылке до 23:59 14 июля 2024 года.
Школа включает в себя лекции, семинары и практическую работу по направлениям:
— Мультимодальные архитектуры и генеративный ИИ в промышленности
— Модели воплощенного ИИ и обучение с подкреплением в робототехнике
— Искусственный интеллект и химия
— Доверенный искусственный интеллект
📍Питание, обучение и проживание бесплатное, оплатить самим нужно будет только проезд.
Подавайте заявки и делитесь постом с друзьями и коллегами!
Кейсы ML system design
📖 На прошлой неделе провёл занятие со студентами шад мтс по кейсам ml system design. Тема была очень интересной, и мне даже понравилось в новой роли! В будущем обязательно расскажу об этом опыте подробнее.
🔍 Кстати, если вы планируете проходить собеседование на позицию специалиста по Data Science, то вам точно стоит разобраться в этой теме. Вот несколько причин, почему:
1️⃣ Вы узнаете разные подходы к решению задач (рексис, поиск, прайсинг). Это поможет вам поддержать разговор на собеседовании в соответствующую команду и ответить на вопросы.
2️⃣ Систематизация
Все ML системы строятся по определённому паттерну, и важно понимать, с чего начинать работу над проектом.
3️⃣ Новые знания
Разбираться в том, как работают другие команды, всегда интересно и полезно. Даже если вы никогда не будете заниматься поиском, всё равно стоит узнать, как решают проблемы в их отрасли
✅️ В общем, перед собеседованием посмотрите несколько кейсов ml system design, которые касаются команды куда идете и читайте больше литературы по этому вопросу.
Успехов на собеседовании!
📖 На прошлой неделе провёл занятие со студентами шад мтс по кейсам ml system design. Тема была очень интересной, и мне даже понравилось в новой роли! В будущем обязательно расскажу об этом опыте подробнее.
🔍 Кстати, если вы планируете проходить собеседование на позицию специалиста по Data Science, то вам точно стоит разобраться в этой теме. Вот несколько причин, почему:
1️⃣ Вы узнаете разные подходы к решению задач (рексис, поиск, прайсинг). Это поможет вам поддержать разговор на собеседовании в соответствующую команду и ответить на вопросы.
2️⃣ Систематизация
Все ML системы строятся по определённому паттерну, и важно понимать, с чего начинать работу над проектом.
3️⃣ Новые знания
Разбираться в том, как работают другие команды, всегда интересно и полезно. Даже если вы никогда не будете заниматься поиском, всё равно стоит узнать, как решают проблемы в их отрасли
✅️ В общем, перед собеседованием посмотрите несколько кейсов ml system design, которые касаются команды куда идете и читайте больше литературы по этому вопросу.
Успехов на собеседовании!
❤️
https://job.mts.ru/vacancies
А тут можно наши вакансии
посмотреть.
В поиске вбить data scientist и выбрать продуктовый блок = BigData
https://job.mts.ru/vacancies
А тут можно наши вакансии
посмотреть.
В поиске вбить data scientist и выбрать продуктовый блок = BigData
В России можно посещать IT-мероприятия хоть каждый день: как оффлайн, так и онлайн
Жаль только, что нет никакой единой "базы" ивентов. Чтобы заглянул -> увидел все что есть -> выбрал -> пошел. Или все-таки есть?
🔥 Смотрите: мы нашли канал, в котором публикуют ВООБЩЕ ВСЕ анонсы вебинаров, хакатонов, конференций, мастер-классов, ивентов от гигантов индустрии и лучших специалистов по кодингу, дизайну, аналитике и т.д.
В общем, очень кайфовая вещь: здесь вы точно не пропустите ничего важного и интересного.
Подпишитесь, чтобы не потерять: IT-мероприятия России / ITMeeting / IT events
Жаль только, что нет никакой единой "базы" ивентов. Чтобы заглянул -> увидел все что есть -> выбрал -> пошел. Или все-таки есть?
🔥 Смотрите: мы нашли канал, в котором публикуют ВООБЩЕ ВСЕ анонсы вебинаров, хакатонов, конференций, мастер-классов, ивентов от гигантов индустрии и лучших специалистов по кодингу, дизайну, аналитике и т.д.
В общем, очень кайфовая вещь: здесь вы точно не пропустите ничего важного и интересного.
Подпишитесь, чтобы не потерять: IT-мероприятия России / ITMeeting / IT events
workshop on building AI agents
Details: https://sites.google.com/princeton.edu/agents-workshop
Register for Zoom link: https://docs.google.com/forms/d/e/1FAIpQLSduu6kgktlLZOJ1j3Vivh3Ip9wW8IiEICMri0xE3ZQii3fzbA/viewform
The event will feature conversations with experts who have:
- Built infrastructure for developing AI agents (DSPy, LangChain)
- Led startups that build agents (Sierra, Sybill)
- Created tools and benchmarks to evaluate LLMs and agents (SWE-bench, SPADE, lm-eval-harness)
- Developed solutions to ensure reliability and safety (Constitutional AI, Inspect)
Details: https://sites.google.com/princeton.edu/agents-workshop
Register for Zoom link: https://docs.google.com/forms/d/e/1FAIpQLSduu6kgktlLZOJ1j3Vivh3Ip9wW8IiEICMri0xE3ZQii3fzbA/viewform
The event will feature conversations with experts who have:
- Built infrastructure for developing AI agents (DSPy, LangChain)
- Led startups that build agents (Sierra, Sybill)
- Created tools and benchmarks to evaluate LLMs and agents (SWE-bench, SPADE, lm-eval-harness)
- Developed solutions to ensure reliability and safety (Constitutional AI, Inspect)
Google
Useful and Reliable AI Agents
Workshop on Useful and Reliable AI Agents
Forwarded from CodeCamp
This media is not supported in your browser
VIEW IN TELEGRAM