Библиотека задач по Data Science | тесты, код, задания
3.86K subscribers
641 photos
5 videos
352 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
🐍🛠️ 5 Python-инструментов, которые изменят ваш подход к разработке

Эффективность разработки на Python во многом зависит от используемых инструментов. В этой статье мы рассмотрим пять мощных решений, способных существенно повысить продуктивность вашей работы.

👉 Читать статью
💵⚡️ДАРИМ 40 000₽ ЗА ВИДЕО

Конкурс года в «Библиотеке программиста»: смонтируйте короткий вертикальный ролик формата Shorts/Reels* на тему программирования и разработки — лучший автор получит 40 тысяч рублей 🤑

Подробные условия:
➡️смонтируйте короткий смешной вертикальный ролик (можно и нужно использовать мемы)
➡️отправьте нам в бота @ProglibContest_bot
➡️лучшие ролики (по мнению редакции) мы будем выкладывать в канал и в наш инстаграм*
➡️тот, чей ролик соберет больше всего просмотров в инстаграм*, получит приз — 40 тысяч рублей

Какие ролики мы не принимаем:
😟не вашего авторства (проверим!)
😟длинные, невертикальные, несмешные

Таймлайн:
2 августа — заканчиваем принимать видео
⬇️
3 августа — начинаем загружать лучшие видео в инстаграм
⬇️
9 августа — подводим итоги

*Организация Meta признана экстремистской в РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
✍️ «Библиотека программиста» находится в поиске автора на написание книжных рецензий

Кто нужен?
● Энтузиасты (джуны и выше), которые которые разбираются в IT
● Любители книг, которые хотели бы получать деньги за чтение и написание рецензий
● Работаем с самозанятыми (компенсируем налог), ИП

Мы предлагаем частичную занятость и полностью удаленный формат работы — можно совмещать с основной и находиться в любом месте🌴

✉️ Станьте частью нашей команды — присылайте резюме и примеры работ [email protected]
📊 Kaggle за 30 минут: практическое руководство для начинающих

Начинающему дата-сайентисту необходима практика, а Kaggle решает эту проблему. Из статьи вы узнаете, как лучше всего начать работу с популярным сервисом.

🔗 Статья
✍️ Разбираем задачу про преобразование данных

В этой задаче представлен график, отражающий распределение количества оценок на фильм. Это распределение имеет длинный хвост, что указывает на наличие значительного количества фильмов с небольшим количеством оценок и небольшого количества фильмов с большим количеством оценок. Для более информативного представления данных можно применить логарифмическое преобразование к количеству оценок.

Логарифмическое преобразование сгладит большие различия между фильмами с малым и большим количеством оценок. Кроме того, оно уменьшит влияние фильмов с очень большим количеством оценок, которые сейчас создают длинный хвост. Это сделает гистограмму более симметричной и поможет лучше увидеть детали распределения для фильмов с малым количеством оценок.

#разбор_задач
Если антиспам-фильтр пропускает в почтовый ящик пользователя спам, считая его нормальным письмом, то это пример ошибки первого или второго рода?
Anonymous Quiz
44%
Первого
56%
Второго
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
👨‍🎓️ Кто есть кто в команде data science: путеводитель по профессии

О data scientist часто говорят, будто это одна профессия, хотя в науке о данных существуют и другие специализации. Расскажем, из каких направлений можно выбирать и что потребуется для их изучения.

🔗 Читать статью
🔢 Математика для Data Science: необходимый минимум

Данные стали новой нефтью, а науку о данных Harvard Business Review назвал самой перспективной профессией 21 века. Для работы в сфере Data Science необходима математика: она позволяет извлекать смысл из огромных массивов информации и принимать обоснованные решения.

Расскажем, какие разделы математики нужно знать для успешного старта в нашей статье:

🔗 Ссылка на статью
✍️ Воскресный разбор задач прошедшей недели

Сегодня поговорим об ошибках первого и второго рода.

▪️Допустить ошибку первого рода это отвергнуть нулевую гипотезу, при условии, что именно она верна.

Нулевая гипотеза — это гипотеза, предполагающая, что никаких изменений не произошло/влияния нет

▪️Допустить ошибку второго рода это принять нулевую гипотезу, при условии, что верна альтернативная гипотеза.

Альтернативная гипотеза — это гипотеза, предполагающая, что ​изменения произошли/есть влияние.

А теперь вернёмся к нашей задаче. Для антиспам-фильтра нулевая гипотеза — это предположение, что новое входящее письмо является обычным письмом, не спамом. Альтернативная гипотеза тогда — это предположение, что письмо является спамом. В нашей ситуации, верна именно альтернативная гипотеза, но антиспам-фильтр принимает нулевую гипотезу. Это пример ошибки второго рода.

#разбор_задач