Библиотека задач по Data Science | тесты, код, задания
3.85K subscribers
625 photos
4 videos
336 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
Какова цель трюка Гумбеля-Софтмакса в машинном обучении?

👍 — Обеспечить дифференцируемую выборку
❤️ — Улучшить нормализацию данных
🔥 — Уменьшить размерность
⚡️ — Увеличить скорость обучения

Библиотека задач по Data Science
Какой метод даёт быструю статистическую сводку по числовым столбцам в DataFrame?

👍 — .describe ( )
❤️ — .summarize ( )
🔥 — .stats ( )
⚡️ — .overview ( )

Библиотека задач по Data Science
🖼 ТОП-5 структур данных для обработки изображений

Хотите разобраться, как обрабатывать изображения в компьютерном зрении или графике?

Всё начинается с правильных структур данных. Они помогают хранить и анализировать пиксели, их связи и расположение.

👉 В этой статье — подборка топ решений и советы, как их использовать.

Библиотека питониста
Please open Telegram to view this post
VIEW IN TELEGRAM
Что обычно происходит, если вы используете градиентный спуск на функции потерь с очень плоской областью?

🔥 — Градиенты становятся очень большими
❤️ — Градиенты становятся очень маленькими
⚡️ — Модель сходится быстрее
👍 — Все вышеперечисленное

Библиотека задач по Data Science
🧮 Как избежать ловушки округления в Power BI

Твой отчет показывает разные цифры при одинаковой логике? Не спеши винить систему – это классический кейс с округлением в Power BI.

👊 Разбираемся, как типы данных влияют на точность и почему Currency может стать твоим врагом.

➡️ Подробнее в статье: https://proglib.io/sh/TcGmatdgNV

Библиотека дата-сайентиста
Please open Telegram to view this post
VIEW IN TELEGRAM
Зачем дата-сайентисту дисперсия

Дисперсия — ключевой статистический показатель, который помогает оценить изменчивость данных. Для дата-сайентистов она критична при:

👉 Оценке и интерпретации результатов моделей
👉 Понимании поведения алгоритмов машинного обучения
👉 Снижении ошибок при построении предсказаний

В этой статье разберём, как правильно использовать дисперсию в Data Science и как она влияет на работу алгоритмов, например, в модели Random Forest.

👉 Читайте, чтобы понять, как измерять и учитывать дисперсию: https://proglib.io/sh/GDKYJQdAI2

Библиотека дата-сайентиста
Please open Telegram to view this post
VIEW IN TELEGRAM