Библиотека задач по Data Science | тесты, код, задания
3.85K subscribers
623 photos
4 videos
334 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
Что обычно происходит, если вы используете градиентный спуск на функции потерь с очень плоской областью?

🔥 — Градиенты становятся очень большими
❤️ — Градиенты становятся очень маленькими
⚡️ — Модель сходится быстрее
👍 — Все вышеперечисленное

Библиотека задач по Data Science
🧮 Как избежать ловушки округления в Power BI

Твой отчет показывает разные цифры при одинаковой логике? Не спеши винить систему – это классический кейс с округлением в Power BI.

👊 Разбираемся, как типы данных влияют на точность и почему Currency может стать твоим врагом.

➡️ Подробнее в статье: https://proglib.io/sh/TcGmatdgNV

Библиотека дата-сайентиста
Please open Telegram to view this post
VIEW IN TELEGRAM
Зачем дата-сайентисту дисперсия

Дисперсия — ключевой статистический показатель, который помогает оценить изменчивость данных. Для дата-сайентистов она критична при:

👉 Оценке и интерпретации результатов моделей
👉 Понимании поведения алгоритмов машинного обучения
👉 Снижении ошибок при построении предсказаний

В этой статье разберём, как правильно использовать дисперсию в Data Science и как она влияет на работу алгоритмов, например, в модели Random Forest.

👉 Читайте, чтобы понять, как измерять и учитывать дисперсию: https://proglib.io/sh/GDKYJQdAI2

Библиотека дата-сайентиста
Please open Telegram to view this post
VIEW IN TELEGRAM
Значение p= 0.04 означает:

🔥 — 4% вероятность того, что нулевая гипотеза (H₀) верна
❤️ — 96% вероятность того, что альтернативная гипотеза (H₁) верна
⚡️ — Результат маловероятен при нулевой гипотезе (H₀)
👍 — Результат практически значим

Библиотека задач по Data Science