Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Дисперсия — ключевой статистический показатель, который помогает оценить изменчивость данных. Для дата-сайентистов она критична при:
В этой статье разберём, как правильно использовать дисперсию в Data Science и как она влияет на работу алгоритмов, например, в модели Random Forest.
👉 Читайте, чтобы понять, как измерять и учитывать дисперсию: https://proglib.io/sh/GDKYJQdAI2
Библиотека дата-сайентиста
Please open Telegram to view this post
VIEW IN TELEGRAM
Значение p= 0.04 означает:
🔥 — 4% вероятность того, что нулевая гипотеза (H₀) верна
❤️ — 96% вероятность того, что альтернативная гипотеза (H₁) верна
⚡️ — Результат маловероятен при нулевой гипотезе (H₀)
👍 — Результат практически значим
Библиотека задач по Data Science
🔥 — 4% вероятность того, что нулевая гипотеза (H₀) верна
❤️ — 96% вероятность того, что альтернативная гипотеза (H₁) верна
⚡️ — Результат маловероятен при нулевой гипотезе (H₀)
👍 — Результат практически значим
Библиотека задач по Data Science
Что выведет код?
Anonymous Quiz
6%
[1, 2, 3, 4] [9, 2, 3, 4]
77%
[9, 2, 3, 4] [9, 2, 3, 4]
16%
Error
1%
[1, 2, 3, 4] [1, 2, 3, 4]
Какой алгоритм наиболее эффективен для обнаружения фальшивых отзывов?
🔥 — BERT
❤️ — DBSCAN
⚡️ — Support Vector Regression
👍 — Principal Component Analysis
Библиотека задач по Data Science
🔥 — BERT
❤️ — DBSCAN
⚡️ — Support Vector Regression
👍 — Principal Component Analysis
Библиотека задач по Data Science