Библиотека задач по Data Science | тесты, код, задания

Вы анализируете данные о доходах клиентов компании. Вам необходимо обнаружить аномалии в распределении доходов. Какой метод наиболее подходит для обнаружения выбросов?

Anonymous Quiz

23%

Z-оценка (Z-score)

16%

K-средних (K-means) кластеризация

10%

Линейная регрессия

51%

Межквартильный размах (IQR)

311 voters950 views09:00

Библиотека задач по Data Science | тесты, код, задания

Пробовали ли вы обучить LLM или любой другой генератор текста на своих данных и что у вас выходило?

915 views18:01

Библиотека задач по Data Science | тесты, код, задания

1.1K views07:07

Библиотека задач по Data Science | тесты, код, задания

Два простых решения, какое работает быстрее?

Anonymous Quiz

141 voters1.1K views07:07

Библиотека задач по Data Science | тесты, код, задания

Задача

1.1K views07:37

Библиотека задач по Data Science | тесты, код, задания

Допустим, у нас есть набор данных о продажах различных продуктов в разных магазинах. Мы хотим вычислить общую выручку и среднюю цену продукта для каждого магазина, какой код эффективнее:

Anonymous Quiz

234 voters1.2K views07:39

Библиотека задач по Data Science | тесты, код, задания

Как называется метод, который использует стохастическую случайную выборку из тренировочных данных для создания разных версий модели и усредняет их предсказания для улучшения обобщающей способности?

Anonymous Quiz

333 voters1.3K views07:20

Библиотека задач по Data Science | тесты, код, задания

Дан вариационный ряд. Если все варианты увеличить в одно и то же количество раз, то средняя арифметическая

Anonymous Quiz

21%

увеличится на то же число

12%

уменьшится во столько же раз

уменьшится на то же число

65%

увеличится во столько же раз

332 voters1.3K views09:16

Библиотека задач по Data Science | тесты, код, задания

Ранжирование - это операция, заключающаяся в том, что наблюдаемые значения случайной величины располагаются в порядке

Anonymous Quiz

356 voters1.2K views20:42

Библиотека задач по Data Science | тесты, код, задания

+-------------+-------+
| Column Name | Type |
+-------------+-------+
| pid | int |
| tiv_2015 | float |
| tiv_2016 | float |
| lat | float |
| lon | float |
+-------------+-------+
pid — это первичный ключ (столбец с уникальными значениями) для этой таблицы.
Каждая строка этой таблицы содержит информацию об одном полисе, где:
pid — идентификатор полиса страхователя.
tiv_2015 — общая стоимость инвестиций в 2015 году, а tiv_2016 — общая стоимость инвестиций в 2016 году.
lat — широта города страхователя. Гарантируется, что lat не равен NULL.
lon — долгота города страхователя. Гарантируется, что lon не равен NULL.

Напишите решение для отчета о сумме общей стоимости инвестиций в 2016 году tiv_2016 для всех страхователей, которые:
- имеют то же значение tiv_2015, что и один или несколько других держателей полисов
- не находятся в том же городе, что и любой другой страхователь (т. е. пары атрибутов (широта, долгота) должны быть уникальными).

Округлите tiv_2016 до двух десятичных знаков.

Решение разберем завтра

1.1K views09:00

About

Blog

Apps

Platform