Что выведет данный код?
Anonymous Quiz
48%
False, True
30%
True, True
8%
True, False
13%
False, False
Вы анализируете данные о доходах клиентов компании. Вам необходимо обнаружить аномалии в распределении доходов. Какой метод наиболее подходит для обнаружения выбросов?
Anonymous Quiz
23%
Z-оценка (Z-score)
16%
K-средних (K-means) кластеризация
10%
Линейная регрессия
51%
Межквартильный размах (IQR)
Задача из раздела простых, показываем два простых решения
+-------------+---------+
| Column Name | Type |
+-------------+---------+
| id | int |
| name | varchar |
| salary | int |
| managerId | int |
+-------------+---------+
Нужно по заданной таблице вывести имена работников, которые зарабатывают больше своих менеджеров.
+-------------+---------+
| Column Name | Type |
+-------------+---------+
| id | int |
| name | varchar |
| salary | int |
| managerId | int |
+-------------+---------+
Нужно по заданной таблице вывести имена работников, которые зарабатывают больше своих менеджеров.
Допустим, у нас есть набор данных о продажах различных продуктов в разных магазинах. Мы хотим вычислить общую выручку и среднюю цену продукта для каждого магазина, какой код эффективнее:
Anonymous Quiz
56%
первый
44%
второй
Как называется метод, который использует стохастическую случайную выборку из тренировочных данных для создания разных версий модели и усредняет их предсказания для улучшения обобщающей способности?
Anonymous Quiz
15%
Data Augmentation
52%
Ensemble Learning
3%
Transfer Learning
30%
Gradient Boosting
Дан вариационный ряд. Если все варианты увеличить в одно и то же количество раз, то средняя арифметическая
Anonymous Quiz
21%
увеличится на то же число
12%
уменьшится во столько же раз
2%
уменьшится на то же число
65%
увеличится во столько же раз
Ранжирование - это операция, заключающаяся в том, что наблюдаемые значения случайной величины располагаются в порядке
Anonymous Quiz
26%
группирования
42%
неубывания
21%
расположения
11%
невозрастания
+-------------+-------+
| Column Name | Type |
+-------------+-------+
| pid | int |
| tiv_2015 | float |
| tiv_2016 | float |
| lat | float |
| lon | float |
+-------------+-------+
pid — это первичный ключ (столбец с уникальными значениями) для этой таблицы.
Каждая строка этой таблицы содержит информацию об одном полисе, где:
pid — идентификатор полиса страхователя.
tiv_2015 — общая стоимость инвестиций в 2015 году, а tiv_2016 — общая стоимость инвестиций в 2016 году.
lat — широта города страхователя. Гарантируется, что lat не равен NULL.
lon — долгота города страхователя. Гарантируется, что lon не равен NULL.
Напишите решение для отчета о сумме общей стоимости инвестиций в 2016 году tiv_2016 для всех страхователей, которые:
- имеют то же значение tiv_2015, что и один или несколько других держателей полисов
- не находятся в том же городе, что и любой другой страхователь (т. е. пары атрибутов (широта, долгота) должны быть уникальными).
Округлите tiv_2016 до двух десятичных знаков.
Решение разберем завтра
| Column Name | Type |
+-------------+-------+
| pid | int |
| tiv_2015 | float |
| tiv_2016 | float |
| lat | float |
| lon | float |
+-------------+-------+
pid — это первичный ключ (столбец с уникальными значениями) для этой таблицы.
Каждая строка этой таблицы содержит информацию об одном полисе, где:
pid — идентификатор полиса страхователя.
tiv_2015 — общая стоимость инвестиций в 2015 году, а tiv_2016 — общая стоимость инвестиций в 2016 году.
lat — широта города страхователя. Гарантируется, что lat не равен NULL.
lon — долгота города страхователя. Гарантируется, что lon не равен NULL.
Напишите решение для отчета о сумме общей стоимости инвестиций в 2016 году tiv_2016 для всех страхователей, которые:
- имеют то же значение tiv_2015, что и один или несколько других держателей полисов
- не находятся в том же городе, что и любой другой страхователь (т. е. пары атрибутов (широта, долгота) должны быть уникальными).
Округлите tiv_2016 до двух десятичных знаков.
Решение разберем завтра