Библиотека задач по Data Science | тесты, код, задания
3.85K subscribers
663 photos
5 videos
376 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
Какая функция активации изображена на картинке выше?
Anonymous Quiz
46%
Сигмоида
45%
Гиперболический тангенс
8%
ReLU
Вопрос к знатокам Python: что выведет код на картинке выше?
Anonymous Quiz
20%
4
11%
True
34%
5
7%
False
28%
Ошибка
Чем чревато использование одного и того же набора данных и в тренировочной, и в тестовой выборке?
Anonymous Quiz
23%
Недообучение модели
77%
Переобучение модели
✍️ Разбор сложных задач этой недели

1️⃣ Эта задача не сложная сама по себе, однако названия параметров numpy.random.normal могут запутать. В документации указано, что loc используется для среднего, а scale — для стандартного отклонения.
2️⃣ На картинке изображён гиперболический тангенс. От сигмоиды его отличает область значений функции. У гиперболического тангенса значения лежат в диапазоне от -1 до 1, а у сигмоиды — от 0 до 1.
3️⃣ Разберём эту строчку поэтапно:
- если мы переведём ' ', то есть пробел в логический тип, то получим True, так как это непустая строка;
- True, соответственно, интерпретируется как единица;
- единицу мы складываем с четвёркой, поэтому верный ответ — 5.

💬 Как вам такой формат постов? Хотите и дальше читать еженедельные разборы задач, получивших наибольшее количество неверных ответов?
👍 — хочу
🤔 — сам разберусь с трудностями

#разбор_задач
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
Какой способ создания векторных представлений применяется для кодирования целых абзацев?
Anonymous Quiz
17%
Word2Vec
51%
Doc2Vec
13%
N-граммы
19%
Bag of Words
Какова будет сумма значений в столбце 'B' после выполнения кода выше?
Anonymous Quiz
27%
23.0
16%
~38.3
42%
33.0
15%
Ошибка выполнения
Если временной ряд содержит много аномалий и выбросов, и из-за этого трудно обнаружить тенденцию, что следует сделать со значениями ряда?
Anonymous Quiz
5%
Ситуацию не исправить
34%
Ряд нужно нормировать
46%
Ряд нужно сгладить
15%
Ряд нужно усреднить
Что выведет код с картинки выше?
Anonymous Quiz
10%
[2 3 4 5 6]
50%
[2 4 6]
19%
[4]
21%
[3 5]
Каков правильный порядок следования операторов в SQL-запросе?
Anonymous Quiz
12%
SELECT, FROM, GROUP BY, HAVING, WHERE
81%
SELECT, FROM, WHERE, GROUP BY, HAVING
8%
SELECT, FROM, HAVING, GROUP BY, WHERE
Что выведет код с картинки выше?
Anonymous Quiz
26%
True
37%
False
37%
Ошибка
✍️ Разбор сложных задач прошедшей недели

1️⃣ Чтобы ответить правильно на этот вопрос, важно было знать, что именно делает метод fillna() со значением method=‘ffill’ в Pandas. Он заполняет пропуски (NaN) последним наблюдаемым значением, то есть значением, стоящим перед пропущенным. Таким образом, ряд станет выглядеть как [5, 5, 5, 8, 10] и сумма будет 33.
2️⃣ Если во временном ряду много аномалий и выбросов, то можно применить сглаживание. Суть сглаживания и сводится к замене фактических значений ряда теми, что были получены после обработки колебаний. Самый простой способ сделать это — использовать скользящее среднее. По гладкому ряду могут быть лучше заметны тенденции.
3️⃣ В Python сравнение списков происходит поэлементно. В приведённом примере [1, 2, 3, 4] < [1, 2, 5] происходит так:
- Сначала сравниваются первые элементы обоих списков: 1 и 1. Они равны, поэтому сравнение продолжается.
- Затем сравниваются вторые элементы: 2 и 2. Они также равны.
- Далее сравниваются третьи элементы: 3 и 5. Поскольку 3 меньше 5, Python заключает, что первый список меньше второго, и возвращает True.

#разбор_задач
Какую метрику лучше не использовать при наличии несбалансированных классов в данных?
Anonymous Quiz
31%
F-мера
13%
Precision
48%
Accuracy
7%
Recall
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.