Библиотека задач по Data Science | тесты, код, задания
3.85K subscribers
662 photos
5 videos
375 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
Чем больше значения FP и FN в матрице ошибок, тем
Anonymous Quiz
80%
хуже
20%
лучше
Что выведет код с картинки выше?
Anonymous Quiz
6%
False
12%
True
62%
1
19%
Ошибка
-35% на самый хардкорный курс по вышмату

🎄 Новый год начинается с подарков, а хороший подарок для себя — новые знания со скидкой 35%!

🌟«Математика для Data Science» — 19 490 ₽ (вместо 29 990 ₽)

Полугодовая программа от преподавателей МГУ, которая включает в себя все необходимые знания по математике для работы в Data Science.

Вас ждет развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы.

У вас не будет шансов не усвоить какие-то темы курса👌

🔥 Переходите и активируйте вводные занятия курсаhttps://proglib.io/w/4468ec03
✍️ Очередной разбор задач

1️⃣ Для нахождения градиента функции f(u,v)=u*v+1 в точке (1,2) нам нужно сначала вычислить частные производные функции по u и v, а затем оценить их значения в этой точке. Результатом будет вектор.
Вычислим частную производную по u. Она будет равна v. В точке (1, 2) это даёт 2. Теперь вычислим частную производную по v. Она будет равна u. В точке (1, 2) это даёт 1. Таким образом, градиент функции равен (2, 1).
2️⃣ Здесь решение будет вычисляться по формуле σ(1⋅1+2⋅(−1)+1). Каждый вход умножается на соответствующий вес. Эти значения суммируются и к ним прибавляется единица. От полученного выражения вычисляется сигмоида. В результате значение на выходе из нейрона будет равно 0.5.
3️⃣ В этом квизе new_row.to_frame().T преобразует new_row в DataFrame и транспонирует его (меняет строки и столбцы местами), чтобы привести к формату, подходящему для добавления в df. Затем используется функция pd.concat() для объединения исходного DataFrame df с новым DataFrame. Параметр ignore_index=True указывает, что индексы в результирующем DataFrame должны быть переопределены.
Затем используется метод loc для доступа к элементу в строке с индексом 3 и в столбце 'C'. Это значение равно 9.0.

#разбор_задач
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
Выше даны две таблицы и запрос SQL к ним. Сколько строк будет в результате его выполнения?
Anonymous Quiz
9%
0
49%
1
23%
2
18%
3
Вы используете алгоритм k-ближайших соседей (KNN) и устанавливаете параметр k равным единице. Что вы будете ожидать увидеть?
Anonymous Quiz
33%
высокий разброс и низкое смещение
15%
низкий разброс и низкое смещение
23%
низкий разброс и высокое смещение
29%
высокий разброс и высокое смещение
✍️ Разбор задач прошедшей недели

1️⃣ Разберём код поэтапно.
- Узнаем, каким будет массив c:
array([ True, True, False, False, False])
Здесь идёт простое поэлементное сравнение a и b.
- Узнаем, каким будет массив d:
array([False, False, True, True, True])
Здесь идёт поэлементное сравнение массива a с двойкой.
- c * d выполняет логическое умножение (или покомпонентное логическое И). Поэтому результатом будет [False False False False False].
2️⃣ Этот код вызывает ошибку, потому что пытается изменить значение глобальной переменной x внутри локальной области видимости функции foo без явного объявления x как глобальной внутри этой функции.
3️⃣ Если установить параметр k равным единице, такая модель будет рассматривать только одного ближайшего соседа для каждого прогноза. Она будет иметь очень низкое смещение (bias), так как не будет пытаться обобщить данные. При этом модель получит высокий разброс (variance), становясь чрезвычайно чувствительной к шуму в обучающих данных. То есть она будет реагировать на любые небольшие изменения в данных, что приведет к высокой дисперсии.

#разбор_задач