Библиотека задач по Data Science | тесты, код, задания
3.86K subscribers
644 photos
5 videos
355 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
Формула какой функции активации изображена на картинке выше?
Anonymous Quiz
19%
Сигмоида
61%
Гиперболический тангенс
13%
ReLU
7%
Leaky ReLU
✍️ Разбор задач прошедшей недели

1️⃣ Функция DataFrame.rename в Pandas позволяет переименовать столбцы. Однако, как и многие другие функции, она применяется не inplace по умолчанию, то есть она возвращает новый объект DataFrame с изменениями, не затрагивая исходный объект. Чтобы изменения применились к исходному объекту DataFrame, необходимо использовать аргумент inplace=True.
По этой причине код выведет столбец с названием Profit.

2️⃣ Функция divmod в Python принимает два аргумента и возвращает пару чисел, состоящую из частного и остатка от деления первого аргумента на второй. В случае с divmod(15, 4) выведется кортеж (3, 3). Таким образом, sum в качестве аргументов передаётся следующее: (3, 3) и 2. 2 служит здесь начальным значением для суммирования, к которому добавляется сумма элементов кортежа (3, 3).

3️⃣ Наивный Байес — это довольно простой алгоритм. Он работает на предположении, что все признаки в наборе данных независимы друг от друга. Благодаря этому алгоритм может использовать принцип условной вероятности. Так, он учитывает вероятности появления определённых признаков при наличии конкретного класса.

В отличие от многих других алгоритмов машинного обучения Наивный Байес не рассчитывает расстояния между точками, из-за этого он не чувствителен к масштабу признаков.

#разбор_задач
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
Что выведет код с картинки выше?
Anonymous Quiz
19%
5
37%
9
39%
4
5%
6
Что выведет код с картинки выше?
Anonymous Quiz
15%
17
48%
18
37%
Ошибка
✏️ Разбор задачи с экзамена ШАД

Условие: В корзине лежит m чёрных шаров и n красных. Мы достаём из корзины случайный шар и, если он чёрный, то заменяем его на красный, а если он красный, то кладём его обратно. Найдите математическое ожидание числа красных шаров в корзине после k итераций этой процедуры.

Решение: Обозначим количество красных шаров в корзине после k итераций как x. Нужно найти математическое ожидание величины x.

✍️ Поскольку мы кладём шар обратно в корзину, если он красный, то x = n + y, где y — количество чёрных шаров, которые стали красными после k итераций.

Пронумеруем чёрные шары. Для каждого j-го чёрного шара введём случайную величину I-джитое 1️⃣, которая будет индикатором того, что j-й чёрный шар стал красным после k итераций. Эта случайная величина равна единице, если шар поменял цвет, и нулю, если не поменял. Следовательно, сумма 2️⃣ таких величин будет равна количеству поменявших цвет шаров, которое мы выше обозначили как y. Получаем формулы 3️⃣ и 4️⃣. Вспомним, что матожидание — это сумма произведений вида «значение × вероятность этого значения». В нашем случае значений всего два: 1 и 0.

Получилась сумма вероятностей того, что j-й чёрный шар поменял цвет. Посчитаем эту вероятность. Нам будет удобнее перейти к отрицанию 5️⃣.

Чему равна вероятность, стоящая после знака минус? У нас есть k попыток вытащить шар. Поскольку попытки независимые, то вероятность после знака минус будет равна некоторому выражению в k-й степени — произведению вероятностей того, что при каждой попытке мы не вытащили данный шар.

Какова вероятность не вытащить шар в каждой конкретной попытке? Это будет дробь, в знаменателе — общее число шаров m + n. Мы должны были вытащить какой-либо шар кроме j-го. Вариантов так сделать — m + n – 1. Это выражение и будет в числителе 6️⃣.

Вычисляем искомое ожидание:
7️⃣ Все вероятности, стоящие справа под знаком суммы, — одинаковые. Поэтому сумма будет равна количеству чёрных шаров m, умноженному на вероятность, что конкретный шар поменял цвет.

Затем остаются 8️⃣ и 9️⃣
🧠🤖 Как создать память для вашего чат-бота на Python с
помощью графов знаний


Хотите, чтобы ваш чат-бот давал более точные и релевантные ответы, избегая «галлюцинаций»? Графы знаний в помощь!

В статье и туториале разбираем, что такое графы и как создать память на примере данных из Википедии.

🔗 Читать статью
🔗 Зеркало
✍️ Воскресный разбор задач

1️⃣ Поговорим о Центральной предельной теореме (ЦПТ).

Можно рассматривать её вместе с Законом больших чисел (ЗБЧ). ЗБЧ гласит, что если некий эксперимент, результатом которого является число (случайная величина с матожиданием μ), провести много раз и усреднить результаты, то этот усреднённый результат, скорее всего, будет близок к μ. Это можно интерпретировать относительно среднего выборки следующим образом: чем больше размер выборки, тем ближе её среднее к среднему генеральной совокупности.

ЦПТ утверждает, что распределение суммы таких независимых случайных величин приближается к нормальному, если количество испытаний или число респондентов достаточно велико. Это можно интерпретировать относительно среднего выборки следующим образом: когда размер выборки увеличивается, распределение средних этих выборок, вне зависимости от исходного распределения данных в генеральной совокупности, стремится к нормальному распределению. То есть одно из ключевых отличий ЦПТ от ЗБЧ заключается в том, что ЦПТ описывает форму распределения средних значений.

2️⃣ Этот код создаёт массив из чисел от 0 до 9 (np.arange(10)). Также он изменяет форму этого массива на двумерный с помощью метода reshape(2, -1), где 2 указывает на количество строк, а -1 позволяет NumPy автоматически вычислить необходимое количество столбцов (в данном случае это 5 столбцов). Затем код выводит на печать arr[0, -1]. Здесь 0 указывает на первую строку массива, а -1 указывает на последний элемент в этой строке. Таким образом, из первой строки ([0, 1, 2, 3, 4]) будет извлечён последний элемент, который равен 4.

#разбор_задач
Какая метрика не подходит для оценки эффективности логистической регрессии?
Anonymous Quiz
12%
ROC-кривая
66%
Среднеквадратичная ошибка (MSE)
11%
Precision и Recall
11%
F1-мера
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
✏️ Разбор задачи с экзамена ШАД

Условие: У вас есть набор выражений 1️⃣. Найдите значение параметра a, для которого множество (k, l, m, n) будет линейно зависимым.

Решение: Требование задачи равносильно вырожденности матрицы коэффициентов. То есть нам нужно составить матрицу из коэффициентов, сделав из них строки и столбцы.

Вырожденная матрица — это квадратная матрица, определитель которой равен нулю. Определитель матрицы равен нулю тогда, когда строки (или столбцы) этой матрицы линейно зависимы, что соответствует исходному условию.

Совершая над матрицей элементарные преобразования строк и столбцов, получим 2️⃣.

Последняя матрица вырожденна 3️⃣. Из этого и получим ответ.

#задачи_шад
Какой тип объединения в SQL возвращает только строки, которые имеют совпадающие значения в обеих таблицах?
Anonymous Quiz
4%
LEFT JOIN
82%
INNER JOIN
5%
OUTER JOIN
10%
CROSS JOIN
👍 Итоги недели в мире ИИ и обзоры новых сервисов

У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ.

Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈

💬 Новости

▫️NVIDIA продемонстрировала впечатляющие достижения в робототехнике на конференции GDC 2024. Посмотрите на гуманоидных роботов здесь.
▫️Компания DeepMind совместно с клубом Liverpool представила TacticAI — систему, которая может давать тактические советы футбольным тренерам.
▫️Stability AI выпустила модель Stable Video 3D, способную превращать изображения в 3D-видео.

🛠 Инструменты

▫️Arcads — генерирует маркетинговые видео с ИИ-актерами.
▫️Instanice — преобразует фото в любой нужный стиль, сохраняя внешность.
▫️PNGMaker — генерирует любые изображения на прозрачном фоне.

⚙️ Сделай сам

▫️Devika — опенсорсная альтернатива нашумевшему автономному агенту Devin от Cognition AI. Это ИИ-помощник, способный создавать сложные программные проекты с минимальным участием разработчика.
▫️GPT Prompt Engineer — агент для создания эффективных промптов. Поддерживает все модели OpenAI и Claude 3.

Вы можете подписаться на email-рассылку здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
Что выведет код с картинки выше?
Anonymous Quiz
20%
Ошибка
27%
14.0
22%
15.0
19%
14
12%
15