Библиотека задач по Data Science | тесты, код, задания

Формула какой функции активации изображена на картинке выше?

Anonymous Quiz

19%

Сигмоида

61%

Гиперболический тангенс

13%

ReLU

Leaky ReLU

373 voters1.1K views12:02

Библиотека задач по Data Science | тесты, код, задания

✍️ Разбор задач прошедшей недели

1️⃣ Функция DataFrame.rename в Pandas позволяет переименовать столбцы. Однако, как и многие другие функции, она применяется не inplace по умолчанию, то есть она возвращает новый объект DataFrame с изменениями, не затрагивая исходный объект. Чтобы изменения применились к исходному объекту DataFrame, необходимо использовать аргумент inplace=True.
По этой причине код выведет столбец с названием Profit.

2️⃣ Функция divmod в Python принимает два аргумента и возвращает пару чисел, состоящую из частного и остатка от деления первого аргумента на второй. В случае с divmod(15, 4) выведется кортеж (3, 3). Таким образом, sum в качестве аргументов передаётся следующее: (3, 3) и 2. 2 служит здесь начальным значением для суммирования, к которому добавляется сумма элементов кортежа (3, 3).

3️⃣ Наивный Байес — это довольно простой алгоритм. Он работает на предположении, что все признаки в наборе данных независимы друг от друга. Благодаря этому алгоритм может использовать принцип условной вероятности. Так, он учитывает вероятности появления определённых признаков при наличии конкретного класса.

В отличие от многих других алгоритмов машинного обучения Наивный Байес не рассчитывает расстояния между точками, из-за этого он не чувствителен к масштабу признаков.

#разбор_задач

1.0K views12:00

Библиотека задач по Data Science | тесты, код, задания

🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈

1.2K views06:03

Библиотека задач по Data Science | тесты, код, задания

О чём говорит Центральная предельная теорема (ЦПТ)?

Anonymous Quiz

48%

При росте размера выборки её среднее приближается к среднему генеральной совокупности.

45%

Распределение суммы независимых случайных величин приближается к нормальному, если выборка велика

Дисперсия случайной выборки увеличивается пропорционально размеру выборки

Вероятность появления редкого события стремится к нулю при увеличении числа испытаний

848 voters4.2K views12:00

Библиотека задач по Data Science | тесты, код, задания

1.2K viewsedited 12:00

Библиотека задач по Data Science | тесты, код, задания

Что выведет код с картинки выше?

Anonymous Quiz

19%

37%

39%

194 voters1.1K views12:00

Библиотека задач по Data Science | тесты, код, задания

Почему функция Softmax предпочтительнее нескольких функций Sigmoid для выходного слоя нейросети при решении задачи многоклассовой классификации?

Anonymous Quiz

57%

Softmax гарантирует, что сумма выходных вероятностей равна 1

10%

Softmax требует меньших вычислительных затрат

21%

Softmax обеспечивает больший градиент для обратного распространения ошибки

12%

Softmax поддерживает большее количество классов

275 voters1.3K views12:00

Библиотека задач по Data Science | тесты, код, задания

1.2K views12:04

Библиотека задач по Data Science | тесты, код, задания

Что выведет код с картинки выше?

Anonymous Quiz

231 voters1.1K views12:04

Библиотека задач по Data Science | тесты, код, задания

✏️ Разбор задачи с экзамена ШАД

Условие: В корзине лежит m чёрных шаров и n красных. Мы достаём из корзины случайный шар и, если он чёрный, то заменяем его на красный, а если он красный, то кладём его обратно. Найдите математическое ожидание числа красных шаров в корзине после k итераций этой процедуры.

Решение: Обозначим количество красных шаров в корзине после k итераций как x. Нужно найти математическое ожидание величины x.

✍️ Поскольку мы кладём шар обратно в корзину, если он красный, то x = n + y, где y — количество чёрных шаров, которые стали красными после k итераций.

Пронумеруем чёрные шары. Для каждого j-го чёрного шара введём случайную величину I-джитое 1️⃣, которая будет индикатором того, что j-й чёрный шар стал красным после k итераций. Эта случайная величина равна единице, если шар поменял цвет, и нулю, если не поменял. Следовательно, сумма 2️⃣ таких величин будет равна количеству поменявших цвет шаров, которое мы выше обозначили как y. Получаем формулы 3️⃣ и 4️⃣. Вспомним, что матожидание — это сумма произведений вида «значение × вероятность этого значения». В нашем случае значений всего два: 1 и 0.

Получилась сумма вероятностей того, что j-й чёрный шар поменял цвет. Посчитаем эту вероятность. Нам будет удобнее перейти к отрицанию 5️⃣.

Чему равна вероятность, стоящая после знака минус? У нас есть k попыток вытащить шар. Поскольку попытки независимые, то вероятность после знака минус будет равна некоторому выражению в k-й степени — произведению вероятностей того, что при каждой попытке мы не вытащили данный шар.

Какова вероятность не вытащить шар в каждой конкретной попытке? Это будет дробь, в знаменателе — общее число шаров m + n. Мы должны были вытащить какой-либо шар кроме j-го. Вариантов так сделать — m + n – 1. Это выражение и будет в числителе 6️⃣.

Вычисляем искомое ожидание:
7️⃣ Все вероятности, стоящие справа под знаком суммы, — одинаковые. Поэтому сумма будет равна количеству чёрных шаров m, умноженному на вероятность, что конкретный шар поменял цвет.

Затем остаются 8️⃣ и 9️⃣

1.2K views09:21

Библиотека задач по Data Science | тесты, код, задания

Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧠🤖 Как создать память для вашего чат-бота на Python с
помощью графов знаний

Хотите, чтобы ваш чат-бот давал более точные и релевантные ответы, избегая «галлюцинаций»? Графы знаний в помощь!

В статье и туториале разбираем, что такое графы и как создать память на примере данных из Википедии.

🔗 Читать статью
🔗 Зеркало

792 views12:00

Библиотека задач по Data Science | тесты, код, задания

✍️ Воскресный разбор задач

1️⃣ Поговорим о Центральной предельной теореме (ЦПТ).

Можно рассматривать её вместе с Законом больших чисел (ЗБЧ). ЗБЧ гласит, что если некий эксперимент, результатом которого является число (случайная величина с матожиданием μ), провести много раз и усреднить результаты, то этот усреднённый результат, скорее всего, будет близок к μ. Это можно интерпретировать относительно среднего выборки следующим образом: чем больше размер выборки, тем ближе её среднее к среднему генеральной совокупности.

ЦПТ утверждает, что распределение суммы таких независимых случайных величин приближается к нормальному, если количество испытаний или число респондентов достаточно велико. Это можно интерпретировать относительно среднего выборки следующим образом: когда размер выборки увеличивается, распределение средних этих выборок, вне зависимости от исходного распределения данных в генеральной совокупности, стремится к нормальному распределению. То есть одно из ключевых отличий ЦПТ от ЗБЧ заключается в том, что ЦПТ описывает форму распределения средних значений.

2️⃣ Этот код создаёт массив из чисел от 0 до 9 (np.arange(10)). Также он изменяет форму этого массива на двумерный с помощью метода reshape(2, -1), где 2 указывает на количество строк, а -1 позволяет NumPy автоматически вычислить необходимое количество столбцов (в данном случае это 5 столбцов). Затем код выводит на печать arr[0, -1]. Здесь 0 указывает на первую строку массива, а -1 указывает на последний элемент в этой строке. Таким образом, из первой строки ([0, 1, 2, 3, 4]) будет извлечён последний элемент, который равен 4.

#разбор_задач

1.3K views12:00

Библиотека задач по Data Science | тесты, код, задания

Какая метрика не подходит для оценки эффективности логистической регрессии?

Anonymous Quiz

12%

ROC-кривая

66%

Среднеквадратичная ошибка (MSE)

345 voters1.1K views12:00

Библиотека задач по Data Science | тесты, код, задания

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

1.2K views20:01

Библиотека задач по Data Science | тесты, код, задания

✏️ Разбор задачи с экзамена ШАД

Условие: У вас есть набор выражений 1️⃣. Найдите значение параметра a, для которого множество (k, l, m, n) будет линейно зависимым.

Решение: Требование задачи равносильно вырожденности матрицы коэффициентов. То есть нам нужно составить матрицу из коэффициентов, сделав из них строки и столбцы.

Вырожденная матрица — это квадратная матрица, определитель которой равен нулю. Определитель матрицы равен нулю тогда, когда строки (или столбцы) этой матрицы линейно зависимы, что соответствует исходному условию.

Совершая над матрицей элементарные преобразования строк и столбцов, получим 2️⃣.

Последняя матрица вырожденна 3️⃣. Из этого и получим ответ.

#задачи_шад

1.3K viewsedited 12:02

Библиотека задач по Data Science | тесты, код, задания

Какой тип объединения в SQL возвращает только строки, которые имеют совпадающие значения в обеих таблицах?

Anonymous Quiz

385 voters1.1K views12:03

Библиотека задач по Data Science | тесты, код, задания

Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

👍

Итоги недели в мире ИИ и обзоры новых сервисов

У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ.

Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈

💬

Новости

▫️NVIDIA продемонстрировала впечатляющие достижения в робототехнике на конференции GDC 2024. Посмотрите на гуманоидных роботов здесь.
▫️Компания DeepMind совместно с клубом Liverpool представила TacticAI — систему, которая может давать тактические советы футбольным тренерам.
▫️Stability AI выпустила модель Stable Video 3D, способную превращать изображения в 3D-видео.

🛠 Инструменты

▫️Arcads — генерирует маркетинговые видео с ИИ-актерами.
▫️Instanice — преобразует фото в любой нужный стиль, сохраняя внешность.
▫️PNGMaker — генерирует любые изображения на прозрачном фоне.

⚙️

Сделай сам

▫️Devika — опенсорсная альтернатива нашумевшему автономному агенту Devin от Cognition AI. Это ИИ-помощник, способный создавать сложные программные проекты с минимальным участием разработчика.
▫️GPT Prompt Engineer — агент для создания эффективных промптов. Поддерживает все модели OpenAI и Claude 3.

➡

Вы можете подписаться на email-рассылку здесь

Please open Telegram to view this post

VIEW IN TELEGRAM

687 views13:00

Библиотека задач по Data Science | тесты, код, задания

Forwarded from Книги для дата сайентистов | Data Science

Please open Telegram to view this post

VIEW IN TELEGRAM

643 views13:36

Библиотека задач по Data Science | тесты, код, задания

1.1K views12:00