Библиотека задач по Data Science | тесты, код, задания
3.85K subscribers
643 photos
5 videos
354 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
⚡️Как войти в Data Science всего за год?

Очень кратко пересказываем историю одного специалиста, который устроился в Data Science после работы в авиационной промышленности. В карточках — его путь и одна из рекомендаций, а в статье по ссылке — большая подборка полезных ресурсов!

👉Читать статью

А чтобы следовать совету и окружить себя подходящим информационным фоном, изучайте другие классные статьи про Data Science:
⭐️Математические основы генеративных нейронных сетей: что нужно знать для их изучения
⭐️Что такое GPT: раскрываем тайны трансформеров
⭐️Как работают языковые модели (LLM): простое объяснение через аналогию с кулинарией
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
✍️ Воскресный разбор задач

Сегодня рассмотрим одну задачу по свёртке.

При свёртке у нас есть ядро (kernel) — небольшая матрица весов. Это ядро «скользит» по входным данным, выполняя поэлементное умножение для той части данных, которую сейчас покрывает. Результаты перемножений ячеек суммируются в одном выходном пикселе.

В этой задаче хоть и не было прямо указано, но предполагалось, что размер выходного изображения (матрицы) должен остаться таким же, что и размер входного изображения. Для этого исходную матрицу можно дополнить «поддельными» пикселями вокруг. Тогда:
🟡Ядро размещается поверх изображения так, чтобы его центр находился над текущим пикселем.
🟡Элементы ядра умножаются на соответствующие элементы изображения под ними.
🟡Результаты умножения суммируются, формируя новое значение для текущего пикселя.

Процесс повторяется для каждого пикселя изображения. Ядро последовательно «скользит» по всему изображению. Если используется ядро, которое в основном состоит из нулей с единицей по центру, как [[0, 0, 0], [0, 1, 0], [0, 0, 0]], каждый пиксель остаётся неизменным, поскольку только центральный пиксель умножается на 1, а все окружающие на 0. Это оставляет изображение без изменений после свёртки.

Мы можем проверить все ядра на изображении с помощью функции Filter2D() из OpenCV:
from google.colab.patches import cv2_imshow
import cv2
import numpy as np


image = cv2.imread("dog.jpeg")
kernels = {
"1 kernel": np.array([[0, 0, 0], [0, 1, 0], [0, 0, 0]]),
"2 kernel": np.array([[1, 1, 1], [1, 1, 1], [1, 1, 1]]),
"3 kernel": np.array([[1, 1, 1], [1, 0, 1], [1, 1, 1]]),
"4 kernel": np.array([[1, 0, 0], [1, 0, 0], [1, 1, 1]])
}

for kernel in kernels.values():
convolved_image = cv2.filter2D(image, -1, kernel)
cv2_imshow(image)
cv2_imshow(convolved_image)


#разбор_задач
Please open Telegram to view this post
VIEW IN TELEGRAM
🟰Математические основы генеративных нейронных сетей: что нужно знать для их изучения

Генеративный ИИ — это тип искусственного интеллекта, который после обучения на огромных массивах существующих данных способен создавать новый контент (текст, программный код, изображения, аудио, видео).

🪅Первыми примитивными примерами генеративного ИИ можно считать статистические модели, которые могли генерировать новые последовательности на основе заданных входных данных. Одна из таких моделей была использована для предсказания итогов президентских выборов в США в 1952 году.

↗️ Стремительное развитие генеративного ИИ началось в 2014 году, когда Ян Гудфеллоу и его коллеги представили генеративную состязательную сеть (GAN). Параллельно с этим, вариационные автокодировщики (VAE) и рекуррентные нейронные сети (RNN) тоже продемонстрировали впечатляющие способности к генерации нового контента. С тех пор генеративный ИИ развивается с головокружительной скоростью.

В новой статье рассказываем, какие разделы математики нужно знать для разработки современных генеративных моделей.

🔗 Читать статью
🔗 Зеркало
Please open Telegram to view this post
VIEW IN TELEGRAM
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Что выведет код с картинки выше?
Anonymous Quiz
56%
2
17%
4
27%
1
Тест на болезнь X имеет вероятность ошибки 0.1 (как положительной, так и отрицательной). X болеет 10% населения. Какова вероятность того, что человек болен X, если у него положительный результат теста?
Anonymous Quiz
41%
0.1
17%
0.25
16%
0.45
26%
0.5
После print (data.a.values) вывелось ['a' 'b' 'a' 'c' 'a']. Что выведется после data['a'] = data.a.map(data.a.value_counts()), если мы сделаем print (data.a.values)?
Anonymous Quiz
35%
ничего, будет ошибка из-за использования map вмеcто apply
8%
['a' 'b' 'a' 'c' 'a']
50%
[3 1 3 1 3]
7%
[1 2 1 3 1]
На рисунке показан граф ссылок между страницами. Пользователь ходит по этим страницам, выбирая ссылку случайно. Если ссылок на странице нет, то пользователь заканчивает сеанс. Первая страница просмотра пользователя неизвестна.
Какова вероятность, что пользователь закончил сеанс, просмотрев не более двух страниц?
Anonymous Quiz
13%
0.125
25%
0.25
23%
0.425
39%
0.625
Что выведет код с картинки выше?
Anonymous Quiz
34%
Ошибка
7%
10
7%
30
52%
(10, 20, 30)
🦾🧠🏋Качаем мозги к лету!

Хотите начать работать с большими данными, применять методы машинного обучения, статистический анализ, а также разрабатывать алгоритмы для извлечения информации?

Тогда наш полугодовой курс «Математика для Data Science» от преподавателей МГУ, подходит для этого. И мы можете попасть на него со скидкой 40%

➡️ Математика для Data Science 29 990 ₽ 17 994 ₽

Вас ждет развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы.

У вас не будет шансов не усвоить какие-то темы курса👌

⭐️ Переходите и активируйте бесплатные вводные занятия курса https://proglib.io/w/47e865f0
Please open Telegram to view this post
VIEW IN TELEGRAM
✍️ Воскресный разбор задач

Разбираем сегодня задачку на знание теоремы Байеса👆

#разбор_задач