Библиотека задач по Data Science | тесты, код, задания

Forwarded from Proglib.academy | IT-курсы

⚡️

Как войти в Data Science всего за год?

Очень кратко пересказываем историю одного специалиста, который устроился в Data Science после работы в авиационной промышленности. В карточках — его путь и одна из рекомендаций, а в статье по ссылке — большая подборка полезных ресурсов!

👉

Читать статью

А чтобы следовать совету и окружить себя подходящим информационным фоном, изучайте другие классные статьи про Data Science:

⭐️

Математические основы генеративных нейронных сетей: что нужно знать для их изучения

⭐️

Что такое GPT: раскрываем тайны трансформеров

⭐️

Как работают языковые модели (LLM): простое объяснение через аналогию с кулинарией

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

688 views12:03

Библиотека задач по Data Science | тесты, код, задания

✍️ Воскресный разбор задач

Сегодня рассмотрим одну задачу по свёртке.

При свёртке у нас есть ядро (kernel) — небольшая матрица весов. Это ядро «скользит» по входным данным, выполняя поэлементное умножение для той части данных, которую сейчас покрывает. Результаты перемножений ячеек суммируются в одном выходном пикселе.

В этой задаче хоть и не было прямо указано, но предполагалось, что размер выходного изображения (матрицы) должен остаться таким же, что и размер входного изображения. Для этого исходную матрицу можно дополнить «поддельными» пикселями вокруг. Тогда:
🟡Ядро размещается поверх изображения так, чтобы его центр находился над текущим пикселем.
🟡Элементы ядра умножаются на соответствующие элементы изображения под ними.
🟡Результаты умножения суммируются, формируя новое значение для текущего пикселя.

Процесс повторяется для каждого пикселя изображения. Ядро последовательно «скользит» по всему изображению. Если используется ядро, которое в основном состоит из нулей с единицей по центру, как [[0, 0, 0], [0, 1, 0], [0, 0, 0]], каждый пиксель остаётся неизменным, поскольку только центральный пиксель умножается на 1, а все окружающие на 0. Это оставляет изображение без изменений после свёртки.

Мы можем проверить все ядра на изображении с помощью функции Filter2D() из OpenCV:

from google.colab.patches import cv2_imshow
import cv2
import numpy as np


image = cv2.imread("dog.jpeg")
kernels = {
    "1 kernel": np.array([[0, 0, 0], [0, 1, 0], [0, 0, 0]]),
    "2 kernel": np.array([[1, 1, 1], [1, 1, 1], [1, 1, 1]]),
    "3 kernel": np.array([[1, 1, 1], [1, 0, 1], [1, 1, 1]]),
    "4 kernel": np.array([[1, 0, 0], [1, 0, 0], [1, 1, 1]])
}

for kernel in kernels.values():
    convolved_image = cv2.filter2D(image, -1, kernel)
    cv2_imshow(image)
    cv2_imshow(convolved_image)

#разбор_задач

Please open Telegram to view this post

VIEW IN TELEGRAM

898 views12:04

Библиотека задач по Data Science | тесты, код, задания

Forwarded from Библиотека нейрокартинок | Midjourney, DALL-E, Stable Diffusion

🟰

Математические основы генеративных нейронных сетей: что нужно знать для их изучения

❔

Генеративный ИИ — это тип искусственного интеллекта, который после обучения на огромных массивах существующих данных способен создавать новый контент (текст, программный код, изображения, аудио, видео).

🪅Первыми примитивными примерами генеративного ИИ можно считать статистические модели, которые могли генерировать новые последовательности на основе заданных входных данных. Одна из таких моделей была использована для предсказания итогов президентских выборов в США в 1952 году.

↗️ Стремительное развитие генеративного ИИ началось в 2014 году, когда Ян Гудфеллоу и его коллеги представили генеративную состязательную сеть (GAN). Параллельно с этим, вариационные автокодировщики (VAE) и рекуррентные нейронные сети (RNN) тоже продемонстрировали впечатляющие способности к генерации нового контента. С тех пор генеративный ИИ развивается с головокружительной скоростью.

В новой статье рассказываем, какие разделы математики нужно знать для разработки современных генеративных моделей.

🔗

Читать статью

🔗

Зеркало

Please open Telegram to view this post

VIEW IN TELEGRAM

667 views11:13

Библиотека задач по Data Science | тесты, код, задания

Forwarded from Библиотека нейросетей | ChatGPT, Midjourney, DeepSeek, Sora

Please open Telegram to view this post

VIEW IN TELEGRAM

706 views13:19

Библиотека задач по Data Science | тесты, код, задания

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

1.1K views20:01

Библиотека задач по Data Science | тесты, код, задания

1.1K views12:03

Библиотека задач по Data Science | тесты, код, задания

Что выведет код с картинки выше?

Anonymous Quiz

56%

17%

27%

182 voters1.1K views12:03

Библиотека задач по Data Science | тесты, код, задания

Тест на болезнь X имеет вероятность ошибки 0.1 (как положительной, так и отрицательной). X болеет 10% населения. Какова вероятность того, что человек болен X, если у него положительный результат теста?

Anonymous Quiz

610 voters4.1K views12:00

Библиотека задач по Data Science | тесты, код, задания

После print (data.a.values) вывелось ['a' 'b' 'a' 'c' 'a']. Что выведется после data['a'] = data.a.map(data.a.value_counts()), если мы сделаем print (data.a.values)?

Anonymous Quiz

35%

ничего, будет ошибка из-за использования map вмеcто apply

['a' 'b' 'a' 'c' 'a']

50%

[3 1 3 1 3]

[1 2 1 3 1]

163 voters1.1K views12:02

Библиотека задач по Data Science | тесты, код, задания

На рисунке показан граф ссылок между страницами. Пользователь ходит по этим страницам, выбирая ссылку случайно. Если ссылок на странице нет, то пользователь заканчивает сеанс. Первая страница просмотра пользователя неизвестна.

1.2K views12:00

Библиотека задач по Data Science | тесты, код, задания

Какова вероятность, что пользователь закончил сеанс, просмотрев не более двух страниц?

Anonymous Quiz

201 voters1.1K views12:00

Библиотека задач по Data Science | тесты, код, задания

1.0K views12:00

Библиотека задач по Data Science | тесты, код, задания

Что выведет код с картинки выше?

Anonymous Quiz

329 voters954 views12:00

Библиотека задач по Data Science | тесты, код, задания

🦾🧠🏋Качаем мозги к лету!

Хотите начать работать с большими данными, применять методы машинного обучения, статистический анализ, а также разрабатывать алгоритмы для извлечения информации?

Тогда наш полугодовой курс «Математика для Data Science» от преподавателей МГУ, подходит для этого. И мы можете попасть на него со скидкой 40%

➡️

Математика для Data Science ~~29 990 ₽~~ 17 994 ₽

Вас ждет развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы.

У вас не будет шансов не усвоить какие-то темы курса👌

⭐️

Переходите и активируйте бесплатные вводные занятия курса – https://proglib.io/w/47e865f0

Please open Telegram to view this post

VIEW IN TELEGRAM

920 views09:03

Библиотека задач по Data Science | тесты, код, задания

✍️ Воскресный разбор задач

Разбираем сегодня задачку на знание теоремы Байеса👆

#разбор_задач

998 views12:00

About

Blog

Apps

Platform