Библиотека задач по Data Science | тесты, код, задания
3.85K subscribers
664 photos
5 videos
377 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
✍️ Сегодня воскресенье, а это значит, что мы разберём сложные задачи недели

1️⃣ У метода numpy.where следующие параметры:
▪️condition — условие, которое проверяется, результатом является булев массив того же размера, что и входной массив;
▪️x, y (опционально) — массивы, из которых выбираются элементы. Если условие истинно, numpy.where возвращает соответствующие элементы из x, в противном случае возвращает элементы из y.
Поэтому в задаче в результирующий массив на места True попали все элементы меньше 4 из arr, а на места False — -1. Сумма array([ 1, 2, 3, -1, -1]) равна 4.
2️⃣ pivot_table создаёт сводную таблицу в Pandas. В данном примере:
▪️index='A' определяет, что значения столбца 'A' используются в качестве индексов для сводной таблицы.
▪️columns='B' определяет, что из значений 'B' получатся столбцы сводной таблицы.
▪️values='C' определяет, что значения, которые будут агрегированы, берутся из столбца 'C'.
▪️fill_value=0 указывает, что если какое-либо значение отсутствует, то вместо NaN используется 0.
3️⃣ В стандартном алгоритме умножения матриц, чтобы получить элемент результирующей матрицы, мы производим n умножений и n-1 сложений. То есть каждое такое скалярное произведение занимает O(n). Результирующая матрица содержит n^2 элементов. Так, общее количество операций умножения (и приблизительно столько же операций сложения) равно n^2 * n = n^3. Поэтому вычислительная сложность получается O(n^3).
4️⃣ Рассмотрим все приведённые виды округлений:
▪️math.floor() округляет вниз к ближайшему целому числу;
▪️math.trunc() просто отбрасывает всё, что стоит после точки;
▪️math.ceil() округляет вверх к ближайшему целому числу.
Поэтому результат будет -2 -1 и -1

#разбор_задач
Сколько параметров будет у свёрточного слоя, заданного на картинке выше?
Anonymous Quiz
25%
18C
45%
36C^2
17%
18C^2
13%
36C
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Мы обучаем модель. На каждой итерации обучение идёт на тренировочных данных, а для оценки используются тестовые. Результаты оценки мы применяем для выбора и изменения различных гиперпараметров модели. Есть ли что-то неправильное в этом подходе?
Anonymous Quiz
71%
Если таких итераций много, модель может неявно приспособиться к тестовым данным
10%
Это просто неэффективно с вычислительной точки зрения
18%
Здесь всё в порядке
У каких графиков значение AUC больше 0.5?
Anonymous Poll
4%
1
10%
2
82%
3
15%
4
75%
5
Какая модель лучше применима для генерации текста к промпту?
Anonymous Quiz
20%
Декодер
24%
Энкодер
55%
Sequence-to-Sequence
🧠Чему вы бы хотели научиться?

Расскажите нам о ваших пожеланиях: какие навыки вы хотели бы прокачать в ближайшее время или какую профессию хотели бы приобрести?

За прохождение опроса вы получите промокод на скидку 15% на все наши курсы до конца 2024 года.

👉Опрос по ссылке👈
В каком диапазоне лежат значения коэффициента корреляции?
Anonymous Quiz
28%
[0, 1]
68%
[-1, 1]
3%
[-inf, +inf]
✍️ Очередной воскресный разбор сложных задач недели

1️⃣ Чтобы подсчитать количество параметров, следовало воспользоваться формулой: 2C*(2C*3*3+0). Прибавляем 0, так как bias=False. В результате получим 36C^2.
2️⃣ Здесь загвоздка в том, что b = (10) создаст на самом деле целое число, а не кортеж. Поэтому при попытке сложения с кортежем a возникнет ошибка. Чтобы создать кортеж в b, нужно записать так: b = (10,).
3️⃣ В этом вопросе нужно было посмотреть на перечисленные модели как на составные блоки определённых архитектур. Таким образом, если задача состоит в генерации текста на основе некоторого ввода (промпта), декодер является ключевым компонентом, так как он способен преобразовывать векторное представление (полученное от энкодера или другого источника) обратно в понятный и согласованный текст.

#разбор_задач
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
💬 Есть два типа людей, пишущих отзывы к фильмам: дотошные и ленивые. Дотошных в популяции 80%. Они оценивают 60% посмотренных фильмов как хорошие и 40% как плохие. Ленивых в популяции 20%. Они оценивают 100% фильмов как хорошие. Какова вероятность того, что некоторый фильм будет оценён как хороший?
Какова вероятность того, что случайно выбранная цифра будет больше 6?
Anonymous Quiz
12%
60%
62%
30%
10%
50%
16%
40%
Чему равно произведение вектора на матрицу с картинки выше?
Anonymous Quiz
4%
36
52%
[10, 13, 13]
1%
13
43%
[[3 4 3] [2 2 9] [1 6 6]]