Библиотека задач по Data Science | тесты, код, задания
3.85K subscribers
662 photos
5 videos
375 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
Какая модель лучше применима для генерации текста к промпту?
Anonymous Quiz
20%
Декодер
24%
Энкодер
55%
Sequence-to-Sequence
🧠Чему вы бы хотели научиться?

Расскажите нам о ваших пожеланиях: какие навыки вы хотели бы прокачать в ближайшее время или какую профессию хотели бы приобрести?

За прохождение опроса вы получите промокод на скидку 15% на все наши курсы до конца 2024 года.

👉Опрос по ссылке👈
В каком диапазоне лежат значения коэффициента корреляции?
Anonymous Quiz
28%
[0, 1]
68%
[-1, 1]
3%
[-inf, +inf]
✍️ Очередной воскресный разбор сложных задач недели

1️⃣ Чтобы подсчитать количество параметров, следовало воспользоваться формулой: 2C*(2C*3*3+0). Прибавляем 0, так как bias=False. В результате получим 36C^2.
2️⃣ Здесь загвоздка в том, что b = (10) создаст на самом деле целое число, а не кортеж. Поэтому при попытке сложения с кортежем a возникнет ошибка. Чтобы создать кортеж в b, нужно записать так: b = (10,).
3️⃣ В этом вопросе нужно было посмотреть на перечисленные модели как на составные блоки определённых архитектур. Таким образом, если задача состоит в генерации текста на основе некоторого ввода (промпта), декодер является ключевым компонентом, так как он способен преобразовывать векторное представление (полученное от энкодера или другого источника) обратно в понятный и согласованный текст.

#разбор_задач
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
💬 Есть два типа людей, пишущих отзывы к фильмам: дотошные и ленивые. Дотошных в популяции 80%. Они оценивают 60% посмотренных фильмов как хорошие и 40% как плохие. Ленивых в популяции 20%. Они оценивают 100% фильмов как хорошие. Какова вероятность того, что некоторый фильм будет оценён как хороший?
Какова вероятность того, что случайно выбранная цифра будет больше 6?
Anonymous Quiz
12%
60%
62%
30%
10%
50%
16%
40%
Чему равно произведение вектора на матрицу с картинки выше?
Anonymous Quiz
4%
36
52%
[10, 13, 13]
1%
13
43%
[[3 4 3] [2 2 9] [1 6 6]]
Чем меньше значения TP и TN в матрице ошибок, тем
Anonymous Quiz
31%
лучше
69%
хуже
✍️ Разбор сложных задач прошедшей недели

1️⃣ Как узнать произведение вектора на матрицу?
Сначала нужно проверить, совпадает ли число элементов в векторе с числом строк в матрице. В нашем примере есть вектор A размером 3 и матрица B размером 3x3, что делает умножение возможным.
Каждый элемент вектора умножается на соответствующий элемент строки матрицы, и результаты суммируются, чтобы получить новый элемент результата.
✔️Первый элемент: (1 * 3) + (2 * 2) + (3 * 1) = 3 + 4 + 3 = 10
✔️Второй элемент: (1 * 2) + (2 * 1) + (3 * 3) = 2 + 2 + 9 = 13
✔️Третий элемент: (1 * 1) + (2 * 3) + (3 * 2) = 1 + 6 + 6 = 13
Результат — [10, 13, 13].
2️⃣ У синтаксиса Python есть особенность. Символы {} используются для создания и словарей, и множеств. Но есть нюанс. Однако если мы хотим создать пустое множество, то такой способ уже не сработает. Необходимо воспользоваться конструкцией s = set(). Конструкция s = {} создаст пустой словарь.
3️⃣ Изолирующий лес позволяет искать выбросы в данных. С геометрической точки зрения дерево-классификатор разбивает пространство признаков на зоны прямоугольного вида. И когда мы ставим какую-то новую точку-объект, то она попадает в одну из зон.
Представим, что дерево строит эти прямоугольные зоны произвольным образом. Тогда мы будем считать, что объект изолировался, если дерево построило прямоугольник, в который попал только этот объект. Чаще всего такое происходит, если объект лежит где-то на периферии, то есть проще всего изолировать выбросы.
Для алгоритма изолирующий лес нужно:
▪️Построить N деревьев.
▪️Каждое дерево строится до исчерпания выборки.
▪️Для ветвления в дереве выбирается случайный признак и случайное значение для расщепления.
▪️В конце концов для каждого объекта считается мера нормальности — среднее арифметическое глубин листьев, в который он попал, или изолировался. Выбросы будут попадать в листья на более ранних этапах построения дерева.

#разбор_задач
Чему равен градиент функции f(u,v)=u*v+1 в точке (1,2)?
Anonymous Quiz
5%
(1,1)
32%
(2,1)
17%
(1,2)
8%
(2,2)
32%
3
6%
1
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.