Библиотека задач по Data Science | тесты, код, задания
3.85K subscribers
664 photos
5 videos
377 links
Задачи и тесты по Data Science для тренировки и обучения.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/fa77bf4e

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://yangx.top/proglibrary/9197
加入频道
Будущим специалистам по DS или аналитикам данных важно подружиться с математикой🤜 🤛

Математика умножит ваши шансы на хороший оффер. И обычно именно на этих позициях ценится классическое образование в хорошем ВУЗе.

Но а что делать тем, кто не знал в 18 лет, что свяжет свою жизнь с DS?

Для этого есть полугодовой курс от преподавателей МГУ! Он объемный и довольно сложный, так как соответсвует университестким стандартам.

Подробности – https://proglib.academy/mathspro?utm_source=tg_ds

Там все по канонам классического образования:

1. Лекции по 1,5 часа.
2. Много практики, подробная обратная связь от преподателей.
3. Общий чатик со студентами, где можно получить поддержку от сокурсников.

Посмотрите примеры занятий
Дано 32-битное целое число x со знаком, верните x с обратными цифрами. Если изменение x приводит к выходу значения за пределы диапазона 32-битных целых чисел со знаком [-231, 231 - 1], верните 0.

Предположим, что среда не позволяет хранить 64-битные целые числа (со знаком или без знака).

Завтра разбираем оптимальное решение
Разбор вчерашней задачи

Шаг 1. Извлекаем цифру из первой позиции x с помощью оператора по модулю и сохранияем ее.

Шаг 2. Добавляем эту цифру как самую правую.

Шаг 3: Удаляем из x и продолжаем, пока x не станет равным 0.
Можно ли осуществить возврат нескольких значений из функции?

Вот как это сделать.
Что такое сложность алгоритма и от чего она зависит?

Сложность алгоритма — это количественная характеристика его эффективности, которая показывает, как зависят затраты ресурсов (времени, памяти) от размера входных данных.

Сложность зависит от:
— Объема операций, которые алгоритм выполняет при обработке данных.
— Количества итераций циклов, рекурсивных вызовов.
— Зависимости числа операций от размера входных данных.
— Операций внутри вложенных циклов и структур.

Чем быстрее растёт сложность функции с ростом входных данных, тем менее эффективен алгоритм.
Как нам решить, когда прекратить обучение нейронной сети?

Просто прекратите обучение, когда validation error станет минимальной.
Каковы преимущества единого дерева решений по сравнению с более сложными моделями?
Anonymous Quiz
9%
легко реализовать
22%
хорошая объяснимость
1%
быстрый вывод
10%
быстрое обучение
59%
все вышеперечисленное
Как установить скорость обучения?

Не существует простого способа найти оптимальную скорость обучения модели. Обычно небольшие значения, такие как 0,01, это хорошая отправная точка для установки скорости обучения и дальнейшей ее настройки, чтобы модель не сходилась слишком медленно.
Что будет выведено в результате выполнения данного кода?

Ответ:
list1 = [10, 'a']
list2 = [123]
list3 = [10, 'a']

Объяснение:
Многие могут ошибочно предположить, что list1 будет равен [10], а list3 будет равен ['a'], думая, что всякий раз при вызове функции extendList аргумент list будет равен значению по умолчанию [].

Однако, в действительности новый пустой список по умолчанию создается только один раз при определении функции. И затем этот список последовательно используется всякий раз, когда функция вызывается без второго аргумента. Это происходит потому, что значения по умолчанию вычисляются при определении функции, а не при ее вызове.

Таким образом, list1 и list3 имеют дело с одним и тем же списком по умолчанию, в то время как list2 использует пустой список, переданный ему во втором аргументе.
Что такое PyCaret?

PyCaret — это библиотека машинного обучения с открытым исходным кодом и низким уровнем кода для Python, которая автоматизирует рабочие процессы машинного обучения. Она является инструментом для машинного обучения и управления моделями от начала до конца, который ускоряет цикл экспериментов в экспоненциальной степени.

В этом примере мы загружаем набор данных juice и используем его для решения задачи классификации. Мы инициализируем настройки с помощью функции setup, затем сравниваем различные модели с помощью функции compare_models и выбираем наилучшую.

Далее мы создаем модель решающего дерева с помощью функции create_model и настраиваем ее с помощью функции tune_model. Мы также можем оценить модель с помощью функции evaluate_model и использовать ее для прогнозирования на новых данных с помощью функции predict_model.
Что такое регуляризация? Зачем нам это нужно?

Регуляризация используется для уменьшения переобучения в моделях машинного обучения. Это помогает моделям хорошо обобщать и делать их устойчивыми к выбросам и шуму в данных.
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Что такое повышение градиента деревьев?

Повышение градиента — это метод машинного обучения для решения задач регрессии и классификации, который создает модель прогнозирования в виде ансамбля слабых моделей прогнозирования, обычно деревьев решений.
Как очистить словарь?

Чтобы очистить словарь, а именно удалить все элементы, используйте метод clear().

Мы создадим словарь, инициализируем его парой ключ:значение и удалим их все с помощью метода clear().