Библиотека задач по Data Science | тесты, код, задания

Как установить скорость обучения?

Не существует простого способа найти оптимальную скорость обучения модели. Обычно небольшие значения, такие как 0,01, это хорошая отправная точка для установки скорости обучения и дальнейшей ее настройки, чтобы модель не сходилась слишком медленно.

911 views07:15

Что будет выведено в результате выполнения данного кода?

Ответ:
list1 = [10, 'a']
list2 = [123]
list3 = [10, 'a']

Объяснение:
Многие могут ошибочно предположить, что list1 будет равен [10], а list3 будет равен ['a'], думая, что всякий раз при вызове функции extendList аргумент list будет равен значению по умолчанию [].

Однако, в действительности новый пустой список по умолчанию создается только один раз при определении функции. И затем этот список последовательно используется всякий раз, когда функция вызывается без второго аргумента. Это происходит потому, что значения по умолчанию вычисляются при определении функции, а не при ее вызове.

Таким образом, list1 и list3 имеют дело с одним и тем же списком по умолчанию, в то время как list2 использует пустой список, переданный ему во втором аргументе.

972 views07:21

Библиотека задач по Data Science | тесты, код, задания

Что такое PyCaret?

PyCaret — это библиотека машинного обучения с открытым исходным кодом и низким уровнем кода для Python, которая автоматизирует рабочие процессы машинного обучения. Она является инструментом для машинного обучения и управления моделями от начала до конца, который ускоряет цикл экспериментов в экспоненциальной степени.

В этом примере мы загружаем набор данных juice и используем его для решения задачи классификации. Мы инициализируем настройки с помощью функции setup, затем сравниваем различные модели с помощью функции compare_models и выбираем наилучшую.

Далее мы создаем модель решающего дерева с помощью функции create_model и настраиваем ее с помощью функции tune_model. Мы также можем оценить модель с помощью функции evaluate_model и использовать ее для прогнозирования на новых данных с помощью функции predict_model.

1.2K views18:14

Библиотека задач по Data Science | тесты, код, задания

Что такое регуляризация? Зачем нам это нужно?

Регуляризация используется для уменьшения переобучения в моделях машинного обучения. Это помогает моделям хорошо обобщать и делать их устойчивыми к выбросам и шуму в данных.

943 views07:14

Библиотека задач по Data Science | тесты, код, задания

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

1.0K views20:00

Библиотека задач по Data Science | тесты, код, задания

Что такое повышение градиента деревьев?

Повышение градиента — это метод машинного обучения для решения задач регрессии и классификации, который создает модель прогнозирования в виде ансамбля слабых моделей прогнозирования, обычно деревьев решений.

904 views12:01

Библиотека задач по Data Science | тесты, код, задания

Как очистить словарь?

Чтобы очистить словарь, а именно удалить все элементы, используйте метод clear().

Мы создадим словарь, инициализируем его парой ключ:значение и удалим их все с помощью метода clear().

854 views07:13

Библиотека задач по Data Science | тесты, код, задания

Самые полезные каналы для программистов в одной подборке!

Сохраняйте себе, чтобы не потерять 💾

🔥Для всех

Библиотека программиста — новости, статьи, досуг, фундаментальные темы
Книги для программистов
IT-мемы
Proglib Academy — тут мы рассказываем про обучение и курсы

🐘PHP

Библиотека пхпшника
Вакансии по PHP, Symfony, Laravel
Библиотека PHP для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по PHP — код, квизы и тесты

🐍Python

Библиотека питониста
Вакансии по питону, Django, Flask
Библиотека Python для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Python — код, квизы и тесты

☕Java

Библиотека джависта — полезные статьи по Java, новости и обучающие материалы
Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Java — код, квизы и тесты
Вакансии для java-разработчиков

👾Data Science

Библиотека Data Science — полезные статьи, новости и обучающие материалы
Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Data Science — код, квизы и тесты
Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту

🦫Go

Библиотека Go разработчика — полезные статьи, новости и обучающие материалы по Go
Библиотека Go для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по Go — код, квизы и тесты
Вакансии по Go

🧠C++

Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++
Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования
Библиотека задач по C++ — код, квизы и тесты
Вакансии по C++

💻Другие профильные каналы

Библиотека фронтендера
Библиотека шарписта
Библиотека мобильного разработчика
Библиотека хакера
Библиотека devops’a
Библиотека тестировщика

💼Каналы с вакансиями

Вакансии по фронтенду, джаваскрипт, React, Angular, Vue
Вакансии по C#, .NET, Unity Вакансии по PHP, Symfony, Laravel
Вакансии по DevOps & SRE
Вакансии для мобильных разработчиков
Вакансии по QA тестированию
InfoSec Jobs — вакансии по информационной безопасности

📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈

🤖Также у нас есть боты:
Бот с IT-вакансиями
Бот с мероприятиями в сфере IT

Мы в других соцсетях:
🔸VK
🔸YouTube
🔸Дзен
🔸Facebook
🔸Instagram

916 views06:00

Библиотека задач по Data Science | тесты, код, задания

С помощью какого пакета можно быстро определить язык текста?

В данном посте покажем, как с помощью библиотеки langdetect определить язык текстового фрагмента. Для начала необходимо поставить библиотеку — pip install langdetect.

Заметим, что код импортирован на питон из гугловской библиотеки language-detection, поэтому качество распознавания языка находится на уровне.

По умолчанию поддерживается 55 языков.

1.0K views18:33

Библиотека задач по Data Science | тесты, код, задания

Как тренировать деревья решений?

1. Начинаем с корневого узла.
2. Для каждой переменной X находим набор S_1, который минимизирует сумму примесей узла в двух дочерних узлах, и выбераем разделение {X*,S*}, которое дает минимум по всем X и S.
3. Если критерий остановки достигнут, выход. В противном случае применяем шаг 2 по очереди к каждому дочернему узлу.

1.0K views07:13

Библиотека задач по Data Science | тесты, код, задания

Что такое сегментация объектов? Знаете ли вы какие-нибудь архитектуры для этого?

Сегментация объектов — это прогнозирование масок. Она не различает объекты. Архитектуры: Маска RCNN, UNet.

947 views07:25

Библиотека задач по Data Science | тесты, код, задания

Зачем нам на самом деле нужны свертки? Разве мы не можем использовать для этого полносвязные слои? ‍

Полносвязному слою требуется один вес на каждое межуровневое соединение, а это означает, что количество весов, которые необходимо вычислить, быстро увеличивается по мере увеличения количества слоев и узлов на слой.

869 views07:20

Библиотека задач по Data Science | тесты, код, задания

🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈

916 views06:00

Библиотека задач по Data Science | тесты, код, задания

Легко ли распараллелить обучение модели случайного леса? Как мы можем сделать это?

Да, например R предоставляет простой способ распараллелить обучение случайных лесов на больших данных. Используется параметр multicombine, для которого можно установить значение TRUE для распараллеливания вычислений случайного леса.

rf .multicombine=TRUE, .packages='randomForest') %dopar% {
randomForest(x, y, ntree=ntree)
}

1.0K views06:06

Библиотека задач по Data Science | тесты, код, задания

Знаете ли вы какие-либо методы уменьшения размерности?

✍️ Разложение по сингулярным значениям (SVD)
✍️ Анализ главных компонентов (PCA)
✍️ Линейный дискриминантный анализ (LDA)
✍️ T-distributed Stochastic Neighbor Embedding (t-SNE)
✍️ Автоэнкодеры
✍️ Преобразования Фурье и вейвлет-преобразования

985 views11:02

Библиотека задач по Data Science | тесты, код, задания

В чем заключается проклятие размерности? Почему нас это волнует?

Данные только в одном измерении упакованы относительно плотно. Добавление размера растягивает точки по этому измерению, раздвигая их дальше друг от друга. Дополнительные измерения еще больше расширяют данные, делая данные большой размерности чрезвычайно разреженными. Это важно, потому что трудно использовать машинное обучение в ограниченном пространстве.

862 views08:48

Библиотека задач по Data Science | тесты, код, задания

Для чего нужен Scrapy?

Scrapy — это фреймворк для извлечения данных из веб-сайтов. Он используется для автоматического сбора структурированных данных из веб-страниц, таких как цены товаров, информация о продуктах, контактные данные и многое другое.

Этот код создает веб-паука, который извлекает цены товаров с сайта example.com. Он использует CSS-селекторы для поиска элементов страницы, содержащих информацию о продуктах, и извлекает их название и цену.

908 views11:28

Библиотека задач по Data Science | тесты, код, задания

Курсы для тех, кто хочет получить новые скиллы или перейти в другую компанию на грейд выше

🔥Начните с демо-доступа или бесплатных вебинаров с преподавателем

🔹 Математика для Data Science

Самый хардкорный курс по вышмату! Идеален для тех, кто переходит в DS.

🔹 Алгоритмы и структуры данных

Курс, который на практике познакомит со сложными алгоритмами и научит писать более короткий и эффективный код.

🔹 Базовые модели ML и приложения

Познакомит с основными моделями машинного обучения, заложите основу для дальнейшего изучения более сложных нейронных сетей

🔹Архитектуры и шаблоны
проектирования

Освойте основные паттерны проектирования и прокачайте навыки построения архитектуры программного обеспечения

Приятного обучения и ваш промокод на скидку 30% до 25 октября – MIDDLE

962 views06:00

Библиотека задач по Data Science | тесты, код, задания

Что такое глубокое обучение?

Глубокое обучение — совокупность большого количества методов машинного обучения, основанных на имитации деятельности человеческого мозга в процессе обработки данных и принятия решений.

По сути они основаны на обучении представлениям, а не специализированным алгоритмам под определенные задачи. Из-за чего обучение нейронных сетей ведётся дольше, чем традиционное машинное обучение, но точность результатов получается выше.

971 views18:21

About

Blog

Apps

Platform