Библиотека задач по Data Science | тесты, код, задания

Что такое сегментация объектов? Знаете ли вы какие-нибудь архитектуры для этого?

Сегментация объектов — это прогнозирование масок. Она не различает объекты. Архитектуры: Маска RCNN, UNet.

946 views07:25

Зачем нам на самом деле нужны свертки? Разве мы не можем использовать для этого полносвязные слои? ‍

Полносвязному слою требуется один вес на каждое межуровневое соединение, а это означает, что количество весов, которые необходимо вычислить, быстро увеличивается по мере увеличения количества слоев и узлов на слой.

868 views07:20

Библиотека задач по Data Science | тесты, код, задания

🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈

915 views06:00

Библиотека задач по Data Science | тесты, код, задания

Легко ли распараллелить обучение модели случайного леса? Как мы можем сделать это?

Да, например R предоставляет простой способ распараллелить обучение случайных лесов на больших данных. Используется параметр multicombine, для которого можно установить значение TRUE для распараллеливания вычислений случайного леса.

rf .multicombine=TRUE, .packages='randomForest') %dopar% {
randomForest(x, y, ntree=ntree)
}

1.0K views06:06

Библиотека задач по Data Science | тесты, код, задания

Знаете ли вы какие-либо методы уменьшения размерности?

✍️ Разложение по сингулярным значениям (SVD)
✍️ Анализ главных компонентов (PCA)
✍️ Линейный дискриминантный анализ (LDA)
✍️ T-distributed Stochastic Neighbor Embedding (t-SNE)
✍️ Автоэнкодеры
✍️ Преобразования Фурье и вейвлет-преобразования

985 views11:02

Библиотека задач по Data Science | тесты, код, задания

В чем заключается проклятие размерности? Почему нас это волнует?

Данные только в одном измерении упакованы относительно плотно. Добавление размера растягивает точки по этому измерению, раздвигая их дальше друг от друга. Дополнительные измерения еще больше расширяют данные, делая данные большой размерности чрезвычайно разреженными. Это важно, потому что трудно использовать машинное обучение в ограниченном пространстве.

862 views08:48

Библиотека задач по Data Science | тесты, код, задания

Для чего нужен Scrapy?

Scrapy — это фреймворк для извлечения данных из веб-сайтов. Он используется для автоматического сбора структурированных данных из веб-страниц, таких как цены товаров, информация о продуктах, контактные данные и многое другое.

Этот код создает веб-паука, который извлекает цены товаров с сайта example.com. Он использует CSS-селекторы для поиска элементов страницы, содержащих информацию о продуктах, и извлекает их название и цену.

908 views11:28

Библиотека задач по Data Science | тесты, код, задания

Курсы для тех, кто хочет получить новые скиллы или перейти в другую компанию на грейд выше

🔥Начните с демо-доступа или бесплатных вебинаров с преподавателем

🔹 Математика для Data Science

Самый хардкорный курс по вышмату! Идеален для тех, кто переходит в DS.

🔹 Алгоритмы и структуры данных

Курс, который на практике познакомит со сложными алгоритмами и научит писать более короткий и эффективный код.

🔹 Базовые модели ML и приложения

Познакомит с основными моделями машинного обучения, заложите основу для дальнейшего изучения более сложных нейронных сетей

🔹Архитектуры и шаблоны
проектирования

Освойте основные паттерны проектирования и прокачайте навыки построения архитектуры программного обеспечения

Приятного обучения и ваш промокод на скидку 30% до 25 октября – MIDDLE

961 views06:00

Библиотека задач по Data Science | тесты, код, задания

Что такое глубокое обучение?

Глубокое обучение — совокупность большого количества методов машинного обучения, основанных на имитации деятельности человеческого мозга в процессе обработки данных и принятия решений.

По сути они основаны на обучении представлениям, а не специализированным алгоритмам под определенные задачи. Из-за чего обучение нейронных сетей ведётся дольше, чем традиционное машинное обучение, но точность результатов получается выше.

971 views18:21

Библиотека задач по Data Science | тесты, код, задания

Какова цель A/B-тестирования?

A/B-тестирование — это статистическая проверка гипотез для рандомизированных экспериментов с двумя переменными, A и B.

Его цель — обнаружение любых изменений на веб-странице, чтобы максимизировать или повысить результат стратегии.

919 views18:59

Библиотека задач по Data Science | тесты, код, задания

Какой из перечисленных алгоритмов не использует коэффициент скорости обучения (Learning Rate) в качестве одного из его гиперпараметров?

Anonymous Quiz

10%

Градиентный бустинг (Gradient Boosting) и AdaBoost

12%

Градиентный бустинг (Gradient Boosting) и Случайный лес (Random Forest)

16%

Extra Trees и AdaBoost

62%

Extra Trees и Случайный лес (Random Forest)

235 voters881 views10:50

Библиотека задач по Data Science | тесты, код, задания

Опишите различные этапы аналитического проекта.

Понимание проблемы в бизнесе
Изучение и анализ данных
Подготовка данных для моделирования, включая удаление выбросов, преобразование переменных и обработку пропущенных значений
Запуск модели и анализ результатов для внесения соответствующих изменений или модификаций (итеративный процесс до достижения оптимальных результатов)
Проверка модели с использованием новых данных
Внедрение модели и отслеживание ее производительности для анализа эффективности

849 views09:58

Библиотека задач по Data Science | тесты, код, задания

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

832 views20:01

Библиотека задач по Data Science | тесты, код, задания

Когда стоит применять глубокое обучение?

Глубокое обучение стоит применять в следующих случаях:

1. Когда у вас есть большой объем данных. Глубокое обучение может эффективно использовать большие наборы данных и извлекать из них сложные закономерности.

2. Когда задача требует извлечения сложных признаков. Глубокие нейронные сети могут автоматически извлекать иерархические признаки из данных, что делает их полезными в задачах комплексного распознавания или классификации.

3. Когда требуется высокая точность предсказаний. Глубокие модели могут достичь высокой точности в различных задачах, таких как распознавание изображений, обработка естественного языка или рекомендательные системы.

4. Когда у вас есть доступ к достаточным ресурсам. Для обучения глубоких моделей требуется большая вычислительная мощность и память. Поэтому для использования глубокого обучения необходимо иметь доступ к соответствующему оборудованию или облачным сервисам.

5. Когда нет явного понимания задачи или какие признаки следует использовать. Глубокое обучение может быть полезным в ситуациях, когда нет ясного представления о том, какие признаки следует использовать для решения задачи, так как нейронные сети могут автоматически изучить релевантные признаки из данных.

Однако стоит отметить, что глубокое обучение может быть вычислительнозатратным и требовать большого количества данных для обучения. Поэтому иногда более простые модели могут быть более подходящими вариантами, особенно если у вас ограниченные ресурсы или небольшой объем данных.

906 views19:59

Библиотека задач по Data Science | тесты, код, задания

Каковы ключевые шаги аналитического проекта?

✍️ Изучение бизнес-проблемы и целей анализа.
✍️ Исследование данных и знакомство с ними.
✍️ Подготовка данных к моделированию путем их очистки (обнаружение выбросов и пропусков, трансформация переменных и т.д.)
✍️ Запуск модели и нахождение оптимальных гиперпараметров.
✍️ Валидация модели на новых данных.
✍️ Ввод модели в эксплуатацию и получение выводов на основе ее предсказаний.

923 views07:16

Библиотека задач по Data Science | тесты, код, задания

Что такое модуль __init__.py?

Модуль __init__.py является частью организации пакетов (packages) в Python. Этот файл используется для определения директории как пакета и может содержать код и переменные, которые будут доступны при импорте пакета. Важно отметить, что __init__.py не является обязательным для всех директорий, но он необходим, чтобы Python интерпретировал директорию как пакет.

941 views19:26

Библиотека задач по Data Science | тесты, код, задания

Какие виды аугментаций вы знаете?

Существует множество видов дополнений, которые можно использовать в зависимости от типа данных, с которыми вы работаете, включая геометрическое и числовое преобразование, PCA, обрезку, заполнение, сдвиг, введение шума и т. д.

803 views19:41

Библиотека задач по Data Science | тесты, код, задания

Объясните, что такое регуляризация и почему она полезна

Регуляризация в области машинного обучения — прием, который заключается в наложении дополнительных ограничений на условие задачи с целью предотвратить переобучение системы или решить некорректно поставленную задачу. В большинстве случаев эти ограничения выражаются в виде штрафа за избыточную сложность модели.

Прогнозы модели должны затем минимизировать функцию потерь, вычисленную на регуляризованном обучающем наборе.

825 views17:32

Библиотека задач по Data Science | тесты, код, задания

Что из следующего лучше всего описывает основную цель науки о данных?

Anonymous Quiz

Собирать и архивировать наборы данных из различных исходных систем для целей корпоративного учета.

84%

Извлекать,анализировать данные для выявления информации для улучшения деятельности,получения прибыли

15%

Для сбора и подготовки данных для использования в рамках аналитических приложений.

235 voters708 views10:08

Библиотека задач по Data Science | тесты, код, задания

842 views06:01

Библиотека задач по Data Science | тесты, код, задания

Запустится ли этот код на Python 3? Если да, то что он выведет?

sys.allow_boolean_assignment разрешает создавать переменные с именами, зарезервированными под идентификаторы типа bool. Поэтому этот код запустится и выведет "True is False".

Эта настройка введена в известном первоапрельском коммите, который до сих пор остался в коде интерпретатора. Если кандидат об этом знает, можно с уверенностью сказать, что он общается в должных профессиональных кругах и любят углубляться в детали.

926 views20:20

About

Blog

Apps

Platform