Big data world
2.4K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
加入频道
Исследователи из Yandex Research опубликовали нейросеть RuLeanALBERT. На бенчмарках по пониманию языка она показывает результаты, сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art. Её открытый код можно использовать в проектах для классификации предложений, представления текстов и других языковых задач, не требующих генерации.

Самое интересное: эта модель хотя и имеет миллиарды параметров, но вполне способна вместиться в одну домашнюю GPU.

Гитхаб проекта: https://github.com/yandex-research/RuLeanALBERT
Статья исследователей: https://habr.com/ru/company/yandex/blog/688234/
📚Бесплатный ускоренный курс по машинному обучению от Беркли
Без регистрации, без всякой . Просто зайдите на сайт и начните обучение с самого начала! https://ml.berkeley.edu/blog/tag/crash-course

✏️Расширенное руководство по написанию подсказок для Midjourney (текст-в-изображение)
Подробная «шпаргалка» и некоторые ключевые слова для улучшения вывода изображения с помощью улучшенных подсказок.
https://shly.link/mdmReUP

✏️Системы машинного обучения и модели машинного обучения
Функционирующий продукт ИИ содержит больше, чем просто модель машинного обучения. Вам нужно добавить много ингредиентов в свой суп ML, чтобы он приносил пользу клиентам. Мы называем все эти ингредиенты вместе системой машинного обучения .
https://shly.link/FjVJu

✏️Почему TensorFlow для Python умирает медленной смертью
PyTorch проще в использовании и больше нравится многим разработчикам.
https://shly.link/mdmw5aq
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
YoHa: Практичный механизм отслеживания рук.

https://shly.link/ghnZdi
Stable Diffusion — очень мощный кодек для сжатия изображений

Stable Diffusion в настоящее время вдохновляет сообщество машинного обучения с открытым исходным кодом, а также расстраивает художников по всему миру. Мне было любопытно посмотреть, для чего еще можно использовать этот впечатляющий технологический релиз.

Прежде чем описывать мой метод и делиться кодом, вот несколько результатов по сравнению с JPG и WebP при высоких коэффициентах сжатия, все при разрешении 512x512 пикселей:
https://shly.link/j87dC
👍4
Освойте базовые инструменты DevOps за 3 дня. Погрузитесь в устройство систем Docker и GitLab CI. Напишите свой первый конвейер для автоматической сборки проекта на бесплатном онлайн-интенсиве Skillbox, который пройдёт 22–24 сентября в 21:00 по московскому времени.

Нужна только регистрация: 👉 https://clc.to/yZ-Uew.
Тем, кто зарегистрируется, сразу отправим на почту чек-лист «Погружаемся в DevOps».

Занятия проведёт опытный специалист, Lead DevOps, ведущий подкастов об IT и образовании — Константин Брюханов.

На интенсиве вы:

⚡️узнаете, что такое методология DevOps;
⚡️познакомитесь с профессией DevOps-инженера;
⚡️поймёте, какие задачи и с помощью каких инструментов решает DevOps;
⚡️выясните, как создать фундамент для работы;
⚡️узнаете, что такое Docker и как написать Dockerfile для проекта.

🎁 Всем дошедшим до конца интенсива дарим электронную книгу Пола Доэрти и Джеймса Уилсона «Человек + машина» издательства МИФ. Участвуйте, задавайте вопросы и получите сертификат на 10 000 рублей на любой курс Skillbox.
This media is not supported in your browser
VIEW IN TELEGRAM
Рад поделиться новой статьей о линейной регрессии в #MachineLearning !

https://shly.link/G5kBA
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Официальный репозиторий PyTorch для GAN's N' Roses. Разнообразный перевод селфи im2im и vid2vid в аниме.

https://shly.link/ghwCkF
👍6
Исследовательский анализ данных (EDA) в одной строке кода

Библиотека, которая предоставляет важную информацию о вашем наборе данных без написания большого количества кода.
https://shly.link/mdmhS73
👍3
Анализ количества подписчиков TikTok. Оказывается, эта величина весьма предсказуема, и одним из самых сильных сигналов является лицо владельца канала:

Что меня удивило, когда я впервые заглянул в него, так это не формат/контент, а люди в видеороликах, рекомендованных приложением. Лица людей, которых я там вижу, казались совсем не такими, какие я вижу в повседневной жизни, в сторону — как бы это сказать? — «условная привлекательность». Это очень необычно и существенно отличалось от других платформ видеохостинга — я никогда не сталкивался с этим при просмотре YouTube, например.

Я подумал, что это могут быть только мои внутренние предубеждения и то, как я лично воспринимал систему, поэтому я решил проанализировать данные, чтобы увидеть, есть ли на самом деле научные доказательства, подтверждающие мое утверждение. https://shly.link/mdmRERK
👍3
Если вы заинтересованы в изучении НАУКИ О ДАННЫХ, ВВОДА ДАННЫХ, АНАЛИТИКИ ДАННЫХ, EXCEL, вот ПОЛНОСТЬЮ ЗАГРУЖЕННЫЙ МАТЕРИАЛ для вас, все БЕСПЛАТНО.

https://mega.nz/folder/5Wp3nIiD#qsenYaT31KWhSEGGEAzOAQ
📚10 бесплатных курсов по математике для науки о данных, которые вы должны знать в 2022 году

Знание математики необходимо для понимания основ науки о данных. Так что, если вы хотите изучить математику для науки о данных , эта статья для вас. В этой статье вы найдете 10 лучших бесплатных курсов по математике для науки о данных .
https://shly.link/vW7fT

🔍Бинарный интеллект: как думает машина

Правда об экспоненциальном росте мыслящих машин
https://shly.link/mdm1uGR
👍1👎1
Испытайте себя в роли Data Scientist на бесплатном онлайн-интенсиве 6–8 октября. За 3 дня вы освоите основные рабочие инструменты и узнаете, с чем сталкиваются в работе специалисты по данным. Решите несколько реальных задач и оцените, интересна ли вам эта профессия.

Заполните форму и получите полезный материал по Data Science на почту: 🔜 https://clc.to/V5AXgg.
В нём вы найдёте список навыков, необходимых для прохождения собеседования, и советы, где искать первые заказы для портфолио.

На интенсиве вы:
✔️ построите модели для прогнозирования данных;
✔️ узнаете, как использовать язык Python для data-аналитики;
✔️ научитесь применять Data Science в бизнесе;
✔️ изучите техники исследования данных и разберёте реальные задачи;
✔️ создадите проект, который высоко оценят потенциальные работодатели.

🎁 Всем участникам, дошедшим до финала интенсива, подарим электронную книгу Пола Доэрти и Джеймса Уилсона «Человек + машина» издательства МИФ. Подключайтесь к прямым эфирам, задавайте вопросы и получите сертификат на 10 000 рублей на любой курс Skillbox.

Скорее записывайтесь!
This media is not supported in your browser
VIEW IN TELEGRAM
Stablediffusion-infinity: перекрашивание с помощью стабильной диффузии на бесконечном холсте

colab: https://shly.link/ge9MC

гитхаб: https://github.com/lkwq007/stablediffusion-infinity
500 AI Machine learning Deep learning Computer vision NLP проектов с кодом

https://shly.link/ghono2
Как работают диффузионные модели: математика с нуля

Диффузионные модели — это новый класс современных генеративных моделей, которые генерируют разнообразные изображения с высоким разрешением. Они уже привлекли к себе много внимания после того, как OpenAI, Nvidia и Google успели обучить крупномасштабные модели. Примерами архитектур, основанных на моделях диффузии, являются GLIDE, DALLE-2, Imagen и полная стабильная диффузия с открытым исходным кодом.

Но какой главный принцип стоит за ними?

В этом сообщении блога мы проложим путь от основных принципов.

https://shly.link/G1EdJ
This media is not supported in your browser
VIEW IN TELEGRAM
3d-diffusion

3D-генерация из одного изображения. 3DiM — это система искусственного интеллекта, которая создает 3D-рендеринг из одного входного изображения.

https://3d-diffusion.github.io/
This media is not supported in your browser
VIEW IN TELEGRAM
Модели генерации изображений — это увлекательные инструменты для изучения структуры визуального мира.

Генеративные модели изображений изучают «скрытое многообразие» визуального мира: низкоразмерное векторное пространство, где каждая точка отображается в изображение. Переход от такой точки коллектора обратно к отображаемому изображению называется «декодированием» — в модели стабильной диффузии этим занимается модель «декодер».

Однако Stable Diffusion — это не просто модель изображения, это также модель естественного языка. Он имеет два скрытых пространства: пространство представления изображения, изученное кодировщиком, используемым во время обучения, и быстрое скрытое пространство, которое изучено с использованием комбинации предварительного обучения и тонкой настройки во время обучения.
https://keras.io/examples/generative/random_walks_with_stable_diffusion/
🖼С KerasCV любой может использовать конвейер StableDiffusion с максимальной пропускной способностью для создания изображений!