BigData
3.3K subscribers
753 photos
89 videos
3 files
834 links
Data Science : Big Data : Machine Learning : Deep Learning. По всем вопросам @evgenycarter
加入频道
Scalable Diffusion Models with Transformers (DiT)

Новый класс моделей диффузии, основанный на архитектуре трансформеров.Модели DiT-XL/2 не только обладают хорошей масштабируемостью, но и превосходят все предшествующие диффузионные модели на тестах.

git clone https://github.com/facebookresearch/DiT.git

🖥 Github: https://github.com/facebookresearch/DiT

🖥 Colab: http://colab.research.google.com/github/facebookresearch/DiT/blob/main/run_DiT.ipynb

⭐️ Project: https://www.wpeebles.com/DiT

Paprer: http://arxiv.org/abs/2212.09748

✔️ Dataset: https://paperswithcode.com/dataset/imagenet

👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Generalized Decoding for Pixel, Image, and Language

X-Decoder - первая модель, которая поддерживает все типы сегментации изображений, способной эффективно решать различные задачи CV и VL.

🖥 Github: https://github.com/microsoft/X-Decoder

🤗 Hugging Face Demo: https://huggingface.co/spaces/xdecoder/Demo

⭐️ Project: https://x-decoder-vl.github.io/

Paprer: https://arxiv.org/pdf/2212.11270.pdf

✔️ Dataset: https://paperswithcode.com/dataset/visual-genome

👉 @bigdata_1
👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Neural Cloth Simulation

ИИ для анимации и генерации одежды.

🖥 Github: https://github.com/hbertiche/NeuralClothSim

⭐️ Project: https://hbertiche.github.io/NeuralClothSim/

✅️ Paprer: arxiv.org/pdf/2211.13226.pdf


👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
JRBD: Egocentric Perception of Humans

Стэнфорд JRDB-Pose: набор размеченных данных с более чем 600 000 позами тел.

⭐️ Dataset: https://jrdb.erc.monash.edu/

🖥 Github: https://github.com/JRDB-dataset/jrdb_toolkit/

JRDB-Pose: https://jrdb.erc.monash.edu/dataset/pose#toolkit

Paper: arxiv.org/pdf/1910.11792.pdf

👉 @bigdata_1
3👍1
Language Models are Few-shot Multilingual Learners

Github: https://github.com/gentaiscool/few-shot-lm

Paper: https://arxiv.org/abs/2109.07684v1

👉 @bigdata_1
🔥2👍1
Orion

Проект с открытым исходным кодом от Data до AI Lab от MIT.
Orion — это библиотека машинного обучения, созданная для обнаружения аномалий во временных рядах.

pip install orion-ml

🖥 Github: https://github.com/sintel-dev/orion

⭐️ Notebooks: https://drive.google.com/drive/folders/1FAcCEiE1JDsqaMjGcmiw5a5XuGh13c9Q?usp=sharing

Paper: https://arxiv.org/abs/2212.13558v1

Docs: https://sintel.dev/Orion/

Datalab: https://dai.lids.mit.edu/

👉 @bigdata_1
👍41
The Forward-Forward Algorithm: Some Preliminary Investigations

Цель этой статьи — представить новую процедуру обучения для нейронных сетей и продемонстрировать, что она работает хорошо на нескольких небольших задачах и заслуживает внимания для дальнейшего изучения. Алгоритм Forward-Forward заменяет метод прямого распространения и метод обратного распространения двумя прямыми проходами, один с положительными (то есть реальными) данными, а другой с отрицательными данными, которые сгенерированы самой сетью. Forward-Forward не требует вычисления функции потерь по отношению к параметрам сети. Вместо этого каждый шаг оптимизации может выполняться локально, а веса каждого слоя могут обновляться сразу же после того, как слой отработал.

git clone https://github.com/nebuly-ai/nebullvm.git
cd nebullvm/apps/accelerate/forward_forward

🖥 Github: https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/forward_forward

⭐️ Paper: https://arxiv.org/abs/2212.13345v1

Dataset: https://paperswithcode.com/dataset/cifar-10

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
ConvNeXt V2

Meta выпустила ConvNeXt V2 на PyTorch для 8 видов моделей (Atto, Femto, Pico, Nano, Tiny, Base, Large, Huge), код обученной модели, настройки и веса (преобразованные из весов JAX, обученных на TPU) для ConvNeXt V2. х. ConvNets работал лучше, чем Трансформеры для задач компьютерного зрения, а ConvNeXt V2, значительно превосходит производительность сетей ConvNet на тестах.

🖥 Github: https://github.com/facebookresearch/convnext-v2

⭐️ Paper: https://arxiv.org/abs/2301.00808v1

Dataset: https://paperswithcode.com/dataset/coco

👉 @bigdata_1
👍5
PACO: Parts and Attributes of Common Objects

Meta опубликовала огромный датасет. PACO — это набор данных, содержащий 641 000 аннотированных объектов и их и частей .

🖥 Github https://github.com/facebookresearch/paco

⭐️ Paper https://arxiv.org/abs/2301.01795v1

👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Интернет вещей -- "новый черный" в высоких технологиях. Мы начинаем "привыкать к хорошему", и вау-эффект сменяется "а, значит можно так было?!" Технологии с использованием индустриальных IoT-решений приходят и в такие глобальные отрасли экономики, как строительство и транспорт.
О том, что транспортная отрасль сталкивается с рядом вызовов, говорили эксперты и участники рынка на Форуме "Цифровая транспортация 2024" @dtla_ru в технологическом кластере "Ломоносов".
В рамках его мероприятий было запущено движение беспилотных грузовиков по трассе М-11, а РЖД и партнёры представили итоги внедрения Интернета вещей.
ГК "ИНСПАРК" @InsparkGroup разработчик отечественной Inspark.IoT Platform, продемонстрировал, насколько прозрачными и управляемыми могут стать такие важнейшие объекты инфраструктуры, как железнодорожный мост, компрессорная станция, участки пути. Их "цифровые двойники" уже передают массивы данных для онлайн -мониторинга обслуживающим специалистам.
По словам Олега Крупенко, генерального директора ГК "ИНСПАРК", скоро
цифровое проектирование по ТИМ-модели и работа с "цифровыми двойниками" станут "золотым стандартом" при  проектировании и эксплуатации транспортных объектов такого масштаба.

Больше новостей Интернета вещей / IoT-технологий 🔜 @InsparkGroup
👍4👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Audio-Visual Efficient Conformer for Robust Speech Recognition

Улучшенный метод чтения по губам, с помощью архитектуры Conformer Connectionist Temporal Classification (CTC) для обработки аудио и видео.


🖥 Github
https://github.com/burchim/avec
✔️ Paper https://arxiv.org/abs/2301.01456
🔥Notebook https://colab.research.google.com/github/burchim/AVEC/blob/master/demo.ipynb
🚀 Models https://github.com/burchim/avec#Models

👉 @bigdata_1
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Neural Deferred Shading

Новая быстрая многоракурсная 3D-реконструкция с произвольными объектами и настраиваемым освещением.

🖥 Github: github.com/fraunhoferhhi/neural-deferred-shading

⭐️ Project: fraunhoferhhi.github.io/neural-deferred-shading

✅️ Paprer: https://mworchel.github.io/assets/papers/neural_deferred_shading_with_supp.pdf

Pyremesh : https://github.com/sgsellan/botsch-kobbelt-remesher-libigl

❤️Video: https://www.youtube.com/watch?v=nIqmuylmpFY

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Image Similarity with Hugging Face Datasets and Transformers

In this post, you'll learn to build an image similarity system wich Transformers.

Полезная статья, с которой вы создадите систему поиска сходства изображений с помощью Transformers. Можно немного попрактиковаться и попробовать другие модели.

Huggingface https://huggingface.co/blog/image-similarity
Github https://github.com/huggingface/blog/blob/main/image-similarity.md
Colab https://colab.research.google.com/github/huggingface/notebooks/blob/main/examples/image_similarity.ipynb

👉 @bigdata_1
👍1
Основы Data Science: от Numpy до PostgreSQL
Хочешь освоить ключевые инструменты анализа данных? Этот тренажер — твоё лучшее начало для погружения в Data Science!

Что ты изучишь:
- Основы Python и работу с мощными библиотеками Numpy и Pandas.
- Математические основы для Data Science, включая регрессию, классификацию и кластеризацию.
- Работа с базами данных с использованием SQL и PostgreSQL.
- Практические задания и проекты для портфолио, которые подготовят тебя к реальным задачам.

Кому подойдет курс - тренажер?
1.Новичкам в аналитике данных и тем, кто хочет развиваться в сторону ML-инженера.
2.Администраторам баз данных, которые стремятся автоматизировать задачи и повысить эффективность управления данными.
3.Инженерам данных, которым нужно улучшить навыки предобработки данных для машинного обучения.

Как изменится твоя работа
📊Аналитики данных:
До курса: Затруднения с обработкой больших объемов данных, выполнение задач вручную.
После курса: Эффективная работа с Numpy и Pandas, умение визуализировать данные с помощью MatPlotLib, выполнение SQL-запросов для работы с базами данных.
💻Администраторы баз данных:
До курса: Отсутствие автоматизации и инструментов для анализа данных.
После курса: Автоматизация рутинных задач, уверенная работа с SQL и PostgreSQL, создание визуальных отчетов.
🛠Инженеры данных:
До курса: Сложности с предобработкой данных для ML-моделей.
После курса: Быстрая и эффективная обработка данных с Numpy и Pandas, умение визуализировать результаты и работать с PostgreSQL.

🎓 Первый урок доступен бесплатно в демо - доступе

В демо-версии курса ты познакомишься с библиотекой Numpy: научишься создавать и редактировать массивы, работать с изображениями и применять этот навык для решения задач в любой области работы с данными и решишь более 6 практических задач!

Регистрация на демо-доступ

Реклама. Информация о рекламодателе
🔥3
Msanii: High Fidelity Music Synthesis on a Shoestring Budget

Model combines the expressiveness of mel spectrograms, the generative capabilities of diffusion models, and the vocoding capabilities of neural vocoders.

Новая модель на основе диффузии для эффективного синтеза длинной музыки высокого качества.

pip install -q git+https://github.com/Kinyugo/msanii.git

🖥 Github: https://github.com/kinyugo/msanii

⭐️ Demo: https://kinyugo.github.io/msanii-demo/

⭐️ Colab: https://colab.research.google.com/github/Kinyugo/msanii/blob/main/notebooks/msanii_demo.ipynb

✅️ Paper: https://arxiv.org/abs/2301.06468

🤗Hugging face: https://huggingface.co/spaces/kinyugo/msanii

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Deep Learning Tuning Playbook

This document is for engineers and researchers (both individuals and teams) interested in maximizing the performance of deep learning models.

Этот репозиторий-книга от специалистов Google Research с практическими советами по максимальному повышению производительности моделей глубокого обучения.

Github https://github.com/google-research/tuning_playbook#who-is-this-document-for

Reddit https://www.reddit.com/r/MachineLearning/comments/10gxtao/d_deep_learning_tuning_playbook_recently_released/


👉 @bigdata_1
👍2
Media is too big
VIEW IN TELEGRAM
OnePose++: One-Shot Pose

Keypoint-free one-shot object pose estimation method that handles low-textured objects without knowing CAD models.

Новый метод захвата объектов без ключевых точек, который значительно превосходит существующие методы и может работать с низкотекстурированными объектами.


🖥 Github: https://github.com/zju3dv/OnePose_Plus_Plus

✅️ Paper: https://openreview.net/pdf?id=BZ92dxDS3tO

⭐️ Project: https://zju3dv.github.io/onepose_plus_plus

Dataset: https://zjueducn-my.sharepoint.com/:f:/g/personal/12121064_zju_edu_cn/ElfJC7FiK75Hhh1CF0sPVSQBdzJpeWpOfj8TZzRuxo9PUg?e=Pbnbi8

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21