BigData
3.3K subscribers
753 photos
89 videos
3 files
834 links
Data Science : Big Data : Machine Learning : Deep Learning. По всем вопросам @evgenycarter
加入频道
SINE: SINgle Image Editing with Text-to-Image Diffusion Models

Модель диффузии для генерации контента всего лишь из одного изображения.


🖥 Github: https://github.com/zhang-zx/sine

➡️ Project: https://zhang-zx.github.io/SINE/

Paprer: https://arxiv.org/abs/2212.04489

❤️ Colab: https://colab.research.google.com/github/zhang-zx/SINE/blob/master/SINE.ipynb


👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1
PyPop7 (Pure-PYthon library of POPulation-based black-box OPtimization)

Интерфейс для более чем 60 вариантов различных алгоритмов оптимизации.

$ pip install pypop7

🖥 Github: https://github.com/evolutionary-intelligence/pypop

Paprer: https://arxiv.org/abs/2212.05652v1

⭐️ Derivative-Free Optimization (DFO): https://link.springer.com/article/10.1007/s10208-021-09513-z


👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
ECON: Explicit Clothed humans Obtained from Normals

ECON разработан для «оцифровки человека из изображения». ECON помогает высокоточно выдедить одетых людей на изображении , в люблй одежде и в сложных позах. ECON также поддерживает реконструкцию нескольких человек и анимацию на основе SMPL-X.

🖥 Github: https://github.com/YuliangXiu/ECON

Paprer: https://arxiv.org/abs/2212.07422

📎 Demo: https://github.com/YuliangXiu/ECON#demo

✔️ Instructions: https://github.com/YuliangXiu/ECON#instructions

👉 @bigdata_1
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
StackExplain

Cкрипт на основе ChatGPT, который выведет и обьяснит ошибку в вашем коде.

$ pip3 install stackexplain

https://github.com/shobrook/stackexplain

https://habr.com/ru/companies/getmatch/articles/704680/

👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
DeepLSD: Line Segment Detection and Refinement with Deep Image Gradients

DeepLSD — это универсальный линейный детектор, который распознает объекты с точностью ручного распознавания. Он подходит для любых задач, требующих высокой точности при сегментации и распознавании объектов.

git clone --recurse-submodules [email protected]:cvg/DeepLSD.git
cd DeepLSD


🖥 Github: https://github.com/cvg/deeplsd

Paprer: https://arxiv.org/abs/2212.07766v1

✔️ Dataset: https://paperswithcode.com/dataset/hpatches

👉 @bigdata_1
👍71😁1
Optimizing Prompts for Text-to-Image Generation

Передовой алгоритм, облегчающие работу с языковыми моделями, для автоматической оптимизации промптов.

🖥 Github: https://github.com/microsoft/lmops

➡️Paprer: https://arxiv.org/abs/2212.09611v1

✔️Dataset: https://paperswithcode.com/dataset/diffusiondb

💨 Transformers at Scale: https://github.com/microsoft/torchscale

👉 @bigdata_1
Scalable Diffusion Models with Transformers (DiT)

Новый класс моделей диффузии, основанный на архитектуре трансформеров.Модели DiT-XL/2 не только обладают хорошей масштабируемостью, но и превосходят все предшествующие диффузионные модели на тестах.

git clone https://github.com/facebookresearch/DiT.git

🖥 Github: https://github.com/facebookresearch/DiT

🖥 Colab: http://colab.research.google.com/github/facebookresearch/DiT/blob/main/run_DiT.ipynb

⭐️ Project: https://www.wpeebles.com/DiT

Paprer: http://arxiv.org/abs/2212.09748

✔️ Dataset: https://paperswithcode.com/dataset/imagenet

👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Generalized Decoding for Pixel, Image, and Language

X-Decoder - первая модель, которая поддерживает все типы сегментации изображений, способной эффективно решать различные задачи CV и VL.

🖥 Github: https://github.com/microsoft/X-Decoder

🤗 Hugging Face Demo: https://huggingface.co/spaces/xdecoder/Demo

⭐️ Project: https://x-decoder-vl.github.io/

Paprer: https://arxiv.org/pdf/2212.11270.pdf

✔️ Dataset: https://paperswithcode.com/dataset/visual-genome

👉 @bigdata_1
👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Neural Cloth Simulation

ИИ для анимации и генерации одежды.

🖥 Github: https://github.com/hbertiche/NeuralClothSim

⭐️ Project: https://hbertiche.github.io/NeuralClothSim/

✅️ Paprer: arxiv.org/pdf/2211.13226.pdf


👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
JRBD: Egocentric Perception of Humans

Стэнфорд JRDB-Pose: набор размеченных данных с более чем 600 000 позами тел.

⭐️ Dataset: https://jrdb.erc.monash.edu/

🖥 Github: https://github.com/JRDB-dataset/jrdb_toolkit/

JRDB-Pose: https://jrdb.erc.monash.edu/dataset/pose#toolkit

Paper: arxiv.org/pdf/1910.11792.pdf

👉 @bigdata_1
3👍1
Language Models are Few-shot Multilingual Learners

Github: https://github.com/gentaiscool/few-shot-lm

Paper: https://arxiv.org/abs/2109.07684v1

👉 @bigdata_1
🔥2👍1
Orion

Проект с открытым исходным кодом от Data до AI Lab от MIT.
Orion — это библиотека машинного обучения, созданная для обнаружения аномалий во временных рядах.

pip install orion-ml

🖥 Github: https://github.com/sintel-dev/orion

⭐️ Notebooks: https://drive.google.com/drive/folders/1FAcCEiE1JDsqaMjGcmiw5a5XuGh13c9Q?usp=sharing

Paper: https://arxiv.org/abs/2212.13558v1

Docs: https://sintel.dev/Orion/

Datalab: https://dai.lids.mit.edu/

👉 @bigdata_1
👍41
The Forward-Forward Algorithm: Some Preliminary Investigations

Цель этой статьи — представить новую процедуру обучения для нейронных сетей и продемонстрировать, что она работает хорошо на нескольких небольших задачах и заслуживает внимания для дальнейшего изучения. Алгоритм Forward-Forward заменяет метод прямого распространения и метод обратного распространения двумя прямыми проходами, один с положительными (то есть реальными) данными, а другой с отрицательными данными, которые сгенерированы самой сетью. Forward-Forward не требует вычисления функции потерь по отношению к параметрам сети. Вместо этого каждый шаг оптимизации может выполняться локально, а веса каждого слоя могут обновляться сразу же после того, как слой отработал.

git clone https://github.com/nebuly-ai/nebullvm.git
cd nebullvm/apps/accelerate/forward_forward

🖥 Github: https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/forward_forward

⭐️ Paper: https://arxiv.org/abs/2212.13345v1

Dataset: https://paperswithcode.com/dataset/cifar-10

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
ConvNeXt V2

Meta выпустила ConvNeXt V2 на PyTorch для 8 видов моделей (Atto, Femto, Pico, Nano, Tiny, Base, Large, Huge), код обученной модели, настройки и веса (преобразованные из весов JAX, обученных на TPU) для ConvNeXt V2. х. ConvNets работал лучше, чем Трансформеры для задач компьютерного зрения, а ConvNeXt V2, значительно превосходит производительность сетей ConvNet на тестах.

🖥 Github: https://github.com/facebookresearch/convnext-v2

⭐️ Paper: https://arxiv.org/abs/2301.00808v1

Dataset: https://paperswithcode.com/dataset/coco

👉 @bigdata_1
👍5
PACO: Parts and Attributes of Common Objects

Meta опубликовала огромный датасет. PACO — это набор данных, содержащий 641 000 аннотированных объектов и их и частей .

🖥 Github https://github.com/facebookresearch/paco

⭐️ Paper https://arxiv.org/abs/2301.01795v1

👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Интернет вещей -- "новый черный" в высоких технологиях. Мы начинаем "привыкать к хорошему", и вау-эффект сменяется "а, значит можно так было?!" Технологии с использованием индустриальных IoT-решений приходят и в такие глобальные отрасли экономики, как строительство и транспорт.
О том, что транспортная отрасль сталкивается с рядом вызовов, говорили эксперты и участники рынка на Форуме "Цифровая транспортация 2024" @dtla_ru в технологическом кластере "Ломоносов".
В рамках его мероприятий было запущено движение беспилотных грузовиков по трассе М-11, а РЖД и партнёры представили итоги внедрения Интернета вещей.
ГК "ИНСПАРК" @InsparkGroup разработчик отечественной Inspark.IoT Platform, продемонстрировал, насколько прозрачными и управляемыми могут стать такие важнейшие объекты инфраструктуры, как железнодорожный мост, компрессорная станция, участки пути. Их "цифровые двойники" уже передают массивы данных для онлайн -мониторинга обслуживающим специалистам.
По словам Олега Крупенко, генерального директора ГК "ИНСПАРК", скоро
цифровое проектирование по ТИМ-модели и работа с "цифровыми двойниками" станут "золотым стандартом" при  проектировании и эксплуатации транспортных объектов такого масштаба.

Больше новостей Интернета вещей / IoT-технологий 🔜 @InsparkGroup
👍4👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Audio-Visual Efficient Conformer for Robust Speech Recognition

Улучшенный метод чтения по губам, с помощью архитектуры Conformer Connectionist Temporal Classification (CTC) для обработки аудио и видео.


🖥 Github
https://github.com/burchim/avec
✔️ Paper https://arxiv.org/abs/2301.01456
🔥Notebook https://colab.research.google.com/github/burchim/AVEC/blob/master/demo.ipynb
🚀 Models https://github.com/burchim/avec#Models

👉 @bigdata_1
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Neural Deferred Shading

Новая быстрая многоракурсная 3D-реконструкция с произвольными объектами и настраиваемым освещением.

🖥 Github: github.com/fraunhoferhhi/neural-deferred-shading

⭐️ Project: fraunhoferhhi.github.io/neural-deferred-shading

✅️ Paprer: https://mworchel.github.io/assets/papers/neural_deferred_shading_with_supp.pdf

Pyremesh : https://github.com/sgsellan/botsch-kobbelt-remesher-libigl

❤️Video: https://www.youtube.com/watch?v=nIqmuylmpFY

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1