BigData
3.3K subscribers
753 photos
89 videos
3 files
834 links
Data Science : Big Data : Machine Learning : Deep Learning. По всем вопросам @evgenycarter
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Score Jacobian Chaining: Lifting Pretrained 2D Diffusion Models for 3D Generation

Метод, который преобразует предварительно обученную 2D-генеративную модель диффузии на изображениях в 3D-генеративную модель, не требуя каких-либо 3D-данных.

pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

🖥 Github: https://github.com/pals-ttic/sjc

Paprer: https://arxiv.org/abs/2212.00774v1

✅️Colab: https://colab.research.google.com/drive/1zixo66UYGl70VOPy053o7IV_YkQt5lCZ

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
3❤‍🔥1👍1🔥1
Melody transcription via generative pre-training

Sheet Sage транскрибирует вашу любимую песню в лид-лист, содержащий ноты и аккорды!

🖥 Github: https://github.com/chrisdonahue/sheetsage

Paprer: https://arxiv.org/abs/2212.01884v1

⭐️ Dataset: https://www.hooktheory.com/theorytab

👉 @bigdata_1
👍21
DiffusionInst: Diffusion Model for Instance Segmentation

DiffusionInst — первый алгоритм диффузионной модели для сегментации объектов.

🖥 Github:https://github.com/chenhaoxing/DiffusionInst

🌐 Instruction: https://github.com/chenhaoxing/DiffusionInst/blob/main/GETTING_STARTED.md

Paprer: https://arxiv.org/abs/2212.02773v2

⭐️ Dataset: https://paperswithcode.com/dataset/lvis

👉 @bigdata_1
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Learning Video Representations from Large Language Models

Новая Модель отт мета, которая автоматичеси генерирует текстовое описание для видео.

🖥 Github: https://github.com/facebookresearch/lavila

💡 Demo: https://huggingface.co/spaces/nateraw/lavila

Paprer: http://arxiv.org/abs/2212.04501

❤️ Colab: https://colab.research.google.com/drive/1gHWiEWywIotRivYQTR-8NQ6GJC7sJUe4

⭐️ Dataset: https://paperswithcode.com/dataset/hmdb51

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
evosax: JAX-based Evolution Strategies

QDax — это инструмент для ускорения алгоритмов Quality-Diversity (QD) и нейроэволюции.

🖥 Github: https://github.com/adaptive-intelligent-robotics/qdax

🎷 Evosax: https://github.com/RobertTLange/evosax

Paprer: https://arxiv.org/abs/2212.04180v1

🚀 Docs: https://qdax.readthedocs.io/en/latest/

❤️ Colab: https://colab.research.google.com/github/adaptive-intelligent-robotics/QDax/blob/main/examples/mapelites.ipynb

⭐️ Dataset: https://paperswithcode.com/dataset/brax

👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
SINE: SINgle Image Editing with Text-to-Image Diffusion Models

Модель диффузии для генерации контента всего лишь из одного изображения.


🖥 Github: https://github.com/zhang-zx/sine

➡️ Project: https://zhang-zx.github.io/SINE/

Paprer: https://arxiv.org/abs/2212.04489

❤️ Colab: https://colab.research.google.com/github/zhang-zx/SINE/blob/master/SINE.ipynb


👉 @bigdata_1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1
PyPop7 (Pure-PYthon library of POPulation-based black-box OPtimization)

Интерфейс для более чем 60 вариантов различных алгоритмов оптимизации.

$ pip install pypop7

🖥 Github: https://github.com/evolutionary-intelligence/pypop

Paprer: https://arxiv.org/abs/2212.05652v1

⭐️ Derivative-Free Optimization (DFO): https://link.springer.com/article/10.1007/s10208-021-09513-z


👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
ECON: Explicit Clothed humans Obtained from Normals

ECON разработан для «оцифровки человека из изображения». ECON помогает высокоточно выдедить одетых людей на изображении , в люблй одежде и в сложных позах. ECON также поддерживает реконструкцию нескольких человек и анимацию на основе SMPL-X.

🖥 Github: https://github.com/YuliangXiu/ECON

Paprer: https://arxiv.org/abs/2212.07422

📎 Demo: https://github.com/YuliangXiu/ECON#demo

✔️ Instructions: https://github.com/YuliangXiu/ECON#instructions

👉 @bigdata_1
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
StackExplain

Cкрипт на основе ChatGPT, который выведет и обьяснит ошибку в вашем коде.

$ pip3 install stackexplain

https://github.com/shobrook/stackexplain

https://habr.com/ru/companies/getmatch/articles/704680/

👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
DeepLSD: Line Segment Detection and Refinement with Deep Image Gradients

DeepLSD — это универсальный линейный детектор, который распознает объекты с точностью ручного распознавания. Он подходит для любых задач, требующих высокой точности при сегментации и распознавании объектов.

git clone --recurse-submodules [email protected]:cvg/DeepLSD.git
cd DeepLSD


🖥 Github: https://github.com/cvg/deeplsd

Paprer: https://arxiv.org/abs/2212.07766v1

✔️ Dataset: https://paperswithcode.com/dataset/hpatches

👉 @bigdata_1
👍71😁1
Optimizing Prompts for Text-to-Image Generation

Передовой алгоритм, облегчающие работу с языковыми моделями, для автоматической оптимизации промптов.

🖥 Github: https://github.com/microsoft/lmops

➡️Paprer: https://arxiv.org/abs/2212.09611v1

✔️Dataset: https://paperswithcode.com/dataset/diffusiondb

💨 Transformers at Scale: https://github.com/microsoft/torchscale

👉 @bigdata_1
Scalable Diffusion Models with Transformers (DiT)

Новый класс моделей диффузии, основанный на архитектуре трансформеров.Модели DiT-XL/2 не только обладают хорошей масштабируемостью, но и превосходят все предшествующие диффузионные модели на тестах.

git clone https://github.com/facebookresearch/DiT.git

🖥 Github: https://github.com/facebookresearch/DiT

🖥 Colab: http://colab.research.google.com/github/facebookresearch/DiT/blob/main/run_DiT.ipynb

⭐️ Project: https://www.wpeebles.com/DiT

Paprer: http://arxiv.org/abs/2212.09748

✔️ Dataset: https://paperswithcode.com/dataset/imagenet

👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Generalized Decoding for Pixel, Image, and Language

X-Decoder - первая модель, которая поддерживает все типы сегментации изображений, способной эффективно решать различные задачи CV и VL.

🖥 Github: https://github.com/microsoft/X-Decoder

🤗 Hugging Face Demo: https://huggingface.co/spaces/xdecoder/Demo

⭐️ Project: https://x-decoder-vl.github.io/

Paprer: https://arxiv.org/pdf/2212.11270.pdf

✔️ Dataset: https://paperswithcode.com/dataset/visual-genome

👉 @bigdata_1
👍4🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Neural Cloth Simulation

ИИ для анимации и генерации одежды.

🖥 Github: https://github.com/hbertiche/NeuralClothSim

⭐️ Project: https://hbertiche.github.io/NeuralClothSim/

✅️ Paprer: arxiv.org/pdf/2211.13226.pdf


👉 @bigdata_1
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
JRBD: Egocentric Perception of Humans

Стэнфорд JRDB-Pose: набор размеченных данных с более чем 600 000 позами тел.

⭐️ Dataset: https://jrdb.erc.monash.edu/

🖥 Github: https://github.com/JRDB-dataset/jrdb_toolkit/

JRDB-Pose: https://jrdb.erc.monash.edu/dataset/pose#toolkit

Paper: arxiv.org/pdf/1910.11792.pdf

👉 @bigdata_1
3👍1