Media is too big
VIEW IN TELEGRAM
UniReal: Universal Image Generation and Editing via Learning Real-world Dynamics
Мультимодальный генератор/редактор картинок от Adobe и Гонконгского университета. Вероятно поэтому будет опенсорс.
Умеет практически все: персонализация, кастомизация, светотеневые эффекты, замена объектов и т д
Что-то написано про использование видео для универсального супервайза, понимание динамики из больших видео
Код ждем
Reddit
#text2image #imageediting
Мультимодальный генератор/редактор картинок от Adobe и Гонконгского университета. Вероятно поэтому будет опенсорс.
Умеет практически все: персонализация, кастомизация, светотеневые эффекты, замена объектов и т д
Что-то написано про использование видео для универсального супервайза, понимание динамики из больших видео
Код ждем
#text2image #imageediting
❤11👍2
FLUX Style Shaping
Берет с одной картинки форму, с другой текстуру.
Под капотом Flux[dev] Redux + Flux[dev] Depth ComfyUI
#styletransfer #image2image
Берет с одной картинки форму, с другой текстуру.
Под капотом Flux[dev] Redux + Flux[dev] Depth ComfyUI
#styletransfer #image2image
👍15
diffusion-pipe
Экспериментальный тренер диффузных моделей.
Поддерживает #Flux (лоры, полный файнтюн), LTX-Video, HunyuanVideo (лоры)
Реализовано распараллеливание для моделей которые не влезают в GPU
На Винде завелось только у одного юзера, но это неточно
Лору HunyuanVideo можно тренить на картинках на 24GB VRAM
LTX-Video с таким богатым VRAM можно тренить и на видео
#lora #finetuning
Экспериментальный тренер диффузных моделей.
Поддерживает #Flux (лоры, полный файнтюн), LTX-Video, HunyuanVideo (лоры)
Реализовано распараллеливание для моделей которые не влезают в GPU
На Винде завелось только у одного юзера, но это неточно
Лору HunyuanVideo можно тренить на картинках на 24GB VRAM
LTX-Video с таким богатым VRAM можно тренить и на видео
#lora #finetuning
GitHub
GitHub - tdrussell/diffusion-pipe: A pipeline parallel training script for diffusion models.
A pipeline parallel training script for diffusion models. - tdrussell/diffusion-pipe
🔥12
This media is not supported in your browser
VIEW IN TELEGRAM
А Grok-2 модель 1212 уже завезли в Anychat
Ну там все время что-то добавляют, заходите посмотреть
#assistant
Ну там все время что-то добавляют, заходите посмотреть
#assistant
👍3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
GenEx: Generating an Explorable World
Создает объёмный открытый мир из одной картинки
Очень похоже на практически одноименный проект, но нет, это другое
Код ждем
#image2scene #imageto3d #image2world
Создает объёмный открытый мир из одной картинки
Очень похоже на практически одноименный проект, но нет, это другое
Код ждем
#image2scene #imageto3d #image2world
👍8🔥5
Stable Diffusion GUI
Кроссплатформенный GUI для #SD и #Flux.
Написан на C++, нет зависимостей Python
Встроена поддержка контролнет, апскейл
Бэкенд: CPU, CUDA, ROCm
Гитхаб
#GUI #text2image #tools
Кроссплатформенный GUI для #SD и #Flux.
Написан на C++, нет зависимостей Python
Встроена поддержка контролнет, апскейл
Бэкенд: CPU, CUDA, ROCm
Гитхаб
#GUI #text2image #tools
👍10🔥6😐2❤1
Veo 2
Не успели мы сломя голову отказаться от удовольствия оплатить триалку первой версии видеогенератора от гугла, как уже, видимо, придется забить и на вторую. Но это неточно, я в поезде и проверить не могу
- обещают генерцию видео в 4К, 8 секунд хронометража
- контроль камеры текстовым описанием
- жизненно, физично, по вашему ТЗ
- традиционная нелюбовь к россиянам
Вход по вейтлисту
#text2video
Не успели мы сломя голову отказаться от удовольствия оплатить триалку первой версии видеогенератора от гугла, как уже, видимо, придется забить и на вторую. Но это неточно, я в поезде и проверить не могу
- обещают генерцию видео в 4К, 8 секунд хронометража
- контроль камеры текстовым описанием
- жизненно, физично, по вашему ТЗ
- традиционная нелюбовь к россиянам
Вход по вейтлисту
#text2video
🔥3👀2❤1
InvSR
Апскейлер на инверсии диффузии.
Короче еще один способ качественно увеличить картинку
Код
Демо HF
Демо Replicate
Колаб
#upscale
Апскейлер на инверсии диффузии.
Короче еще один способ качественно увеличить картинку
Код
Демо HF
Демо Replicate
Колаб
#upscale
❤8👍7🤯1
👍5❤1
Media is too big
VIEW IN TELEGRAM
Mocha 2025 - Object Brush
В новую версию Mocha завезли нейроротоскоп.
Если это в реальности работает хорошо как на видео (сомневаюсь), то глядишь, всякие громоздкие костыли станут не нужны
#roto #video2mask
В новую версию Mocha завезли нейроротоскоп.
Если это в реальности работает хорошо как на видео (сомневаюсь), то глядишь, всякие громоздкие костыли станут не нужны
#roto #video2mask
👍8❤1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Mind the Time: Temporally-Controlled Multi-Event Video Generation
Новый видеогенератор с фишечкой от Snap Research и компании.
Фишечка в том что он умеет делать последовательно несколько событий, объединенные общей сценой. Благодаря контролю времени MinT последовательно сосредоточивается в каждый момент времени на одном событии из всех событий описанных в промпте
Подсмотрел у Сергея Цыпцына
#text2video #timecontrol
Новый видеогенератор с фишечкой от Snap Research и компании.
Фишечка в том что он умеет делать последовательно несколько событий, объединенные общей сценой. Благодаря контролю времени MinT последовательно сосредоточивается в каждый момент времени на одном событии из всех событий описанных в промпте
Подсмотрел у Сергея Цыпцына
#text2video #timecontrol
👍4🔥3❤1