This media is not supported in your browser
VIEW IN TELEGRAM
MoVieS: Motion-Aware 4D Dynamic View Synthesis in One Second
Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance
Умеет:
- видео с нового ракурса
- реконструкция геометрии сцены
- отслеживание 3D-точек
- оценка потока сцены (не знаю о чем речь)
- сегментация движущихся объектов
Код ждем
#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth
Создает динамические 4D-изображения из обычных видео всего за одну секунду. При участии ByteDance
Умеет:
- видео с нового ракурса
- реконструкция геометрии сцены
- отслеживание 3D-точек
- оценка потока сцены (не знаю о чем речь)
- сегментация движущихся объектов
Код ждем
#novelview #stabilize #video2scene #video2mask #segmentation #tracking #video2depth
👍12
Обновлены WAN T2V / I2V дистил лоры от lightx2
Не теряет движение, лучше следует промпту
I2V
T2V
#text2video #image2video #lora
Не теряет движение, лучше следует промпту
I2V
T2V
#text2video #image2video #lora
Telegram
Нейронавт | Нейросети в творчестве
Wan 14B Self Forcing T2V Lora by Kijai
720x480 97кадров выдает за ~100 секунд на 4070ti super 16 vram, 4 steps, lcm, 1 cfg, 8 shift
Берете стандартный T2V воркфлоу от Kijai
Wan2.1-T2V-14B-StepDistill-CfgDistill - дистиллированная модель на 4-8 шагов,…
720x480 97кадров выдает за ~100 секунд на 4070ti super 16 vram, 4 steps, lcm, 1 cfg, 8 shift
Берете стандартный T2V воркфлоу от Kijai
Wan2.1-T2V-14B-StepDistill-CfgDistill - дистиллированная модель на 4-8 шагов,…
👍7
Palliadium Mac OS support
Palliadium - аддон для использования всевозможных нейросетей в Блендере, теперь ограниченно работает на Mac OS
Поскольку у главного разработчика нет доступа к макоси, поддержка осуществляется силами других контрибьюторов
статус поддержки по ссылке
#blender #plugin #macos
Palliadium - аддон для использования всевозможных нейросетей в Блендере, теперь ограниченно работает на Mac OS
Поскольку у главного разработчика нет доступа к макоси, поддержка осуществляется силами других контрибьюторов
статус поддержки по ссылке
#blender #plugin #macos
👍4🔥4
MVAR: Auto-Regressively Generating Multi-View Consistent Images
Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии
Код
#multiview #novelview #text2image #image2image
Генерация изображения с разных ракурсов, согласованных между собой на основе авторегресиию По тексту, по картинке, по геометрии
Код
#multiview #novelview #text2image #image2image
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield UGC Builder
Новая фича видеосервиса - создание видеороликов под ключ
#text2movie #text2video
Новая фича видеосервиса - создание видеороликов под ключ
#text2movie #text2video
👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
LTXV теперь генерирует 60-секундные видео
Еще пример
И еще пример
Выпустили новую версию модели
ltxv-13b-0.9.8-dev
И сразу дистиленные из нее модели
ltxv-13b-0.9.8-distilled
ltxv-2b-0.9.8-distilled
А также детализатор
LTX-Video-ICLoRA-detailer-13b-0.9.8 / воркфлоу
воркфлоу мультипромпт
воркфлоу с позой, глубиной и прочими Control Lora
Всякие официальные воркфлоу
#text2video #image2video #lora #upscale
Еще пример
И еще пример
Выпустили новую версию модели
ltxv-13b-0.9.8-dev
И сразу дистиленные из нее модели
ltxv-13b-0.9.8-distilled
ltxv-2b-0.9.8-distilled
А также детализатор
LTX-Video-ICLoRA-detailer-13b-0.9.8 / воркфлоу
воркфлоу мультипромпт
воркфлоу с позой, глубиной и прочими Control Lora
Всякие официальные воркфлоу
#text2video #image2video #lora #upscale
🔥19👍3
This media is not supported in your browser
VIEW IN TELEGRAM
SketchColour: Channel Concat Guided DiT-based Sketch-to-Colour Pipeline for 2D Animation
Модель раскрашивает эскизную анимацию на основе первого раскрашенного кадра
Код
Спасибо @m_franz
#sketch2color #video2video #colorize
Модель раскрашивает эскизную анимацию на основе первого раскрашенного кадра
Код
Спасибо @m_franz
#sketch2color #video2video #colorize
👍12
HiDream-E1.1
Редактор картинок текстовыми указаниями HiDream-E1 обновили и выпустили в опенсорс
И есть bf16
#imageediting
Редактор картинок текстовыми указаниями HiDream-E1 обновили и выпустили в опенсорс
И есть bf16
#imageediting
👍12
Три #kontext лоры для вписывания объекта в другую картинку
https://huggingface.co/ilkerzgi/Overlay-Kontext-Dev-LoRA - органично вставляет объект с одной картинки в другую
https://huggingface.co/gokaygokay/Fuse-it-Kontext-Dev-LoRA - не просто вставляет, а вживляет учитывая контекст
https://huggingface.co/gokaygokay/Light-Fix-Kontext-Dev-LoRA - вписывает по освещению
Спасибо @iNevestenko
#lora
https://huggingface.co/ilkerzgi/Overlay-Kontext-Dev-LoRA - органично вставляет объект с одной картинки в другую
https://huggingface.co/gokaygokay/Fuse-it-Kontext-Dev-LoRA - не просто вставляет, а вживляет учитывая контекст
https://huggingface.co/gokaygokay/Light-Fix-Kontext-Dev-LoRA - вписывает по освещению
Спасибо @iNevestenko
#lora
👍24❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Suno 4.5+
У Suno новая модель
Из своего аудио можно сделать полноценную песню
Начать можно хоть с вокала, хоть с инструментала
(А до сих пор так нельзя было?)
Можно использовать плейлист как референс для создания нового трека
Доступна на тарифе Pro
#music #musicediting
У Suno новая модель
Из своего аудио можно сделать полноценную песню
Начать можно хоть с вокала, хоть с инструментала
(А до сих пор так нельзя было?)
Можно использовать плейлист как референс для создания нового трека
Доступна на тарифе Pro
#music #musicediting
👍8😈2🤷♂1
Нейронавт | Нейросети в творчестве
ChatGPT agent Стрим Open AI Что-то новое показывают #news #agent
Короче, ChatGPT Agent это три в одном: Чат, Deep Research и Operator
Задачи разбивает на подзадачи, выполняет их в виртуальной машине, перед важными действиями просит подтверждение
Доступ сначала для Pro, потом Plus и Team
#agent
Задачи разбивает на подзадачи, выполняет их в виртуальной машине, перед важными действиями просит подтверждение
Доступ сначала для Pro, потом Plus и Team
#agent
👍8
This media is not supported in your browser
VIEW IN TELEGRAM
Hume EVI 3
Модель от Hume AI клонирует не только голос, но язык и манеру говорить.
Может работать в связке с разными LLM
Обещают в ближайшем будущем поддержку многих языков
Для доступа притворитесь что вы не в РФ
Попробовать
Попробовать в Playground
#tts #text2speech #voicecloning
Модель от Hume AI клонирует не только голос, но язык и манеру говорить.
Может работать в связке с разными LLM
Обещают в ближайшем будущем поддержку многих языков
Для доступа притворитесь что вы не в РФ
Попробовать
Попробовать в Playground
#tts #text2speech #voicecloning
👍10