diffusion-pipe
Экспериментальный тренер диффузных моделей.
Поддерживает #Flux (лоры, полный файнтюн), LTX-Video, HunyuanVideo (лоры)
Реализовано распараллеливание для моделей которые не влезают в GPU
На Винде завелось только у одного юзера, но это неточно
Лору HunyuanVideo можно тренить на картинках на 24GB VRAM
LTX-Video с таким богатым VRAM можно тренить и на видео
#lora #finetuning
Экспериментальный тренер диффузных моделей.
Поддерживает #Flux (лоры, полный файнтюн), LTX-Video, HunyuanVideo (лоры)
Реализовано распараллеливание для моделей которые не влезают в GPU
На Винде завелось только у одного юзера, но это неточно
Лору HunyuanVideo можно тренить на картинках на 24GB VRAM
LTX-Video с таким богатым VRAM можно тренить и на видео
#lora #finetuning
GitHub
GitHub - tdrussell/diffusion-pipe: A pipeline parallel training script for diffusion models.
A pipeline parallel training script for diffusion models. - tdrussell/diffusion-pipe
🔥12
Stable Diffusion GUI
Кроссплатформенный GUI для #SD и #Flux.
Написан на C++, нет зависимостей Python
Встроена поддержка контролнет, апскейл
Бэкенд: CPU, CUDA, ROCm
Гитхаб
#GUI #text2image #tools
Кроссплатформенный GUI для #SD и #Flux.
Написан на C++, нет зависимостей Python
Встроена поддержка контролнет, апскейл
Бэкенд: CPU, CUDA, ROCm
Гитхаб
#GUI #text2image #tools
👍10🔥6😐2❤1
ComfyUI-Fluxtapoz
Ноды для редактирования изображений через #flux
Вообще-то это народный код RF-inversion, ссылка на который прописана на его оф репозитории тогда как свой код они никак не опубликуют
#styletransfer #personalization #imageediting
Ноды для редактирования изображений через #flux
Вообще-то это народный код RF-inversion, ссылка на который прописана на его оф репозитории тогда как свой код они никак не опубликуют
#styletransfer #personalization #imageediting
🔥8
OminiControl Training
Опубликован код обучения универсального управляемого генератора изображений OminiControl
Можете обучить свой собственный OminiControl на базе #flux с любым управлением - примерка, 3D, поза или что-либо еще что придумаете.
Только запаситесь двумя NVIDIA H100, 80GB VRAM. Непонятно почему двумя, ведь столько памяти у одной H100, но по ссылке написано именно так
#finetuning #training #conditioning #text2image
Опубликован код обучения универсального управляемого генератора изображений OminiControl
Можете обучить свой собственный OminiControl на базе #flux с любым управлением - примерка, 3D, поза или что-либо еще что придумаете.
Только запаситесь двумя NVIDIA H100, 80GB VRAM. Непонятно почему двумя, ведь столько памяти у одной H100, но по ссылке написано именно так
#finetuning #training #conditioning #text2image
👍5
1.58-bit FLUX
Bytedance и POSTECH квантизовали FLUX [dev].
Квантизованная модель требует для инференса в 5 раз меньше VRAM и занимает на диске в 7.7 раз меньше места.
К сожалению, есть только препринт, а ссылка из препринта ведет на несуществующий сайт. Ждем
#news #optimization #flux
Bytedance и POSTECH квантизовали FLUX [dev].
Квантизованная модель требует для инференса в 5 раз меньше VRAM и занимает на диске в 7.7 раз меньше места.
К сожалению, есть только препринт, а ссылка из препринта ведет на несуществующий сайт. Ждем
#news #optimization #flux
👍12🔥2
FLUX Pro Finetuning API
BlackForest Labs выпустили API для дообучения #FLUX
Уверяют что результат файнтюна будет работать со всеми официальными вариантами FLUX и совместим с FLUX Tools
FLUX Finetuning Beta Guide
#finetuning #lora #api
BlackForest Labs выпустили API для дообучения #FLUX
Уверяют что результат файнтюна будет работать со всеми официальными вариантами FLUX и совместим с FLUX Tools
FLUX Finetuning Beta Guide
#finetuning #lora #api
🔥8👍2
Flex.1-alpha
Модификация #Flux от Ostris. Старое название - OpenFLUX
Основная фича - должен легко поддаваться дообучению.
Архитектура FLUX.1-dev с небольшими отличиями. Но в основе FLUX.1-schnell, а значит сохранена лицензия последнего.
Не требует CFG для генерации изображений
Будет работать из коробки с большинством GUI
#finetuning #text2image
Модификация #Flux от Ostris. Старое название - OpenFLUX
Основная фича - должен легко поддаваться дообучению.
Архитектура FLUX.1-dev с небольшими отличиями. Но в основе FLUX.1-schnell, а значит сохранена лицензия последнего.
Не требует CFG для генерации изображений
Будет работать из коробки с большинством GUI
#finetuning #text2image
👍10❤3
This media is not supported in your browser
VIEW IN TELEGRAM
loras.dev
Онлайн генератор картинок с предустановленными лорами.
Притворитесь что вы не в РФ
Опенсорс, под капотом #Flux и Together AI
Код
#text2image #online
Онлайн генератор картинок с предустановленными лорами.
Притворитесь что вы не в РФ
Опенсорс, под капотом #Flux и Together AI
Код
#text2image #online
👍3🥴2👏1🤡1
SliderSpace: Decomposing the Visual Capabilities of Diffusion Models
Смотрите какая штука.
Попытка раскрыть творческий потенциал диффузных генераторов картинок.
Вместо поиска пользователем творческих направлений, SliderSpace автоматически обнаруживает их на основе знаний модели.
Получив промпт, например "игрушка", SliderSpace определяет ключевые визуальные вариации, о которых знает модель, и превращает их в простые слайдеры.
Прикручено к #SDXL и #Flux
Код
Демо сейчас не работает, 404
#text2image #variation #slider
Смотрите какая штука.
Попытка раскрыть творческий потенциал диффузных генераторов картинок.
Вместо поиска пользователем творческих направлений, SliderSpace автоматически обнаруживает их на основе знаний модели.
Получив промпт, например "игрушка", SliderSpace определяет ключевые визуальные вариации, о которых знает модель, и превращает их в простые слайдеры.
Прикручено к #SDXL и #Flux
Код
Демо сейчас не работает, 404
#text2image #variation #slider
❤11👍3🤔1
Higgsfield AI
Сервис для создания длинных монтажных видеороликов от идеи до финального монтажа.
ИИ-ассистент Copilot проводит вас через
- Написание сценария
- Создание раскадровки. За картинки отвечает #Flux с выбором из нескольких стилей
- Генерация видео по картинке. Тут на выбор Minimax, Kling, Runway Gen-3 и своя модель Higgsfield (насколько своя - не знаю, сомневаюсь что с нуля делали)
- Монтаж. Есть простенький видеоредактор.
- Генерация речи/липсинк от Elevenlabs
Инпейнтинг для Flux обещают прикрутить на следующей неделе. Генератор музыки тоже планируют встроить.
Потренировался на кошках. С остальным звуком кроме речи помогли DiffRhythm, FoleyCrafter, TangoFlux
1 картинка стоит 1 кредит
1 видео MiniMax/Kling - 10 кредитов
1 видео Gen 3 - 5 кредитов
Бесплатных кредитов, увы, не дают. Но есть промокод на 100 кредитов:
#text2movie #script2movie #text2image #image2video
Сервис для создания длинных монтажных видеороликов от идеи до финального монтажа.
ИИ-ассистент Copilot проводит вас через
- Написание сценария
- Создание раскадровки. За картинки отвечает #Flux с выбором из нескольких стилей
- Генерация видео по картинке. Тут на выбор Minimax, Kling, Runway Gen-3 и своя модель Higgsfield (насколько своя - не знаю, сомневаюсь что с нуля делали)
- Монтаж. Есть простенький видеоредактор.
- Генерация речи/липсинк от Elevenlabs
Инпейнтинг для Flux обещают прикрутить на следующей неделе. Генератор музыки тоже планируют встроить.
Потренировался на кошках. С остальным звуком кроме речи помогли DiffRhythm, FoleyCrafter, TangoFlux
1 картинка стоит 1 кредит
1 видео MiniMax/Kling - 10 кредитов
1 видео Gen 3 - 5 кредитов
Бесплатных кредитов, увы, не дают. Но есть промокод на 100 кредитов:
HIGGS_DcU7s
#text2movie #script2movie #text2image #image2video
👍12🔥6👎2
Personalize Anything (for Free with Diffusion Transformer)
Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux
Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды
#personalization #inpainting #outpainting #image2image
Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux
Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды
#personalization #inpainting #outpainting #image2image
👍8🔥3❤1
EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer
Убийца контролнета.
Стабильно работает в разных разрешениях.
Прикручено к Flux.
Интегрировано в CFG-Zero
Код
Демо
Демо гиблификация
ComfyUI
#conditioning #controlnet #flux #comfyui #image2image #referencing #personalization
Убийца контролнета.
Стабильно работает в разных разрешениях.
Прикручено к Flux.
Интегрировано в CFG-Zero
Код
Демо
Демо гиблификация
ComfyUI
#conditioning #controlnet #flux #comfyui #image2image #referencing #personalization
👍12🔥4
ZenCtrl
Еще одна альтернатива #controlnet от Fotographer AI
Умеет генерить разные ракурсы сцены/объекта, фон под объект. Из привычного - Canny, Depth
Разрешение до 1024×1024, в будущем 2К и 4К
Есть пара моделек под #flux и одна под Ominicontrol (деблюр)
Код ждем
Демо
Веса
API
Статья
#conditioning #deblur #image2image #personalization #multiview #novelview
Еще одна альтернатива #controlnet от Fotographer AI
Умеет генерить разные ракурсы сцены/объекта, фон под объект. Из привычного - Canny, Depth
Разрешение до 1024×1024, в будущем 2К и 4К
Есть пара моделек под #flux и одна под Ominicontrol (деблюр)
Код ждем
Демо
Веса
API
Статья
#conditioning #deblur #image2image #personalization #multiview #novelview
❤8👍1🔥1
Я тут решил сдаться на прожарку бесплатным ризонерам с дипресерчем. Субъективно победил Grok 3:
Второе место, как ни странно, отдам Perplexity:
О, привет, Нейронавт. Чувак, ты ведёшь канал про нейросети в творчестве, и у тебя 8 тысяч подписчиков — это круто, пока не вспомнишь, что половина из них, наверное, боты, которых ты сам же и натренировал! Серьёзно, твои посты такие минималистичные, что я сначала подумал, что это не канал, а спам-бот, который забыл, как писать больше трёх слов. "Вот вам нейросеть, делает 3D, пока!" — чувак, это не пост, это твит, который не влез в лимит символов и решил притвориться Telegram-каналом!
Ты пишешь про CG и VFX, но, судя по вовлечённости, твои подписчики либо слишком заняты генерацией своих шедевров, либо просто смотрят и молча кивают, как на лекции по квантовой физике. 800 просмотров, 14 лайков, 3 комментария — это что, твоя аудитория думает, что лайкать посты это слишком творчески сложно? Или ты их так загипнотизировал своими нейросетями, что они забыли, как пользоваться кнопками?
И этот твой стиль — "минимализм", говоришь? Да ты просто ленивый гений, который понял, что если писать меньше, то и ошибок меньше! Может, тебе стоит запустить нейросеть, которая будет писать за тебя шутки, потому что пока твой канал — это как стендап без punchline’ов: все ждут, а ты такой: "Ну, вот код, пока!" Бери пример с ИИ, бро, добавь хоть немного перца в свои посты, а то твои 8 тысяч подписчиков скоро начнут подозревать, что ты сам — нейросеть, застрявшая на этапе обучения!
Второе место, как ни странно, отдам Perplexity:
Привет, ребята! Сегодня у нас в гостях человек, который считает себя первопроходцем в мире нейросетей. Но знаете, мне кажется, он не первопроходец, а скорее тот парень, который первым нашёл кнопку "Репост". Давайте поприветствуем автора канала "Нейронавт"!
"Король хэштегов"
Ты — настоящий мастер хэштегов. #text2texture, #flux, #3DtoMesh... Слушай, ты точно про нейросети пишешь? Потому что выглядит так, будто ты просто пытаешься выиграть чемпионат по Scrabble. Твои хэштеги — это как заклинания из "Гарри Поттера", но вместо магии они вызывают головную боль у читателей.
"Не спрашивайте как это работает"
О, это моя любимая фраза! Ты буквально говоришь своей аудитории: "Я не знаю, как это работает, но вам точно стоит этим пользоваться". Это как если бы шеф-повар сказал: "Я не знаю, что это за ингредиенты, но я добавлю их в суп — авось выживете".
Твой канал — это как McDonald's для любителей нейросетей. Быстрое потребление контента без питательной ценности. Ты выкладываешь столько постов, что кажется, будто ты работаешь не с нейросетями, а с конвейером. И знаешь что? В твоём случае количество точно не переходит в качество.
Итак, друзья! Давайте пожелаем нашему Нейронавту удачи в его бесконечном путешествии по миру нейросетей. А мы пока пойдем искать человека, который сможет объяснить нам хотя бы один его пост без слов: "Не спрашивайте как это работает". А если вы всё-таки решите погрузиться в мир "Нейронавта", приготовьтесь к лавине хэштегов, которые будут преследовать вас даже в #снах, #мечтах и #кошмарах. #nofilter #ineedhelp #hashtagaddiction
😁21👍7🔥1🤮1💩1
UNO - Less-to-More Generalization: Unlocking More Controllability by In-Context Generation
Мультиобъектная кастомизация картинок от ByteDance.
Умеет делать персонализацию, стиль, примерку.
Прикручено к #Flux
Код
Демо
#personalization #referencing #text2image #image2image
Мультиобъектная кастомизация картинок от ByteDance.
Умеет делать персонализацию, стиль, примерку.
Прикручено к #Flux
Код
Демо
#personalization #referencing #text2image #image2image
👍9❤2💩1
sd-forge-fluxtools-v2
Расширение для Forge, позволяющее полноценно использовать Controlnet и Redux c Flux-1-dev. До сих пор с этим были проблемы, в отличие от ComfyUI
#extension #flux
Расширение для Forge, позволяющее полноценно использовать Controlnet и Redux c Flux-1-dev. До сих пор с этим были проблемы, в отличие от ComfyUI
#extension #flux
❤9
FLUX.1-dev-ControlNet-Union-Pro-2.0-fp8
Квантизованная версия универсального контролнета для #flux
civitai/workflow
#controlnet #conditioning @text2image #image2image #workflow
Квантизованная версия универсального контролнета для #flux
civitai/workflow
#controlnet #conditioning @text2image #image2image #workflow
👍10🔥4
FluxZayn: FLUX LayerDiffuse Extension for Stable Diffusion WebUI Forge
Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)
расширение для Forge
LayerDiffuse-Flux - оригинальный код
Для #ComfyUI есть ComfyUI_FluxLayerDiffuse
#extension #forge #text2image #flux #RGBA
Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)
расширение для Forge
LayerDiffuse-Flux - оригинальный код
Для #ComfyUI есть ComfyUI_FluxLayerDiffuse
#extension #forge #text2image #flux #RGBA
🔥14👍3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
FLUX.1 Kontext [dev] выложили в открытый доступ
Напоминаю, это облегченная версия редактора изображений
Веса
Нативная поддержка в ComfyUI
воркфлоу
Спасибо @iNevestenko
#imageediting #text2image #vibeediting
Напоминаю, это облегченная версия редактора изображений
Веса
Нативная поддержка в ComfyUI
воркфлоу
Спасибо @iNevestenko
#imageediting #text2image #vibeediting
❤16🤯7⚡3