This media is not supported in your browser
VIEW IN TELEGRAM
Lluminate
Интересная работа
Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.
Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.
Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.
Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.
Код
#text2image
Интересная работа
Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.
Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.
Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.
Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.
Код
#text2image
👍7❤3
Personalize Anything (for Free with Diffusion Transformer)
Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux
Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды
#personalization #inpainting #outpainting #image2image
Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux
Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды
#personalization #inpainting #outpainting #image2image
👍8🔥3❤1
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation
Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека
Код
#referencing #image2image #personalization
Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека
Код
#referencing #image2image #personalization
👀4👍2🔥1
Media is too big
VIEW IN TELEGRAM
Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images
Реконструкция частично видимых 3D объектов по картинке
Код ждем
Демо
#imageto3d
Реконструкция частично видимых 3D объектов по картинке
Код ждем
Демо
#imageto3d
👍3🔥1
Grok в Телеграм, не реклама
В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию
Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер
Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться🧐
#news #bot #assistant #тестбендера
В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию
Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер
Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться
#news #bot #assistant #тестбендера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Krea Video Styles
Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили
За ваши деньги, конечно
#personalization #training #lora #text2video #image2video
Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили
За ваши деньги, конечно
#personalization #training #lora #text2video #image2video
🔥9
OpenAI.fm
Генератор голоса/речи по тексту
Можно описать нужный голос и манеру прочтения. Клонировать нельзя. А то придет Скарлетт Йохансон - порядок наведет
Плюс две модели в API для расшифровки речи в текст "лучше чем Whisper"
#news #text2speech #speech2text
Генератор голоса/речи по тексту
Можно описать нужный голос и манеру прочтения. Клонировать нельзя. А то придет Скарлетт Йохансон - порядок наведет
Плюс две модели в API для расшифровки речи в текст "лучше чем Whisper"
#news #text2speech #speech2text
👍5😁4
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity (InfU)
Держите еще один персонализатор от ByteDance
Совместим с Flux и другими DIT.
Обещают высокую идентичность при сохранении возможностей генерации
Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики
Совместим с Controlnet, Lora и другими плагинами
Код
Демо - ждем, 404
Веса
#personalization #referencing #text2image
Держите еще один персонализатор от ByteDance
Совместим с Flux и другими DIT.
Обещают высокую идентичность при сохранении возможностей генерации
Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики
Совместим с Controlnet, Lora и другими плагинами
Код
Демо - ждем, 404
Веса
#personalization #referencing #text2image
👍9👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Cosmos-Transfer1: World Generation with Adaptive Multimodal Control
Nvidia выпустили версию своего генератора миров (видео) для кондиционной генерации на основе множества входных данных в различных модальностях, таких как сегментация, карты глубины и контуры (edge)
Гитхаб
#text2video #image2video #simulation #text2world #image2world #segmentation2video #depth2video #mask2video #edge2video
Nvidia выпустили версию своего генератора миров (видео) для кондиционной генерации на основе множества входных данных в различных модальностях, таких как сегментация, карты глубины и контуры (edge)
Гитхаб
#text2video #image2video #simulation #text2world #image2world #segmentation2video #depth2video #mask2video #edge2video
👍3🔥2🤔1
VGGT: Visual Geometry Grounded Transformer
Реконструкция всех ключевых 3D-атрибутов сцены от Facebookresearch.
На входе одна картинка, набор видов или видео, на выходе - параметры камеры, карты точек, карты глубины и 3D-треки точек, из одного, нескольких или сотен ракурсов.
Полюбуйтесь на Планетный Экспресс, собранный из одного короткого шота. GLB файл в комментариях
Код
Демо
#image2scene #imageto3d #video2scene #videoto3d #image2mesh #tracking #image2camera #video2mesh #video2depth
Реконструкция всех ключевых 3D-атрибутов сцены от Facebookresearch.
На входе одна картинка, набор видов или видео, на выходе - параметры камеры, карты точек, карты глубины и 3D-треки точек, из одного, нескольких или сотен ракурсов.
Полюбуйтесь на Планетный Экспресс, собранный из одного короткого шота. GLB файл в комментариях
Код
Демо
#image2scene #imageto3d #video2scene #videoto3d #image2mesh #tracking #image2camera #video2mesh #video2depth
👍3🔥1
Reve Image 1.0
Новый генератор картинок по тексту, по референсу, опередивший на арене (там он под псевдонимом Halfmoon) Flux, Recraft, Image 3
Говорят что без цензуры
Говорят, что пробовать здесь. Но у меня не получилось зайти
#text2image #referencing #personalization
Новый генератор картинок по тексту, по референсу, опередивший на арене (там он под псевдонимом Halfmoon) Flux, Recraft, Image 3
Говорят что без цензуры
Говорят, что пробовать здесь. Но у меня не получилось зайти
#text2image #referencing #personalization
👍14🔥2