Нейронавт | Нейросети в творчестве
9.4K subscribers
3.62K photos
3.14K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
Lluminate

Интересная работа

Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.

Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.

Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.

Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.

Код

#text2image
👍73
Personalize Anything (for Free with Diffusion Transformer)

Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux

Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды

#personalization #inpainting #outpainting #image2image
👍8🔥31
From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation

Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека

Код

#referencing #image2image #personalization
👀4👍2🔥1
Wan2GP v2

Обновился Wan2.1 GP, много улучшений
Удобная установка в Pinokio

#text2video #image2video
👍8🔥1
Media is too big
VIEW IN TELEGRAM
Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images

Реконструкция частично видимых 3D объектов по картинке

Код ждем
Демо

#imageto3d
👍3🔥1
Grok в Телеграм, не реклама

В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию

Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер

Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться 🧐

#news #bot #assistant #тестбендера
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Krea Video Styles

Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили

За ваши деньги, конечно

#personalization #training #lora #text2video #image2video
🔥9
OpenAI.fm

Генератор голоса/речи по тексту
Можно описать нужный голос и манеру прочтения. Клонировать нельзя. А то придет Скарлетт Йохансон - порядок наведет

Плюс две модели в API для расшифровки речи в текст "лучше чем Whisper"

#news #text2speech #speech2text
👍5😁4
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity (InfU)

Держите еще один персонализатор от ByteDance

Совместим с Flux и другими DIT.

Обещают высокую идентичность при сохранении возможностей генерации

Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики

Совместим с Controlnet, Lora и другими плагинами

Код
Демо - ждем, 404
Веса

#personalization #referencing #text2image
👍9👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Cosmos-Transfer1: World Generation with Adaptive Multimodal Control

Nvidia выпустили версию своего генератора миров (видео) для кондиционной генерации на основе множества входных данных в различных модальностях, таких как сегментация, карты глубины и контуры (edge)

Гитхаб

#text2video #image2video #simulation #text2world #image2world #segmentation2video #depth2video #mask2video #edge2video
👍3🔥2🤔1
VGGT: Visual Geometry Grounded Transformer

Реконструкция всех ключевых 3D-атрибутов сцены от Facebookresearch.

На входе одна картинка, набор видов или видео, на выходе - параметры камеры, карты точек, карты глубины и 3D-треки точек, из одного, нескольких или сотен ракурсов.

Полюбуйтесь на Планетный Экспресс, собранный из одного короткого шота. GLB файл в комментариях

Код
Демо

#image2scene #imageto3d #video2scene #videoto3d #image2mesh #tracking #image2camera #video2mesh #video2depth
👍3🔥1
Reve Image 1.0

Новый генератор картинок по тексту, по референсу, опередивший на арене (там он под псевдонимом Halfmoon) Flux, Recraft, Image 3

Говорят что без цензуры

Говорят, что пробовать здесь. Но у меня не получилось зайти

#text2image #referencing #personalization
👍14🔥2