Нейронавт | Нейросети в творчестве

Lluminate

Интересная работа

Нейросетки хороши в выдаче усредненного результата, поэтому часто выдают однотипные результаты при одном и том же промпте.

Lluminate решает проблему однообразия, выдавая более разнообразные и неожиданные результаты.
Алгоритм использует умный промптинг и анализ новизны с помощью CLIP.

Запускает множество вариантов для оценки их разнообразия.
Самые необычные варианты используются для новых генераций с усложнением и добавлением неочевидных элементов.

Тестировали на шейдерах, архитектуре и генерации часов.
Вместо стандартных результатов типа "неоновые спирали" и "футуристические башни", получаются уникальные и неожиданные вещи.

Код

#text2image

👍7❤3

1.64K views07:53

Нейронавт | Нейросети в творчестве

Personalize Anything (for Free with Diffusion Transformer)

Персонализация одного или нескольких объектов без дообучения.
Протестировано с #Flux и Hunyuan
В колаб ноутбуках Flux

Код
Колаб inpainting-outpainting
Колаб персонализация одного объекта
Колаб реконструкция объекта, создает новые позы/виды

#personalization #inpainting #outpainting #image2image

👍8🔥3❤1

1.85K views08:23

Нейронавт | Нейросети в творчестве

From Parts to Whole: A Unified Reference Framework for Controllable Human Image Generation

Еще одна работа тех же авторов, уже несвежая.
Создает изображения людей в различных позах по любому количеству референсов частей человека

Код

#referencing #image2image #personalization

👀4👍2🔥1

1.82K views08:53

Нейронавт | Нейросети в творчестве

Wan2GP v2

Обновился Wan2.1 GP, много улучшений
Удобная установка в Pinokio

#text2video #image2video

👍8🔥1

1.87K views09:13

Нейронавт | Нейросети в творчестве

1:16

Media is too big

VIEW IN TELEGRAM

Amodal3R: Amodal 3D Reconstruction from Occluded 2D Images

Реконструкция частично видимых 3D объектов по картинке

Код ждем
Демо

#imageto3d

👍3🔥1

1.85K views09:43

Нейронавт | Нейросети в творчестве

Grok в Телеграм, не реклама

В тг появился бот @GrokAI, вероятно официальный
В юзернейме нет обязательного для пользовательских ботов "_bot", кроме того, Дуров в твиттере намекал на интеграцию

Похоже что это не Grok3, а Grok2.
Картинки рисовать отказывается, вот вам ascii art Бендер

Для пользователей ТГ премиум доступ неограниченный, и то не у всех работает. С остальными отказывается общаться 🧐

#news #bot #assistant #тестбендера

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4

1.99K viewsedited 09:59

Нейронавт | Нейросети в творчестве

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Krea Video Styles

Безобразие. Теперь можно обучать свои лоры Wan на Krea AI. Движение там, объекты, стили

За ваши деньги, конечно

#personalization #training #lora #text2video #image2video

🔥9

2.23K views15:59

Нейронавт | Нейросети в творчестве

OpenAI.fm

Генератор голоса/речи по тексту
Можно описать нужный голос и манеру прочтения. Клонировать нельзя. А то придет Скарлетт Йохансон - порядок наведет

Плюс две модели в API для расшифровки речи в текст "лучше чем Whisper"

#news #text2speech #speech2text

👍5😁4

2.06K views07:13

Нейронавт | Нейросети в творчестве

0:53

This media is not supported in your browser

VIEW IN TELEGRAM

InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity (InfU)

Держите еще один персонализатор от ByteDance

Совместим с Flux и другими DIT.

Обещают высокую идентичность при сохранении возможностей генерации

Выложены модели для Flux. Одна больше для идентичности, другая больше для следования промпту и эстетики

Совместим с Controlnet, Lora и другими плагинами

Код
Демо - ждем, 404
Веса

#personalization #referencing #text2image

👍9👎2

2.15K views07:55

Нейронавт | Нейросети в творчестве

2:06

This media is not supported in your browser

VIEW IN TELEGRAM

Cosmos-Transfer1: World Generation with Adaptive Multimodal Control

Nvidia выпустили версию своего генератора миров (видео) для кондиционной генерации на основе множества входных данных в различных модальностях, таких как сегментация, карты глубины и контуры (edge)

Гитхаб

#text2video #image2video #simulation #text2world #image2world #segmentation2video #depth2video #mask2video #edge2video

👍3🔥2🤔1

1.93K views08:25

Нейронавт | Нейросети в творчестве

2:03

This media is not supported in your browser

VIEW IN TELEGRAM

VGGT: Visual Geometry Grounded Transformer

Реконструкция всех ключевых 3D-атрибутов сцены от Facebookresearch.

На входе одна картинка, набор видов или видео, на выходе - параметры камеры, карты точек, карты глубины и 3D-треки точек, из одного, нескольких или сотен ракурсов.

Полюбуйтесь на Планетный Экспресс, собранный из одного короткого шота. GLB файл в комментариях

Код
Демо

#image2scene #imageto3d #video2scene #videoto3d #image2mesh #tracking #image2camera #video2mesh #video2depth

👍3🔥1

1.96K views09:04

Нейронавт | Нейросети в творчестве

Reve Image 1.0

Новый генератор картинок по тексту, по референсу, опередивший на арене (там он под псевдонимом Halfmoon) Flux, Recraft, Image 3

Говорят что без цензуры

Говорят, что пробовать здесь. Но у меня не получилось зайти

#text2image #referencing #personalization

👍14🔥2

2.41K views13:22

About

Blog

Apps

Platform