Нейронавт | Нейросети в творчестве

0:04

Gemini 2.0 Flash

В Gemini завезли обещанную еще в прошлом году нативную генерацию картинок самой языковой моделью. Можно не только создавать но и редактировать с попиксельной точностью

Заходим в AI Studio, выбираем Gemini 2.0 Flash Experimental, выбираем в Output format «Image and text»

#assistant #mlm #vlm #imageediting #text2image

👍7🤯2

1.98K views08:47

0:48

0:25

Gemini Image Editing NextJS Quickstart

Официальный шаблон интеграции в ваш сервис редактора/генератора картинок Gemini 2.0 Flash

Вот например в Freepik уже прикручено

Демо, и даже без впн
Код

#assistant #mlm #vlm #imageediting #text2image

❤4🔥1

1.93K views17:16

Grok Edit Image

Вслед за Gemini, в Grok добавили функцию редактирования картинок текстовыми указаниями

Идем в Grok, ищем кнопку Edit Image

#assistant #mlm #vlm #imageediting #text2image

🔥12👍5😭1

1.99K views10:43

0:45

FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement

Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов

А я думал, Клод с MCP уже намного больше может

Кода нет

#mlm #assistant #3d

👍6

1.98K viewsedited 10:13

0:18

Llama 4 (скачать здесь, если осмелитесь)

Мета объявила новую эру мультимодальности
Новое семейство Llama из 3 моделей

У Llama 4 Scout контекст 10 миллионов токенов

Блог
Попробовать (притворитесь что вы не в РФ)

#assistant #news #mlm

1👍6🔥3❤1

2.21K views19:01

Liquid: Language Models are Scalable and Unified Multi-modal Generators

Единая языковая модель в качестве мультимодального генератора без костылей типа CLIP. В данном случае картинки/текст, 7B параметров

Код
Демо
Веса

#llm #mlm #text2image#image2text #text2text

🔥4👍1

2.03K views07:33

1:31

Jarvis Art

Фоторедактор от ByteDance и Ко

Построен на базе #MLM, имитирует работу профессиональных художников и координирует более 200 инструментов в Adobe Lightroom.
Превосходит GPT-4o по точности воспроизведения контента

Код ждем
Демо ждем

#imageediting

👍6🔥4😁2

2.03K views16:19

0:45

0:15

0:15