Нейронавт | Нейросети в творчестве

Video ReCap: Recursive Captioning of Hour-Long Videos

Текстовое описание длинных видео (1 час) от Meta AI

Код

#captioning #video2text

😁2

2.19K views11:59

1:51

This media is not supported in your browser

VIEW IN TELEGRAM

ShareGPT4Video: Improving Video Understanding and Generation with Better Captions

Модель для подробного описания видео. Генерировать видео по тексту тоже умеет, но качество 🫤

Код
Демо (описание)
Демо (генерация)

#captioning #vlm #video2text #text2video

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6

1.46K views07:24

Нейронавт | Нейросети в творчестве

HunyuanDiT-v1.2 / HunyuanCaptioner

Новая версия китайского генератора картинок. Лично меня он не впечатляет.
Но выкатили еще и генератор описаний, который может описывать картинки по английски

Репозиторий
Демо HunyuanCaptioner

#text2image #image2text #captioning

👍4

1.66K views08:29

Нейронавт | Нейросети в творчестве

FLUX Prompt Generator

Тут можно генерить/раскрычивать промпты для #Flux по ключевым словам или небольшому промпту.
А можно и обратно, по картинке.

#image2text #captioning #text2text #prompting

🔥15👎1

2.36K views07:30

Нейронавт | Нейросети в творчестве

JoyCaption Alpha One

Обновился инструмент для текстового описания изображений JoyCaption

- расширен набор данных
- контроль длины описания
- выбор тона текста формальный/неформальный
- выбор типа описания. Descriptive - на чисто естественном языке. Training Prompt - сочетания естественного языка, фрагментов предложений и тегов booru - имитация промптов для SD. rng-tags - только теги booru, работает не очень хорошо, не рекомендовано

#image2text #captioning

👍6❤2

1.93K viewsedited 08:03

Нейронавт | Нейросети в творчестве

JoyCaption Alpha 2 - Batch Script

Скрипт для пакетной обработки картинок в JoyCaption.

Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии

Реддит

#image2text #captioning

👍3❤1

1.75K views05:03

Нейронавт | Нейросети в творчестве

VideoLLaMA 3

Следующее поколение открытой #VLM

Код
Демо

#image2text #video2text #captioning #assistant

👍6🔥2❤1

1.62K viewsedited 11:14

Нейронавт | Нейросети в творчестве