Нейронавт | Нейросети в творчестве
9.43K subscribers
3.65K photos
3.15K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
PIXART-Σ:Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation

Генератор картинок от Huawei. 4K, хорошее понимание промпта.
Демки и колаб которые вам показывают - с предыдущей версией модели - PixArt-α

Код ждем

#text2image
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VideoCutLER

К CutLER прикрутили простую обработку видеопотока, и теперь он может сегментировать объекты на видео.

Код

#image2mask #segmentation
👍5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
HDRFlow: Real-Time HDR Video Reconstruction with Large Motions

Реконструкция в реальном времени HDR видео из видео с переменной экспозицией

Код

#realtive #video #hdr
👍11
ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment

Ультимативное решение для понимания диффузными моделями промпта. Вместо CLIP интегрировать в модель мощную языковую модель (LLM)

Код ждем

#text2image
👍16🔥4😎3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел в доступ инструмент для управления поведением цифровых агентов.

🧠 Первый, SAGA (Skill to Action Generation), который настраивает поведение.

Агенты сначала сообщают контекстуальные метаданные SAGA о себе и своем мире посредством сопутствующей симуляции: кто они; что они знают; какие у них «навыки»; и каковы их цели. Затем, когда агент решает, что делать дальше, SAGA генерирует набор «действий», которые лучше всего служат целям агента в данный момент. Эти варианты действий затем оцениваются и возвращаются в симуляцию, чтобы дать указания агенту. Этот процесс повторяется каждый раз, когда агент решает свое следующее действие, и может быть масштабирован для одновременной работы нескольких агентов.

🧠 И второй, MAGE (Multi-Agent Gym Environment), представляет среду, песочницу для взаимодействия агентов. По сути, это окружение, в котором агенты существуют, выполненное в стиле городка Дикого Запада (хех, совпадения с Westworld случайны).

Для вас на выбор 15 агентов со своей историей, что называется метавоспоминания. Далее вы можете моделировать события, на которые агенты будут реагировать исходя из набора своих навыков и подобия "воли".

Подозреваю, что прямо сейчас профессия нарративщика обрастает новыми навыками: теперь не просто нужно написать историю, но и в достаточной степени натренировать и настроить модули ИИ поведения для агентов, его характер, прописать метавоспоминания и цели.

Я бы с удовольствием сделал бы подкаст с людьми, которые глубоко окунулись в моделирование поведения игрового ИИ с помощью подобных инструментов. Пишите!
Please open Telegram to view this post
VIEW IN TELEGRAM
9
This media is not supported in your browser
VIEW IN TELEGRAM
InstaSwap

Не знаю есть ли тут какая-то инновация, за фейссвоперами уже не успеваю следить. Но вот держите заменятор лиц

InstaSwap standalone
InstaSwap ComfyUI

#faceswap #personalize
😁113👍1🤔1🎃1
PeRFlow: Piecewise Rectified Flow as Universal Plug-and-Play Accelerator

Ускоритель генерации. Для работы потребуется предварительно дообучить ускоряемую модель. Но получаем и плюсы в виде качества генерации.

Код
Демо PeRFlow-T2I
Демо PeRFlow-T2I с TripoSR

#optimization #text2image
🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Elevenlabs прислали мне ранний доступ к своей новой фиче - генерация звуковых эффектов по текстовому описанию.

На старте дают 10000 токенов.

Нагенерил для вас женскую версию крика Вильгельма и другие незаменимые звуки

Проверьте не открылся ли у вас доступ по ссылке

Elevenlabs Sound Effects
🔥41
Что читать про ИИ и использование нейросетей. Составил для вас подборку каналов.

Илья Плазмаканал про ИИ, стартапы и DeFi от серийного фаундера.

Tips AI | IT & AI
канал про сервисы ИИ, интернет технологии, так же в канале есть бесплатный ChatGPT.

Миша, давай по новой
канал про то, как общаться с нейросетями, придумывать промпты и эффективно использовать их в работе.

Бурый — коллекционер нейросетей, тестирует всё на себе и делится лучшими бесплатными нейронками.

Силиконовый мешок — нейроиспытатель языковых моделей и других нейронок. Пытается выжать из них немного деньжат или смыслов.

ИИволюция — канал Сергея Пахандрина, где он делится своими экспериментами и лайфхаками по применению ИИ для решения разных задач.

#промо
🔥11👍84
ComPromptMized: Unleashing Zero-click Worms that Target GenAI-Powered Applications

Алярм! Первый ИИ-вирус. Он не требует человеческой ошибки для инициализации. Вернее, ошибка нужна - дать ИИ управление своей почтой.

Исследователи научились внедрять вредоносный пропмт в электронные письма таким образом, чтобы заставить вашего ИИ-ассистента выполнять ряд действий, в том числе рассылку вируса по вашей базе адресов. Причем промпт может быть внедрен в текст или в изображение.

Авторы направили свой труд в OpenAI и Google для предупреждения о потенциальных уязвимостях ИИ-ассистентов.

Понятное объяснение у двухминутного доктора

#assistant #news #virus
😱6👍1🔥1
Все же, речь о раннем доступе к #SD3 для избранных. Emad пишет что уже почти все готово

#news
👍7🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Haiper

Свежий генератор видео по тексту, по изображению, по эскизу. Стилизация

#text2video #image2video #video2video
🔥12
Media is too big
VIEW IN TELEGRAM
Sora будет доступна пользователям в 2024 году

Перевел для вас в elevenlabs.io кусочек интервью с техническим директором Mira Murati

Тезисно кроме доступа: техдир не знает на каких данных обучали модель. Цензура и цены как в DALL-E. Sora не замена профессионала, а инструмент.

#news #text2video
👍12🔥1
LaVi-Bridge: Bridging Different Language Models and Generative Vision Models for Text-to-Image Generation

Мост между языковыми и генеративными моделями. Позволяет поженить, скажем, SD с Llama-2. Идея похожа на ELLA

Код

#text2image
👍7🔥2