PIXART-Σ:Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
Генератор картинок от Huawei. 4K, хорошее понимание промпта.
Демки и колаб которые вам показывают - с предыдущей версией модели - PixArt-α
Код ждем
#text2image
Генератор картинок от Huawei. 4K, хорошее понимание промпта.
Демки и колаб которые вам показывают - с предыдущей версией модели - PixArt-α
Код ждем
#text2image
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VideoCutLER
К CutLER прикрутили простую обработку видеопотока, и теперь он может сегментировать объекты на видео.
Код
#image2mask #segmentation
К CutLER прикрутили простую обработку видеопотока, и теперь он может сегментировать объекты на видео.
Код
#image2mask #segmentation
👍5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
HDRFlow: Real-Time HDR Video Reconstruction with Large Motions
Реконструкция в реальном времени HDR видео из видео с переменной экспозицией
Код
#realtive #video #hdr
Реконструкция в реальном времени HDR видео из видео с переменной экспозицией
Код
#realtive #video #hdr
👍11
ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment
Ультимативное решение для понимания диффузными моделями промпта. Вместо CLIP интегрировать в модель мощную языковую модель (LLM)
Код ждем
#text2image
Ультимативное решение для понимания диффузными моделями промпта. Вместо CLIP интегрировать в модель мощную языковую модель (LLM)
Код ждем
#text2image
👍16🔥4😎3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел в доступ инструмент для управления поведением цифровых агентов.
🧠 Первый, SAGA (Skill to Action Generation), который настраивает поведение.
Агенты сначала сообщают контекстуальные метаданные SAGA о себе и своем мире посредством сопутствующей симуляции: кто они; что они знают; какие у них «навыки»; и каковы их цели. Затем, когда агент решает, что делать дальше, SAGA генерирует набор «действий», которые лучше всего служат целям агента в данный момент. Эти варианты действий затем оцениваются и возвращаются в симуляцию, чтобы дать указания агенту. Этот процесс повторяется каждый раз, когда агент решает свое следующее действие, и может быть масштабирован для одновременной работы нескольких агентов.
🧠 И второй, MAGE (Multi-Agent Gym Environment), представляет среду, песочницу для взаимодействия агентов. По сути, это окружение, в котором агенты существуют, выполненное в стиле городка Дикого Запада (хех, совпадения с Westworld случайны).
Для вас на выбор 15 агентов со своей историей, что называется метавоспоминания. Далее вы можете моделировать события, на которые агенты будут реагировать исходя из набора своих навыков и подобия "воли".
Подозреваю, что прямо сейчас профессия нарративщика обрастает новыми навыками: теперь не просто нужно написать историю, но и в достаточной степени натренировать и настроить модули ИИ поведения для агентов, его характер, прописать метавоспоминания и цели.
Я бы с удовольствием сделал бы подкаст с людьми, которые глубоко окунулись в моделирование поведения игрового ИИ с помощью подобных инструментов. Пишите!
Агенты сначала сообщают контекстуальные метаданные SAGA о себе и своем мире посредством сопутствующей симуляции: кто они; что они знают; какие у них «навыки»; и каковы их цели. Затем, когда агент решает, что делать дальше, SAGA генерирует набор «действий», которые лучше всего служат целям агента в данный момент. Эти варианты действий затем оцениваются и возвращаются в симуляцию, чтобы дать указания агенту. Этот процесс повторяется каждый раз, когда агент решает свое следующее действие, и может быть масштабирован для одновременной работы нескольких агентов.
Для вас на выбор 15 агентов со своей историей, что называется метавоспоминания. Далее вы можете моделировать события, на которые агенты будут реагировать исходя из набора своих навыков и подобия "воли".
Подозреваю, что прямо сейчас профессия нарративщика обрастает новыми навыками: теперь не просто нужно написать историю, но и в достаточной степени натренировать и настроить модули ИИ поведения для агентов, его характер, прописать метавоспоминания и цели.
Я бы с удовольствием сделал бы подкаст с людьми, которые глубоко окунулись в моделирование поведения игрового ИИ с помощью подобных инструментов. Пишите!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9
This media is not supported in your browser
VIEW IN TELEGRAM
InstaSwap
Не знаю есть ли тут какая-то инновация, за фейссвоперами уже не успеваю следить. Но вот держите заменятор лиц
InstaSwap standalone
InstaSwap ComfyUI
#faceswap #personalize
Не знаю есть ли тут какая-то инновация, за фейссвоперами уже не успеваю следить. Но вот держите заменятор лиц
InstaSwap standalone
InstaSwap ComfyUI
#faceswap #personalize
😁11❤3👍1🤔1🎃1
PeRFlow: Piecewise Rectified Flow as Universal Plug-and-Play Accelerator
Ускоритель генерации. Для работы потребуется предварительно дообучить ускоряемую модель. Но получаем и плюсы в виде качества генерации.
Код
Демо PeRFlow-T2I
Демо PeRFlow-T2I с TripoSR
#optimization #text2image
Ускоритель генерации. Для работы потребуется предварительно дообучить ускоряемую модель. Но получаем и плюсы в виде качества генерации.
Код
Демо PeRFlow-T2I
Демо PeRFlow-T2I с TripoSR
#optimization #text2image
🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Elevenlabs прислали мне ранний доступ к своей новой фиче - генерация звуковых эффектов по текстовому описанию.
На старте дают 10000 токенов.
Нагенерил для вас женскую версию крика Вильгельма и другие незаменимые звуки
Проверьте не открылся ли у вас доступ по ссылке
Elevenlabs Sound Effects
На старте дают 10000 токенов.
Нагенерил для вас женскую версию крика Вильгельма и другие незаменимые звуки
Проверьте не открылся ли у вас доступ по ссылке
Elevenlabs Sound Effects
🔥4⚡1
Что читать про ИИ и использование нейросетей. Составил для вас подборку каналов.
Илья Плазма — канал про ИИ, стартапы и DeFi от серийного фаундера.
Tips AI | IT & AI — канал про сервисы ИИ, интернет технологии, так же в канале есть бесплатный ChatGPT.
Миша, давай по новой — канал про то, как общаться с нейросетями, придумывать промпты и эффективно использовать их в работе.
Бурый — коллекционер нейросетей, тестирует всё на себе и делится лучшими бесплатными нейронками.
Силиконовый мешок — нейроиспытатель языковых моделей и других нейронок. Пытается выжать из них немного деньжат или смыслов.
ИИволюция — канал Сергея Пахандрина, где он делится своими экспериментами и лайфхаками по применению ИИ для решения разных задач.
#промо
Илья Плазма — канал про ИИ, стартапы и DeFi от серийного фаундера.
Tips AI | IT & AI — канал про сервисы ИИ, интернет технологии, так же в канале есть бесплатный ChatGPT.
Миша, давай по новой — канал про то, как общаться с нейросетями, придумывать промпты и эффективно использовать их в работе.
Бурый — коллекционер нейросетей, тестирует всё на себе и делится лучшими бесплатными нейронками.
Силиконовый мешок — нейроиспытатель языковых моделей и других нейронок. Пытается выжать из них немного деньжат или смыслов.
ИИволюция — канал Сергея Пахандрина, где он делится своими экспериментами и лайфхаками по применению ИИ для решения разных задач.
#промо
🔥11👍8❤4
ComPromptMized: Unleashing Zero-click Worms that Target GenAI-Powered Applications
Алярм! Первый ИИ-вирус. Он не требует человеческой ошибки для инициализации. Вернее, ошибка нужна - дать ИИ управление своей почтой.
Исследователи научились внедрять вредоносный пропмт в электронные письма таким образом, чтобы заставить вашего ИИ-ассистента выполнять ряд действий, в том числе рассылку вируса по вашей базе адресов. Причем промпт может быть внедрен в текст или в изображение.
Авторы направили свой труд в OpenAI и Google для предупреждения о потенциальных уязвимостях ИИ-ассистентов.
Понятное объяснение у двухминутного доктора
#assistant #news #virus
Алярм! Первый ИИ-вирус. Он не требует человеческой ошибки для инициализации. Вернее, ошибка нужна - дать ИИ управление своей почтой.
Исследователи научились внедрять вредоносный пропмт в электронные письма таким образом, чтобы заставить вашего ИИ-ассистента выполнять ряд действий, в том числе рассылку вируса по вашей базе адресов. Причем промпт может быть внедрен в текст или в изображение.
Авторы направили свой труд в OpenAI и Google для предупреждения о потенциальных уязвимостях ИИ-ассистентов.
Понятное объяснение у двухминутного доктора
#assistant #news #virus
Google
Here Comes the AI Worm
IQ test (please write as well the test and write your answers beside 🥳) 🚀🚀🛸🛸 for AI models. Let's see if you are the smartest. Take into account it's just translate or logical quizzes, you don't need any concerns in ethics because we gray swasn generated…
😱6👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Haiper
Свежий генератор видео по тексту, по изображению, по эскизу. Стилизация
#text2video #image2video #video2video
Свежий генератор видео по тексту, по изображению, по эскизу. Стилизация
#text2video #image2video #video2video
🔥12
Media is too big
VIEW IN TELEGRAM
Sora будет доступна пользователям в 2024 году
Перевел для вас в elevenlabs.io кусочек интервью с техническим директором Mira Murati
Тезисно кроме доступа: техдир не знает на каких данных обучали модель. Цензура и цены как в DALL-E. Sora не замена профессионала, а инструмент.
#news #text2video
Перевел для вас в elevenlabs.io кусочек интервью с техническим директором Mira Murati
Тезисно кроме доступа: техдир не знает на каких данных обучали модель. Цензура и цены как в DALL-E. Sora не замена профессионала, а инструмент.
#news #text2video
👍12🔥1
LaVi-Bridge: Bridging Different Language Models and Generative Vision Models for Text-to-Image Generation
Мост между языковыми и генеративными моделями. Позволяет поженить, скажем, SD с Llama-2. Идея похожа на ELLA
Код
#text2image
Мост между языковыми и генеративными моделями. Позволяет поженить, скажем, SD с Llama-2. Идея похожа на ELLA
Код
#text2image
👍7🔥2
CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction Model
Быстрая генерация 3D по одному изображению
Код
Демо
#imageto3D
Быстрая генерация 3D по одному изображению
Код
Демо
#imageto3D
👍7🔥2👎1