Нейронавт | Нейросети в творчестве
9.51K subscribers
3.69K photos
3.17K videos
40 files
4.13K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
OneDiff v0.12.1

Обновка ускорителя диффузных генераторов OneDiff

Поддержка diffusers, ComfyUI, A1111

Гитхаб

#text2image #text2video #tools
👍4
Emad в твиттере намекнул на грядущий доступ (всеобщий? для избранных?) к Stable diffusion 3

#news
🔥9
С празником, прекрасные💖
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15
#оффтоп
Посмотрел Дюну 2

Вопреки прочитанным отзывам, фильм не показался динамичнее первой части. Так же затянут и нетороплив. Обещанный экшен появляется только в последние полчаса почти трехчасового фильма. Раньше - мелкими эпизодами. Впрочем, я мог забыть насколько нетороплива первая часть.

В целом хорош, не хуже первой части. Конфликты и мотивация персонажей четко обозначены. Кроме предательства, которое мы видим в конце. Но его причины, полагаю, нам раскроют в третьей части.

А теперь ложка спойлеров дегтя.

Сцена где Пол должен пересечь пустыню обрывается совершенно внезапно. Мы больше ни разу не вспомним об опасностях пустыни, о которых его предупреждали при инструктаже. Видимо, этой сценой пожертвовали на монтаже. Имхо, стоило бы так же поступить с еще 30 минутами там и сям.

Почему Харконнены нашли и разбомбили фрименов только в середине фильма? В чем причина их неожиданной осведомленности о месте их дислокации? Сцены шпионки, видимо, тоже покромсали.

Почему добытчики специи, имея радары, не могут иметь тепловизоры чтобы обнаружить засаду фрименов? Откуда у фрименов такое технологичное оружие? Как фримены узнают место куда прилетят добытчики чтобы устроить засаду?

Как и у Нолана,
ядерный взрыв не выглядит ядерным. И радиацию отменили

Коллективные катания на черве позабавили. Сначала нам показывают что катание на нем недоступно обычному человеку, доступно только фрименам. Потом вижу колотушку и толпу фрименов - говорю: очередь на автобус. И оказалось что угадал. Оказывается, на черве можно не только кататься всем цыганским табором, но еще и легко перевозить паланкин с беременной женщиной.

Короче, кому понравилась первая часть - понравится и вторая если не идти с великими ожиданиями. В целом отличное кино, но как говорит мой друг, есть вопросики.

Наверно надо добавить еще тег #набрюзжал
👍83😁3🤔2🔥1
PIXART-Σ:Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation

Генератор картинок от Huawei. 4K, хорошее понимание промпта.
Демки и колаб которые вам показывают - с предыдущей версией модели - PixArt-α

Код ждем

#text2image
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VideoCutLER

К CutLER прикрутили простую обработку видеопотока, и теперь он может сегментировать объекты на видео.

Код

#image2mask #segmentation
👍5🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
HDRFlow: Real-Time HDR Video Reconstruction with Large Motions

Реконструкция в реальном времени HDR видео из видео с переменной экспозицией

Код

#realtive #video #hdr
👍11
ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment

Ультимативное решение для понимания диффузными моделями промпта. Вместо CLIP интегрировать в модель мощную языковую модель (LLM)

Код ждем

#text2image
👍16🔥4😎3
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел в доступ инструмент для управления поведением цифровых агентов.

🧠 Первый, SAGA (Skill to Action Generation), который настраивает поведение.

Агенты сначала сообщают контекстуальные метаданные SAGA о себе и своем мире посредством сопутствующей симуляции: кто они; что они знают; какие у них «навыки»; и каковы их цели. Затем, когда агент решает, что делать дальше, SAGA генерирует набор «действий», которые лучше всего служат целям агента в данный момент. Эти варианты действий затем оцениваются и возвращаются в симуляцию, чтобы дать указания агенту. Этот процесс повторяется каждый раз, когда агент решает свое следующее действие, и может быть масштабирован для одновременной работы нескольких агентов.

🧠 И второй, MAGE (Multi-Agent Gym Environment), представляет среду, песочницу для взаимодействия агентов. По сути, это окружение, в котором агенты существуют, выполненное в стиле городка Дикого Запада (хех, совпадения с Westworld случайны).

Для вас на выбор 15 агентов со своей историей, что называется метавоспоминания. Далее вы можете моделировать события, на которые агенты будут реагировать исходя из набора своих навыков и подобия "воли".

Подозреваю, что прямо сейчас профессия нарративщика обрастает новыми навыками: теперь не просто нужно написать историю, но и в достаточной степени натренировать и настроить модули ИИ поведения для агентов, его характер, прописать метавоспоминания и цели.

Я бы с удовольствием сделал бы подкаст с людьми, которые глубоко окунулись в моделирование поведения игрового ИИ с помощью подобных инструментов. Пишите!
Please open Telegram to view this post
VIEW IN TELEGRAM
9
This media is not supported in your browser
VIEW IN TELEGRAM
InstaSwap

Не знаю есть ли тут какая-то инновация, за фейссвоперами уже не успеваю следить. Но вот держите заменятор лиц

InstaSwap standalone
InstaSwap ComfyUI

#faceswap #personalize
😁113👍1🤔1🎃1
PeRFlow: Piecewise Rectified Flow as Universal Plug-and-Play Accelerator

Ускоритель генерации. Для работы потребуется предварительно дообучить ускоряемую модель. Но получаем и плюсы в виде качества генерации.

Код
Демо PeRFlow-T2I
Демо PeRFlow-T2I с TripoSR

#optimization #text2image
🔥5👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Elevenlabs прислали мне ранний доступ к своей новой фиче - генерация звуковых эффектов по текстовому описанию.

На старте дают 10000 токенов.

Нагенерил для вас женскую версию крика Вильгельма и другие незаменимые звуки

Проверьте не открылся ли у вас доступ по ссылке

Elevenlabs Sound Effects
🔥41
Что читать про ИИ и использование нейросетей. Составил для вас подборку каналов.

Илья Плазмаканал про ИИ, стартапы и DeFi от серийного фаундера.

Tips AI | IT & AI
канал про сервисы ИИ, интернет технологии, так же в канале есть бесплатный ChatGPT.

Миша, давай по новой
канал про то, как общаться с нейросетями, придумывать промпты и эффективно использовать их в работе.

Бурый — коллекционер нейросетей, тестирует всё на себе и делится лучшими бесплатными нейронками.

Силиконовый мешок — нейроиспытатель языковых моделей и других нейронок. Пытается выжать из них немного деньжат или смыслов.

ИИволюция — канал Сергея Пахандрина, где он делится своими экспериментами и лайфхаками по применению ИИ для решения разных задач.

#промо
🔥11👍84
ComPromptMized: Unleashing Zero-click Worms that Target GenAI-Powered Applications

Алярм! Первый ИИ-вирус. Он не требует человеческой ошибки для инициализации. Вернее, ошибка нужна - дать ИИ управление своей почтой.

Исследователи научились внедрять вредоносный пропмт в электронные письма таким образом, чтобы заставить вашего ИИ-ассистента выполнять ряд действий, в том числе рассылку вируса по вашей базе адресов. Причем промпт может быть внедрен в текст или в изображение.

Авторы направили свой труд в OpenAI и Google для предупреждения о потенциальных уязвимостях ИИ-ассистентов.

Понятное объяснение у двухминутного доктора

#assistant #news #virus
😱6👍1🔥1
Все же, речь о раннем доступе к #SD3 для избранных. Emad пишет что уже почти все готово

#news
👍7🤔1