Метаверсище и ИИще
38.2K subscribers
4.82K photos
3.01K videos
40 files
5.82K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
加入频道
Forwarded from Denis Sexy IT 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Я не уверен, что это прям первый ИИ Сериал. Но это точно первый сериал полностью сделанный на видеогенераторе Veo2.

Видно, что опыт поста и монтажа решает, но также видно, что историю приходится втискивать в узкое ложе ограниченных ракурсов и движений камеры. А динамика бега и других движений далека от гонки на выживание

Но, камон, поглядите на спецэффекты с пробоем шлема и вообще на попытку повторить известные штампы.
Это уже ПОЧТИ работает. История проступает сквозь пересвеченные и замедленные планы. Неумолимо.

Грамотный уход от лишней генерации лиц через шлемы и скафандры.

Ещё немного и такие "жирные раскадровки" превратятся в новый нормальный сторителлинг.

Были бы истории..

Я не знаю, сколько попыток было сделано, почитайте подробнее у Dor Brothers, они веселые.

https://x.com/thedorbrothers


https://youtu.be/JrNFasNn_fU

@cgevent
Уравновесим берлинских Dor Brothers рубрикой "крутые подписчики".

Держите новогоднее оформление канала "Стиль", которое мне прислал Андрей Чибизов. Ну сладко же!

Андрюха крутой в плане нейропоста, писал про него тут, поглядите, там его канал и работы.

Но нам же интересны не только ролики из твиттора, а подробности от крутых подписчиков, поэтому читаем ниже:
⬇️⬇️⬇️⬇️⬇️
Для этих роликов, как пишет Андрей, изначально очень хотелось поиграться с симбиозом стимпанка и Пиксар. В общей сложности было около 300-400 генераций на каждый 10сек трехкадровый ролик. Отобранные стиллы апскейлились через Магнифик, чистились в Шопе и там же чуть инпейнтились).
Нейроанимация производилась в Ранвей Gen3 Alpha(экспозиции) и Клинг 1.5.
Всего было нагенерено около 100 шотов. Выбранные шоты апскейлились в Топаз. На этапе поста в АЕ шоты чуть клинапились, были добавлены vfx, в ролик с льдом было притречено и вкомпожен лого, накинули чуть грейда.
Весь продакшн занял около месяца.

Вот такой вот нейропостпродакшен!

@cgevent
Видеогенераторы потихоньку тырят новые фичи друг у друга и у image-генераторов.

Но вот эта вот Minimax Subject Reference выглядит чуть убойнее, чем у других.

Лора по одной фотке. Без цензуры. Хорошее попадание.

Ибо обучено именно на лицах, и насколько я знаю, на мишках, мышках и котиках работать не будет.

Пара читов, для тех, кто будет пробовать:
- чем качественнее фотки, тем лучше
- чем подробнее промпты, тем лучше

Поглядите примеры, и снова вспомните, где мы были год назад.

Мне нравится бьюти стилист(ка), тем что конец бьютиблоггерам, Крыгину в каждый дом.

И конечно умопомрачительный Tahta Ular // Serpent's Throne от великолепного Дана Прадана

Эта отвязанная трейлер-панк-история с крокодилом, змеями и дифчонками в духе Страх и Ненависть в Азии нравится мне сильно больше, чем скафандры от Dor Brothers.
Оцените жестоко-хороший монтаж, динамику движений (Минимакс хорош) и нейрокавер от Udio.

Ещё раз: на входе одна фотка и ваше умение вязать лыко промпты. И Минимакс.
Поглядите 3, 4, 5й ролики, все поймёте

@cgevent
На этой неделе OpenAI готовится выпустить "Оператора"

Новую фичу ChatGPT, которая будет выполнять действия от имени пользователей в их браузерах.
Если вкратце:
- Оператор сам предлагает промпты
- Пользователи могут сохранять/обмениваться заданиями
- Пока недоступно по API


Если вдлинце:
OpenAI готовится выпустить на этой неделе новую функцию ChatGPT, которая позволит автоматизировать сложные задачи, обычно выполняемые через веб-браузер, такие как бронирование столиков в ресторанах или планирование поездок. Функция под названием "Оператор" предлагает пользователям различные категории задач, такие как обеды и мероприятия, доставка, покупки и путешествия, а также предлагаемые промпты в каждой категории. Когда пользователь вводит промпт, в chatGPT открывается миниатюрный экран, на котором отображается браузер и действия, выполняемые агентом Operator.
Агент также будет задавать уточняющие вопросы, например, о времени и количестве человек для заказа столика в ресторане.

Пользователи ChatGPT также смогут контролировать экран во время работы Operator, а также сохранять задания Operator и делиться ими с другими пользователями.

Маркетплейс Агентов? (попытка номер 2?)

В настоящее время Operator не работает с почтой Gmail, но позволяет пользователям заходить на другие сайты и оставаться под своим логином в разных сессиях.

https://www.theinformation.com/briefings/openai-preps-operator-release-for-this-week

P.S. Меня одного бесит, что ВСЕ примеры работы агентов ВСЕГДА начинаются с заказа столиков в ресторане или авиабилетов?

@cgevent
Ничего себе, а ответочка на Оператора из опенсорса (ТикТока) прилетела уже сегодня!

"Мы непосредственно воспринимаем изображение на экране, применяем процессы рассуждения и автономно генерируем правильные действия. Более того, мы может учиться на предыдущем опыте, итеративно улучшая свою работу за счет использования обратной связи с окружением."

А теперь внимание:
У них есть два способа генерирования следующего действия - один "интуитивный" (S1) и один "рассуждающий" (CoT) (S2).

S1 выигрывает на внутридоменных задачах, но S2 работает лучше внедоменных.

Все по Канеману - думай медленно, решай быстро. Под задачу.

Вот тут гитхаб: https://github.com/bytedance/UI-TARS-desktop
Тут фарш и модели: https://huggingface.co/bytedance-research/UI-TARS-7B-SFT

Тут рекомендуемый к просмотру собственный твиттор: https://x.com/UI_TARS

@cgevent
OpenAI Operator потихоньку пошел в народ, у которого есть подписка за 200 долларов.

Можно подглядеть URL на скрине.

А Антропик тем временем подсуетился и сделал бесплатный курс по использовании своего Computer use. Это когда с помощью Клода можно управлять курсором, нажимать кнопки и вбивать текст. Autohotkey на стероидах и ориентированный больше на гиков.

Держите ссылку:
Building toward Computer Use with Anthropic

@cgevent