Forwarded from Denis Sexy IT 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Я не уверен, что это прям первый ИИ Сериал. Но это точно первый сериал полностью сделанный на видеогенераторе Veo2.
Видно, что опыт поста и монтажа решает, но также видно, что историю приходится втискивать в узкое ложе ограниченных ракурсов и движений камеры. А динамика бега и других движений далека от гонки на выживание
Но, камон, поглядите на спецэффекты с пробоем шлема и вообще на попытку повторить известные штампы.
Это уже ПОЧТИ работает. История проступает сквозь пересвеченные и замедленные планы. Неумолимо.
Грамотный уход от лишней генерации лиц через шлемы и скафандры.
Ещё немного и такие "жирные раскадровки" превратятся в новый нормальный сторителлинг.
Были бы истории..
Я не знаю, сколько попыток было сделано, почитайте подробнее у Dor Brothers, они веселые.
https://x.com/thedorbrothers
https://youtu.be/JrNFasNn_fU
@cgevent
Видно, что опыт поста и монтажа решает, но также видно, что историю приходится втискивать в узкое ложе ограниченных ракурсов и движений камеры. А динамика бега и других движений далека от гонки на выживание
Но, камон, поглядите на спецэффекты с пробоем шлема и вообще на попытку повторить известные штампы.
Это уже ПОЧТИ работает. История проступает сквозь пересвеченные и замедленные планы. Неумолимо.
Грамотный уход от лишней генерации лиц через шлемы и скафандры.
Ещё немного и такие "жирные раскадровки" превратятся в новый нормальный сторителлинг.
Были бы истории..
Я не знаю, сколько попыток было сделано, почитайте подробнее у Dor Brothers, они веселые.
https://x.com/thedorbrothers
https://youtu.be/JrNFasNn_fU
@cgevent
Уравновесим берлинских Dor Brothers рубрикой "крутые подписчики".
Держите новогоднее оформление канала "Стиль", которое мне прислал Андрей Чибизов. Ну сладко же!
Андрюха крутой в плане нейропоста, писал про него тут, поглядите, там его канал и работы.
Но нам же интересны не только ролики из твиттора, а подробности от крутых подписчиков, поэтому читаем ниже:
⬇️⬇️⬇️⬇️⬇️
Держите новогоднее оформление канала "Стиль", которое мне прислал Андрей Чибизов. Ну сладко же!
Андрюха крутой в плане нейропоста, писал про него тут, поглядите, там его канал и работы.
Но нам же интересны не только ролики из твиттора, а подробности от крутых подписчиков, поэтому читаем ниже:
⬇️⬇️⬇️⬇️⬇️
Для этих роликов, как пишет Андрей, изначально очень хотелось поиграться с симбиозом стимпанка и Пиксар. В общей сложности было около 300-400 генераций на каждый 10сек трехкадровый ролик. Отобранные стиллы апскейлились через Магнифик, чистились в Шопе и там же чуть инпейнтились).
Нейроанимация производилась в Ранвей Gen3 Alpha(экспозиции) и Клинг 1.5.
Всего было нагенерено около 100 шотов. Выбранные шоты апскейлились в Топаз. На этапе поста в АЕ шоты чуть клинапились, были добавлены vfx, в ролик с льдом было притречено и вкомпожен лого, накинули чуть грейда.
Весь продакшн занял около месяца.
Вот такой вот нейропостпродакшен!
@cgevent
Нейроанимация производилась в Ранвей Gen3 Alpha(экспозиции) и Клинг 1.5.
Всего было нагенерено около 100 шотов. Выбранные шоты апскейлились в Топаз. На этапе поста в АЕ шоты чуть клинапились, были добавлены vfx, в ролик с льдом было притречено и вкомпожен лого, накинули чуть грейда.
Весь продакшн занял около месяца.
Вот такой вот нейропостпродакшен!
@cgevent
Видеогенераторы потихоньку тырят новые фичи друг у друга и у image-генераторов.
Но вот эта вот Minimax Subject Reference выглядит чуть убойнее, чем у других.
Лора по одной фотке. Без цензуры. Хорошее попадание.
Ибо обучено именно на лицах, и насколько я знаю, на мишках, мышках и котиках работать не будет.
Пара читов, для тех, кто будет пробовать:
- чем качественнее фотки, тем лучше
- чем подробнее промпты, тем лучше
Поглядите примеры, и снова вспомните, где мы были год назад.
Мне нравится бьюти стилист(ка), тем что конец бьютиблоггерам, Крыгину в каждый дом.
И конечно умопомрачительный Tahta Ular // Serpent's Throne от великолепного Дана Прадана
Эта отвязанная трейлер-панк-история с крокодилом, змеями и дифчонками в духе Страх и Ненависть в Азии нравится мне сильно больше, чем скафандры от Dor Brothers.
Оцените жестоко-хороший монтаж, динамику движений (Минимакс хорош) и нейрокавер от Udio.
Ещё раз: на входе одна фотка и ваше умение вязатьлыко промпты. И Минимакс.
Поглядите 3, 4, 5й ролики, все поймёте
@cgevent
Но вот эта вот Minimax Subject Reference выглядит чуть убойнее, чем у других.
Лора по одной фотке. Без цензуры. Хорошее попадание.
Ибо обучено именно на лицах, и насколько я знаю, на мишках, мышках и котиках работать не будет.
Пара читов, для тех, кто будет пробовать:
- чем качественнее фотки, тем лучше
- чем подробнее промпты, тем лучше
Поглядите примеры, и снова вспомните, где мы были год назад.
Мне нравится бьюти стилист(ка), тем что конец бьютиблоггерам, Крыгину в каждый дом.
И конечно умопомрачительный Tahta Ular // Serpent's Throne от великолепного Дана Прадана
Эта отвязанная трейлер-панк-история с крокодилом, змеями и дифчонками в духе Страх и Ненависть в Азии нравится мне сильно больше, чем скафандры от Dor Brothers.
Оцените жестоко-хороший монтаж, динамику движений (Минимакс хорош) и нейрокавер от Udio.
Ещё раз: на входе одна фотка и ваше умение вязать
Поглядите 3, 4, 5й ролики, все поймёте
@cgevent
На этой неделе OpenAI готовится выпустить "Оператора"
Новую фичу ChatGPT, которая будет выполнять действия от имени пользователей в их браузерах.
Если вкратце:
- Оператор сам предлагает промпты
- Пользователи могут сохранять/обмениваться заданиями
- Пока недоступно по API
Если вдлинце:
OpenAI готовится выпустить на этой неделе новую функцию ChatGPT, которая позволит автоматизировать сложные задачи, обычно выполняемые через веб-браузер, такие как бронирование столиков в ресторанах или планирование поездок. Функция под названием "Оператор" предлагает пользователям различные категории задач, такие как обеды и мероприятия, доставка, покупки и путешествия, а также предлагаемые промпты в каждой категории. Когда пользователь вводит промпт, в chatGPT открывается миниатюрный экран, на котором отображается браузер и действия, выполняемые агентом Operator.
Агент также будет задавать уточняющие вопросы, например, о времени и количестве человек для заказа столика в ресторане.
Пользователи ChatGPT также смогут контролировать экран во время работы Operator, а также сохранять задания Operator и делиться ими с другими пользователями.
Маркетплейс Агентов? (попытка номер 2?)
В настоящее время Operator не работает с почтой Gmail, но позволяет пользователям заходить на другие сайты и оставаться под своим логином в разных сессиях.
https://www.theinformation.com/briefings/openai-preps-operator-release-for-this-week
P.S. Меня одного бесит, что ВСЕ примеры работы агентов ВСЕГДА начинаются с заказа столиков в ресторане или авиабилетов?
@cgevent
Новую фичу ChatGPT, которая будет выполнять действия от имени пользователей в их браузерах.
Если вкратце:
- Оператор сам предлагает промпты
- Пользователи могут сохранять/обмениваться заданиями
- Пока недоступно по API
Если вдлинце:
OpenAI готовится выпустить на этой неделе новую функцию ChatGPT, которая позволит автоматизировать сложные задачи, обычно выполняемые через веб-браузер, такие как бронирование столиков в ресторанах или планирование поездок. Функция под названием "Оператор" предлагает пользователям различные категории задач, такие как обеды и мероприятия, доставка, покупки и путешествия, а также предлагаемые промпты в каждой категории. Когда пользователь вводит промпт, в chatGPT открывается миниатюрный экран, на котором отображается браузер и действия, выполняемые агентом Operator.
Агент также будет задавать уточняющие вопросы, например, о времени и количестве человек для заказа столика в ресторане.
Пользователи ChatGPT также смогут контролировать экран во время работы Operator, а также сохранять задания Operator и делиться ими с другими пользователями.
Маркетплейс Агентов? (попытка номер 2?)
В настоящее время Operator не работает с почтой Gmail, но позволяет пользователям заходить на другие сайты и оставаться под своим логином в разных сессиях.
https://www.theinformation.com/briefings/openai-preps-operator-release-for-this-week
@cgevent
The Information
OpenAI Preps ‘Operator’ Release For This Week
OpenAI is preparing to release a new ChatGPT feature this week that will automate complex tasks typically done through the Web browser, such as making restaurant reservations or planning trips, according to a person with direct knowledge of the plans.
…
…
Ничего себе, а ответочка на Оператора из опенсорса (ТикТока) прилетела уже сегодня!
"Мы непосредственно воспринимаем изображение на экране, применяем процессы рассуждения и автономно генерируем правильные действия. Более того, мы может учиться на предыдущем опыте, итеративно улучшая свою работу за счет использования обратной связи с окружением."
А теперь внимание:
У них есть два способа генерирования следующего действия - один "интуитивный" (S1) и один "рассуждающий" (CoT) (S2).
S1 выигрывает на внутридоменных задачах, но S2 работает лучше внедоменных.
Все по Канеману - думай медленно, решай быстро. Под задачу.
Вот тут гитхаб: https://github.com/bytedance/UI-TARS-desktop
Тут фарш и модели: https://huggingface.co/bytedance-research/UI-TARS-7B-SFT
Тут рекомендуемый к просмотру собственный твиттор: https://x.com/UI_TARS
@cgevent
"Мы непосредственно воспринимаем изображение на экране, применяем процессы рассуждения и автономно генерируем правильные действия. Более того, мы может учиться на предыдущем опыте, итеративно улучшая свою работу за счет использования обратной связи с окружением."
А теперь внимание:
У них есть два способа генерирования следующего действия - один "интуитивный" (S1) и один "рассуждающий" (CoT) (S2).
S1 выигрывает на внутридоменных задачах, но S2 работает лучше внедоменных.
Все по Канеману - думай медленно, решай быстро. Под задачу.
Вот тут гитхаб: https://github.com/bytedance/UI-TARS-desktop
Тут фарш и модели: https://huggingface.co/bytedance-research/UI-TARS-7B-SFT
Тут рекомендуемый к просмотру собственный твиттор: https://x.com/UI_TARS
@cgevent
OpenAI Operator потихоньку пошел в народ, у которого есть подписка за 200 долларов.
Можно подглядеть URL на скрине.
А Антропик тем временем подсуетился и сделал бесплатный курс по использовании своего Computer use. Это когда с помощью Клода можно управлять курсором, нажимать кнопки и вбивать текст. Autohotkey на стероидах и ориентированный больше на гиков.
Держите ссылку:
Building toward Computer Use with Anthropic
@cgevent
Можно подглядеть URL на скрине.
А Антропик тем временем подсуетился и сделал бесплатный курс по использовании своего Computer use. Это когда с помощью Клода можно управлять курсором, нажимать кнопки и вбивать текст. Autohotkey на стероидах и ориентированный больше на гиков.
Держите ссылку:
Building toward Computer Use with Anthropic
@cgevent