Dreams and Robots
3.06K subscribers
120 photos
20 videos
1 file
67 links
ИИ на практике или "мама, а меня тоже заменят?"
加入频道
В эфире наша постоянная рубрика "Жалобы на Steam".

Теперь они отказали в публикации игре, в которой перевод текста был сделан с помощью ChatGPT, причем отказали по старой схеме: с вопросами про авторское право. То есть, ещё раз, речь не про контент, а только про перевод.

Как я понимаю, у них есть внутреннее правило: если где-то в материалах игры упоминается AI, то игру не публикуем и спрашиваем разработчика насчет прав на датасет.

В Valve сидят прошаренные ребята, они понимают, какой серой зоной является сегодняшнее законодательство в сфере ИИ. Им, как компании-дистрибьютеру, не нужен неожиданный иск от какого-нибудь условного Стивена Кинга. Проще отказать и не пущать.

Государственная машина во всех странах очень неповоротлива, и добавление в законодательство новых концепций может затянуться на годы, а то и на десятилетия. А пока, если вы делаете творческий продукт с использованием ИИ, у вас есть выбор: или заранее озаботьтесь всеми документами, подтверждающими авторское право, или не отсвечивайте и уберите упоминания о ваших инструментах из соцсетей.

Почитать рассказ разработчика и обсуждение ситуации можно тут:

https://www.reddit.com/r/gamedev/comments/16r4dik/steam_also_rejects_games_translated_by_ai_details/

#steam #gamedev #авторское_право
👍14🥱21
Как вы думаете, когда сгенерированных ИИ картинок станет больше, чем изображений, созданных людьми за всю историю человечества? Под изображениями я имею в виду картины, фотографии и прочие жанры визуального искусства.
public poll

1-3 года – 154
👍👍👍👍👍👍👍 41%

Это уже произошло – 152
👍👍👍👍👍👍👍 40%

3-10 лет – 51
👍👍 14%

Никогда – 11
👍 3%

10-100 лет – 7
▫️ 2%

Больше 100 лет – 2
▫️ 1%

👥 377 people voted so far.
👍9
Лекс Фридман выпустил подкаст прямиком из Метаверса. Помните мем с лоу-поли аватаром Цукерберга на фоне Эйфелевой башни? Так вот, забудьте.

Технология Pixel Codec Avatars позволяет создавать фотореалистичных аватаров на основе 3D-сканов. Главная фишка - через камеры, встроенные в шлем, в реальном времени отслеживается мимика и движение губ. Реализм изображения в динамике просто зашкаливает. Зловещая долина убегает, поджав хвост, к зловещему айзеншпису.

Вангую, что в будущем станет популярной профессия цифрового стилиста и пластического хирурга для облагораживания своего отсканированного аватара. Изучайте ZBrush, пока не поздно, истинно реку!

https://www.youtube.com/watch?v=MVYrJJNdrEg

#VR #metaverse
🔥12👍6🤮5😁1🤔1🥴1
Каждый раз, когда выходит новая модель для генерации изображений, я первым делом пытаюсь сгенерировать Cyberpunk city at night from above, чтобы посмотреть, как она справляется с окнами.

Так вот, рекламируемая из каждого утюга Dalle-3 этот тест не проходит и, как будто, ничего кардинально нового не привносит.

Попробуйте меня переубедить в комментариях.

https://www.bing.com/images/create/

#dalle
👍24😁6👎2🤨1
А вот что в Dall-e 3 действительно хорошо, так это работа с запросами. В Stable Diffusion очень сложно избавиться от утечки цвета, когда в одном запросе перечисляешь разные цвета.

Возьмем такой промпт: Girl with red hair, blue eyes, wearing green jacket with brown tie. В Стейбле у вас будут появляться синие галстуки и красные куртки. А Dall-e 3 отлично справился.

#dalle
👍42
В ChatGPT постепенно выкатывают DALL-E 3 для пользователей с подпиской.

Больше не нужно мучаться с промптами, запоминать стили и художников. Достаточно в общих чертах описать по-русски, что тебе нужно, а GPT4 уже сам преобразует это в подходящий запрос и довольно шустро сгенерирует картинку. При этом можно продолжать чат и просить что-то переделать или дополнить.

#chatgpt #dalle #gpt4 #openai
🔥31👍6🫡6
Кстати, GPT4 действительно научился объяснять мемы, причём делает это очень хорошо.

#chatgpt #gpt4 #openai
🔥35🥴5👏3
🤯343👍2🔥2👏1
А ещё использование языковой модели в качестве интерфейса позволяет общаться с Dall-E, как с обычным дизайнером. Только Dall-E быстрее работает и меньше выделывается.

Например, вам нужна карикатура. Можно прямо по-русски в общих чертах сформулировать задачу. Под капотом GPT4 придумает четыре сюжета и для каждого сгенерирует свою картинку, причём сюжеты будут конкретными и детальными, в стиле "черноволосый человек сидит за компьютером, на экране видно то и сё...".

Потом вы можете попросить переделать конкретную картинку: изменить стиль, палитру, добавить-убрать предметы или героев, вставить надпись, поиграть шрифтами, ну, вы понимаете, побыть заказчиком.

Как и с мясным дизайнером результат не всегда предсказуем, и Stable Diffusion со своими инпейнтами и контролнетами всё ещё рулит. Но сам процесс такой работы над картинкой и поиска идей гораздо удобнее и понятнее интерфейса Автоматика.

#dalle #gpt4
🔥39👍31
Иногда кажется, что ChatGPT всегда был с нами. А ведь он вышел всего год назад, в конце ноября 2022 года.

Сегодня же OpenAI выдали пачку интересных анонсов.

1. OpenAI запускают модель GPT-4 Turbo аж со 128 тысячами токенов контекстной памяти, это целая увесистая книга. Модель будет умнее и быстрее GPT-4, при этом знания о мире отсекаются апрелем 2023 года.
2. Фишки для разработчиков: лучшая обработка экшенов, вывод в JSON, повторяемые результаты.
3. Все цены в API уменьшаются в 3 и 2 раза для входящих запросов и результата соответственно.
4. В API приходит Vision, Dall-e 3 и TTS. Whisper v3 на подходе.
5. GPTS - это автоматический конструктор и магазин чат-ботов для любой тематики. Можно загружать свои документы, давать инструкции и даже генерировать иконку в Dall-e.
6. Новый конструктор ассистентов позволяет легко запрограммировать заточенного на вашу тему помощника для приложений и сайтов.
7. Отныне в случае любых исков по авторскому праву OpenAI возьмут на себя все издержки. Это касается и API, и ChatGPT.
8. AGI has been achieved internally.

Новые фичи, как всегда, будут выкатываться постепенно.

https://www.youtube.com/watch?v=U9mJuUkhUzk

#openai #gpt4
🔥17👍131
Media is too big
VIEW IN TELEGRAM
Ну что, я потестил обновлённый API от OpenAI.

1. Из кода через GPT4 сгенерировал шесть описаний последовательности кадров на заданную тему.

2. По ним в Dall-e 3 сгенерировал картинки.

3. По картинкам в GPT4 Vision создал поэтичный текст.

4. Сгенерировал дикторский голос в OpenAI TTS. Эти пункты полностью автоматизированы.

5. Засунул картинки в Gen2 и создал видео (пока вручную).

6. В локальном Audiocraft сгенерировал музыку (если это можно так назвать).

7. Профит


Выводы:

- Для чистоты эксперимента я ничего отдельно не редактировал и не перегенерировал. Если добавить минимальный человеческий ввод, то можно добиться лучших результатов. Единственное, я наложил на видео немного шумов, потому что могу.

- Голос у OpenAI самый лучший из тех, что я слышал. Но у него плохо с ударениями в русском языке. Сложные слова: "мореплавателю", "гавани", "пенистый", "зову".

- Мы всё ближе к полностью автоматической генерации комплексного контента без лишней прослойки в виде человека.

#openai #gpt4 #dalle #gen2
🔥49👍132🥰1💩1