Dreams and Robots
3.07K subscribers
120 photos
20 videos
1 file
67 links
ИИ на практике или "мама, а меня тоже заменят?"
加入频道
В ChatGPT постепенно выкатывают DALL-E 3 для пользователей с подпиской.

Больше не нужно мучаться с промптами, запоминать стили и художников. Достаточно в общих чертах описать по-русски, что тебе нужно, а GPT4 уже сам преобразует это в подходящий запрос и довольно шустро сгенерирует картинку. При этом можно продолжать чат и просить что-то переделать или дополнить.

#chatgpt #dalle #gpt4 #openai
🔥31👍6🫡6
Кстати, GPT4 действительно научился объяснять мемы, причём делает это очень хорошо.

#chatgpt #gpt4 #openai
🔥35🥴5👏3
А ещё использование языковой модели в качестве интерфейса позволяет общаться с Dall-E, как с обычным дизайнером. Только Dall-E быстрее работает и меньше выделывается.

Например, вам нужна карикатура. Можно прямо по-русски в общих чертах сформулировать задачу. Под капотом GPT4 придумает четыре сюжета и для каждого сгенерирует свою картинку, причём сюжеты будут конкретными и детальными, в стиле "черноволосый человек сидит за компьютером, на экране видно то и сё...".

Потом вы можете попросить переделать конкретную картинку: изменить стиль, палитру, добавить-убрать предметы или героев, вставить надпись, поиграть шрифтами, ну, вы понимаете, побыть заказчиком.

Как и с мясным дизайнером результат не всегда предсказуем, и Stable Diffusion со своими инпейнтами и контролнетами всё ещё рулит. Но сам процесс такой работы над картинкой и поиска идей гораздо удобнее и понятнее интерфейса Автоматика.

#dalle #gpt4
🔥39👍31
Иногда кажется, что ChatGPT всегда был с нами. А ведь он вышел всего год назад, в конце ноября 2022 года.

Сегодня же OpenAI выдали пачку интересных анонсов.

1. OpenAI запускают модель GPT-4 Turbo аж со 128 тысячами токенов контекстной памяти, это целая увесистая книга. Модель будет умнее и быстрее GPT-4, при этом знания о мире отсекаются апрелем 2023 года.
2. Фишки для разработчиков: лучшая обработка экшенов, вывод в JSON, повторяемые результаты.
3. Все цены в API уменьшаются в 3 и 2 раза для входящих запросов и результата соответственно.
4. В API приходит Vision, Dall-e 3 и TTS. Whisper v3 на подходе.
5. GPTS - это автоматический конструктор и магазин чат-ботов для любой тематики. Можно загружать свои документы, давать инструкции и даже генерировать иконку в Dall-e.
6. Новый конструктор ассистентов позволяет легко запрограммировать заточенного на вашу тему помощника для приложений и сайтов.
7. Отныне в случае любых исков по авторскому праву OpenAI возьмут на себя все издержки. Это касается и API, и ChatGPT.
8. AGI has been achieved internally.

Новые фичи, как всегда, будут выкатываться постепенно.

https://www.youtube.com/watch?v=U9mJuUkhUzk

#openai #gpt4
🔥17👍131
Media is too big
VIEW IN TELEGRAM
Ну что, я потестил обновлённый API от OpenAI.

1. Из кода через GPT4 сгенерировал шесть описаний последовательности кадров на заданную тему.

2. По ним в Dall-e 3 сгенерировал картинки.

3. По картинкам в GPT4 Vision создал поэтичный текст.

4. Сгенерировал дикторский голос в OpenAI TTS. Эти пункты полностью автоматизированы.

5. Засунул картинки в Gen2 и создал видео (пока вручную).

6. В локальном Audiocraft сгенерировал музыку (если это можно так назвать).

7. Профит


Выводы:

- Для чистоты эксперимента я ничего отдельно не редактировал и не перегенерировал. Если добавить минимальный человеческий ввод, то можно добиться лучших результатов. Единственное, я наложил на видео немного шумов, потому что могу.

- Голос у OpenAI самый лучший из тех, что я слышал. Но у него плохо с ударениями в русском языке. Сложные слова: "мореплавателю", "гавани", "пенистый", "зову".

- Мы всё ближе к полностью автоматической генерации комплексного контента без лишней прослойки в виде человека.

#openai #gpt4 #dalle #gen2
🔥49👍132🥰1💩1
Media is too big
VIEW IN TELEGRAM
А теперь обратный процесс. Видео из текста с помощью OpenAI API.

1. Сгенерировал закадровый голос.

2. По его хронометражу определил, сколько нужно кадров.

3. В GPT4 создал JSON с нужным числом промптов для этих кадров.

4. Скормил их Dall-E 3 и получил картинки. До этого пункта всё автоматизировано. Подаёшь на вход текст, получаешь закадровый голос и секвенцию кадров.

5. Gen-2 для генерации движения (вручную).

6. Отказался от Audiocraft и сделал звук по старинке.

Пока что самое слабое звено в этой цепи - это Gen-2, который сильно портит картинку. Надеюсь, следующие версии будут работать лучше, и добавят API.

Сгенерируй 10 мультфильмов хронометражом 2 минуты в стиле Миядзаки, добавь закадровый голос и мрачную музыку. Выложи на Youtube с оригинальным названием и описанием.

#openai #gpt4 #dalle
🔥32👍5💩2😁1🤔1🥴1
Игры с промптами до добра не доводят. Я тут на базе GPT-4 сотворил Нейро-Понасенкова, который готов саркастически-снисходительно отвечать на любой комментарий в интернете.

На комментарии к этому посту тоже будет отвечать он, так что, если вы готовы к интеллектуальным унижениям, то можете рискнуть о чем-нибудь у него спросить. Думаете, он вас не переиграет?

#gpt4
😁28👍8🔥5🥰1💩1🌚1💘1
Ну что же, маэстро Нейро-Понасенков готов ко взрослой жизни. Теперь он существует в виде отдельного GPT.

Можете обсудить с ним волнующие вас вопросы на любом языке. Если, конечно, вы достаточно элитарны и обеспечены, чтобы оплатить подписку на ChatGPT. А чернь мы не будем отвлекать от поедания земли, или чем там они любят заниматься в свободное время?

https://chat.openai.com/g/g-MTW9O1uz4-sarcasmic-bliss

#gpt4 #chatgpt
20👍4🤡4
Если вы занимаетесь программированием, вам наверняка знаком сайт https://leetcode.com/, на котором собраны алгоритмические задачи. Вы можете выбрать задачу, решить ее на любом языке программирования и автоматически проверить решение. Задачи с этого сайта часто используются на собеседованиях для проверки кандидатов.

Пять месяцев назад мне пришла идея эксперимента: Я беру сложные задачи, скармливаю их GPT4, без правок копирую результат на сайт и проверяю автотестом. Игра продолжается до первой ошибки. И тогда я срезался на первой же задаче, потому что решение содержало ошибки.

Вчера я вспомнил об этом эксперименте и решил его повторить. Памятуя о прошлом провале я начал с простой задачи. Она решилась мгновенно. Потом перешел на средние и решил 15 штук. Переключился на сложные. Тут я, честно говоря, в какой-то момент начал уставать, так как ошибок всё не было и не было. Меня спасло достижения лимита сообщений в ChatGPT. До этого момента я решил 22 сложные задачи.

В общем, за 43 минуты GPT4 решил 38 задач с LeetCode без единой ошибки.

Не все решения были оптимальными по быстродействию. Примерно половина укладывалась в среднее значение (по сравнению с человеческим кодом), процентов 30 была медленнее, зато оставшиеся были быстрее, чем 90 процентов предложенных решений.

Какой можно сделать вывод?

Ну, во-первых, GPT4 сейчас и GPT4 пять месяцев назад очень сильно отличаются друг от друга. Это бьется с последним интервью Альтмана, в котором он признался, что они больше не хотят революционных прорывов, а планируют медленно разогревать воду в котле с лягушками.

А во-вторых, следующее поколение программистов будет ленивым и неизобретательным, зато задачи будут щёлкаться как семечки.

#gpt4 #programming
🔥25👍10😱6🤡21
Я знаю, что меня читают люди из разных сфер визуального искусства, от геймдева до моушена и кино. Специально для вас я создал Сердитого Арт Директора — бота, который доходчиво объяснит, почему ваш дизайн ужасен.

Страдаете от острой фазы синдрома Даннинга-Крюгера? Ваш дизайнер прислал очередной скетч, и вы не знаете, что ему ответить? Считаете, что без депрессии нет творчества?

Покажите вашу картинку Сердитому Арт Директору, напишите, что вы хотели этой картинкой сказать, и получите честный и неполиткорректный отзыв.

https://chat.openai.com/g/g-d2le00CAl-angry-art-director

Да, ссылка сработает только если у вас есть платная подписка на ChatGPT.

Как известно, художника обидеть легко. А иногда ещё и очень приятно.


#chatgpt #gpt4
🔥34😁21🤣54🤝1