Media is too big
VIEW IN TELEGRAM
Ну что, я потестил обновлённый API от OpenAI.
1. Из кода через GPT4 сгенерировал шесть описаний последовательности кадров на заданную тему.
2. По ним в Dall-e 3 сгенерировал картинки.
3. По картинкам в GPT4 Vision создал поэтичный текст.
4. Сгенерировал дикторский голос в OpenAI TTS. Эти пункты полностью автоматизированы.
5. Засунул картинки в Gen2 и создал видео (пока вручную).
6. В локальном Audiocraft сгенерировал музыку (если это можно так назвать).
7. Профит
Выводы:
- Для чистоты эксперимента я ничего отдельно не редактировал и не перегенерировал. Если добавить минимальный человеческий ввод, то можно добиться лучших результатов. Единственное, я наложил на видео немного шумов, потому что могу.
- Голос у OpenAI самый лучший из тех, что я слышал. Но у него плохо с ударениями в русском языке. Сложные слова: "мореплавателю", "гавани", "пенистый", "зову".
- Мы всё ближе к полностью автоматической генерации комплексного контента без лишней прослойки в виде человека.
#openai #gpt4 #dalle #gen2
1. Из кода через GPT4 сгенерировал шесть описаний последовательности кадров на заданную тему.
2. По ним в Dall-e 3 сгенерировал картинки.
3. По картинкам в GPT4 Vision создал поэтичный текст.
4. Сгенерировал дикторский голос в OpenAI TTS. Эти пункты полностью автоматизированы.
5. Засунул картинки в Gen2 и создал видео (пока вручную).
6. В локальном Audiocraft сгенерировал музыку (если это можно так назвать).
7. Профит
Выводы:
- Для чистоты эксперимента я ничего отдельно не редактировал и не перегенерировал. Если добавить минимальный человеческий ввод, то можно добиться лучших результатов. Единственное, я наложил на видео немного шумов, потому что могу.
- Голос у OpenAI самый лучший из тех, что я слышал. Но у него плохо с ударениями в русском языке. Сложные слова: "мореплавателю", "гавани", "пенистый", "зову".
- Мы всё ближе к полностью автоматической генерации комплексного контента без лишней прослойки в виде человека.
#openai #gpt4 #dalle #gen2
🔥49👍13❤2🥰1💩1