Нейронавт | Нейросети в творчестве
9.43K subscribers
3.65K photos
3.15K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Forwarded from Сиолошная
This media is not supported in your browser
VIEW IN TELEGRAM
Today is the Day! Вечером смотрим презентацию OpenAI (17:00 UTC, 20:00 MSK)

Многие сотрудники компании пишут, что они очень взволнованы (в позитивном смысле). Честно говоря не помню такого нагона хайпа ни на ноябрьский DevDay, ни при релизе GPT-4 (работали поди, хех).

Рабочая версия того, что покажут — голосового AI-ассистента, который умеет распознавать эмоции в голосе, а также сам меняет интонацию в зависимости от контекста. Возможно, ключевым отличием нового продукта (помимо голосовых функций) станет низкая задержка — у людей будет создаваться ощущение, что они общаются с человеком, а не машиной. Также ходят слухи, что будут и видео-звонки с аватаром.

Ждём вечера 👍 все обновления буду писать в канал, а вы не забывайте скачать бинго-карточку, чтоб было интереснее смотреть

UPD: только сейчас понял, что OpenAI тоже всё перенесли на...после майских!
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥2🌚1
Forwarded from Эксплойт
Коротко о главном с презентации OpenAI:

— Новая модель GPT4 Omni, бесплатно для всех пользователей;
— Лучше базовой GPT-4 во всём, особенно в кодинге;
— Все фишки платных подписчиков будут доступны бесплатно;
— Полноценный голосовой ассистент, которого не отличить от человека;
— С помощью ассистента можно переводить речь с другого языка!

Только что OpenAI выкатила модель, без которой теперь не справится ни один работяга.

@exploitex
👍71
Даже не верится. А как они теперь зарабатывать будут? Завтра выкатят платную GPT-5?
🤔18👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Переносим ComfyUI в телеграм бота

Ожидая трансляцию OpenAI с апдейтами, хочется рассказать про еще рандомные тесты im-a-good-gpt2-chatbot:

Благодаря im-a-good-gpt2-chatbot понял как запихнуть ComfyUI, Gradio или Automatic внутрь бота, и работать прям из Телеграм с телефона.

🐈‍⬛ Из плохих вещей:
— Вам все еще нужно запустить GPU сервер в colab, runpod, вашего компа с доступом в инет
— Дизайн чуть адаптирован под телефон, но бывают трудности

🐈‍⬛ Из неожиданных плюсов:
— Теперь можно генерить в любимых UI для нейронок через тг и телефон со всеми своими лорами и чекпоинтами, которые вы собирали годами
— Можно шарить ссылку друзьям и вместе генерить, генерации автоматически попадают в очередь, или вы хотите сразу 5 разных пайпланов тестить с разных устройств.

Конечно я понимаю, что идеально переписывать все под формат телеграмма, чтобы это был готовый продукт. Но если вам нужно дешево и сердито, то вот ссылка на Colab. Нужно только заменить API ключ бота ТГ и подставить ссылку публичную, которую выдаст ComfyUI, Automatic или Gradio.

☺️ Мне почему-то возможность менять ноды в ComfyUI сидя в лесу невероятно нравится. Еще немного лет и может с новым gpt адаптирую Блендер под Тг бота.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍5
Тестим GPT-4o
15👍9😁6🤯3
по ссылкам ходит
👍10🔥1
в браузере не поет
🎃6
недолго музыка играла. 4o кончился, дальше 3.5 или платно
😁7👍1
Forwarded from Data Secrets
This media is not supported in your browser
VIEW IN TELEGRAM
Google такие: «стойте стойте, мы тоже в теме!»

Для тех, кто забыл или не успел отойти от презентации OpenAI напоминаем: сегодня состоится конференция Google I/O, на которой корпорация собирается показать свое обновление Gemini.

И это будет… работа с видео. Тизер почти 1в1 совпадает с тем, что показывали вчера OpenAI: модели в реальном времени показывают обстановку вокруг и спрашивают «как ты думаешь, что тут происходит?».

Правда сегодня, после вчерашнего шоу, таким шоу уже почти никого не удивишь. Видимо, Альтман что-то знал…
показывают умный поиск по фоткам
#news
расширили контекстное окно Gemini 1.5 Pro до 2 млн токенов. В перспективе - бесконечное окно
🔥12😱1
голосовой чат c железякой в NotebookLM
👍2
юзкейс Gemini - возврат кроссовок в магазин. ИИ делает все за вас
🔥1
Flash - облегченный вариант модели, оптимизированный для скорости. 1 млн токенов. Девелоперы могут запросить 2 млн
👍2
Демонстрация интерактивного агента. Речь, понимание изображения в реальном времени. Как у OpenAI
2
Генерация музыки, видео, картинок
3