Нейронавт | Нейросети в творчестве
9.41K subscribers
3.63K photos
3.14K videos
40 files
4.1K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Заходите если успеете, вроде ссылка работает
Привет! Вот ссылка для регистрации. Поспешите, ведь зарегистрироваться смогут самые быстрые 10 тысяч человек.

И не расстраивайтесь, если не повезёт — на следующей неделе точно получите свой доступ.

bit.ly/436MYEP
вот еще одна ссылка
Привет! Вот ссылка для регистрации. Поспешите, ведь зарегистрироваться смогут самые быстрые 10 тысяч человек.

И не расстраивайтесь, если не повезёт — на следующей неделе точно получите свой доступ.

https://bit.ly/41Nogs0
👍1
Forwarded from Сиолошная
OpenAI спустя всего 6 месяцев сделали iOS приложения для доступа к ChatGPT, чтобы не нужно было бегать в браузер. Пока — только в США, но другие страны, если верить анонсу, на подходе; то же верно и для Android-версии.

Существенное отличие по сути одно: к языковой модели сбоку пришили Whisper — нейронку от тех же OpenAI, которая переводит речь в текст. Так что по сути это Siri на максималках, вот! Жаль, что одновременно с этим не презентовали text-to-speech, был бы очень интересный коллаб.

Если у вас американский аккаунт, то скачать можно тут.
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Очень не очевидный подход к управлению результатами генераций через контроль опорных точек.

С помощью DragGAN можно деформировать изображение с точным контролем расположения пикселей, таким образом манипулируя позой, формой, выражением и расположением различных категорий, таких как животные, автомобили, люди, пейзажи и т. д.

Если попробовать проинтерполировать этот подход, то в какой-то момент мы приблизимся к управлению, подобному обычному вьюпорту трёхмерного софта с гизмами и вращением объектов в трёхмерном представлении.

Сорс
🔥6
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Тэкс, Google анонсировал модельки для генерации кода встроенные прямо в Colab. Скоро появятся во всех ноутбуках.

Под ноутбуком будут бегать модельки под названием Codey (типа аналог OpenAI Codex), которые основаны на Palm-2 и натренены на опенсоурсных исходниках. Теперь везде будут пихать этот Палм.

Хотя, думаю, народ в FAANG-ах уже давно пользуются аналогичным дополнялками внутри компаний. Не будешь же на работе в гугл колабе писать (если вы не стартап) или кодексу свои велосипеды показывать.

@ai_newz
Forwarded from QWERTY
ИИ сам освоил новый язык, которому его не учили

Разработчики нейросети от Google были удивлены тому, что она стала обладать знаниями, которые знать не должна. В данном случае речь идет о бенгальском языке. Потребовалось совсем немного подсказок, чтобы получать внятные и вполне осмысленные ответы на этом языке. На данный момент профильные специалисты не находят ничего лучше, чем сказать, что открытое свойство ИИ является «загадочным». Разработчики озадачены еще и тем, что этот феномен становится все более распространенным.

Бенгальский язык распространен на северо-востоке Индийского субконтинента, на нем говорят более 260 млн чел.
3
Ян Лекун - один из нескольких человек в мире, которые больше всех понимают про большие языковые модели (LLM), их возможности и риски, с ними связанные
3
This media is not supported in your browser
VIEW IN TELEGRAM
lalamu
Липсинк. Заставляем любого персонажа шевелить губами под заданный аудиотрек с речью. Есть какой-то бесплатный функционал

Делитесь результатами в коментах!

#lipsync #speech2video #talkinghead
This media is not supported in your browser
VIEW IN TELEGRAM
Ecout — транскрипция любого видео в реальном времени

Он ещё и придумывает ответы на вопросы, которые звучат прямо в эфире, используя OpenAI GPT-3.5

Код

#speech2text #video2text
Forwarded from Градиент обреченный (Sergei Averkiev)
Всем продуктивной недели. Не обижайте языковые модели, они наши друзья.
Forwarded from Dreams and Robots
Вы наверняка слышали про Instruct pix2pix. Это модель, которая позволяет менять картинку на основе текстового запроса типа "make his hair blue" или "turn it into a wood carving".

Так вот, изначальный вариант pix2pix, который был реализован в Автоматике, уже устарел. Теперь гораздо удобнее пользоваться pix2pix моделью КонтролНета. Она позволяет работать с хайрезными изображениями и в ней не нужно париться с двойной настройкой Denoising strength.

Работает прямо в text2image. Добавьте исходную картинку в ControlNet, оставьте препроцессор в "none", выберите модель "Control_v11e_sd15_ip2p", поставьте правильное разрешение картинки, наберите вашу инструкцию в поле промпта и жмите Generate.

Например я взял исходную картинку с древним городом, превратил ее в схематичный рисунок, в зимнюю сцену и в ночную с огнём.

#совет #A1111 #stablehoudini
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
CoDi: Any-to-Any Generation via Composable Diffusion

Microsoft сообразил генерацию чего угодно из чего угодно:
текст, звук, видео, картинки

[UPDATE]
Код

#multimodal #anything2anything
👍1