Forwarded from Рассылка от GigaChat
Привет! Вот ссылка для регистрации. Поспешите, ведь зарегистрироваться смогут самые быстрые 10 тысяч человек.
И не расстраивайтесь, если не повезёт — на следующей неделе точно получите свой доступ.
bit.ly/436MYEP
И не расстраивайтесь, если не повезёт — на следующей неделе точно получите свой доступ.
bit.ly/436MYEP
developers.sber.ru
Studio - личный кабинет платформы технологий от Сбера для развития вашего бизнеса
Получить доступ к GigaChat API и другим технологиям
Forwarded from Рассылка от GigaChat
Привет! Вот ссылка для регистрации. Поспешите, ведь зарегистрироваться смогут самые быстрые 10 тысяч человек.
И не расстраивайтесь, если не повезёт — на следующей неделе точно получите свой доступ.
https://bit.ly/41Nogs0
И не расстраивайтесь, если не повезёт — на следующей неделе точно получите свой доступ.
https://bit.ly/41Nogs0
developers.sber.ru
GigaChat - нейросетевая модель от Сбера – База знаний
Инструкции, примеры, обзоры промптов для генерации текста, изображений, работы с кодом с помощью нейросети GigaChat
👍1
Forwarded from Сиолошная
OpenAI спустя всего 6 месяцев сделали iOS приложения для доступа к ChatGPT, чтобы не нужно было бегать в браузер. Пока — только в США, но другие страны, если верить анонсу, на подходе; то же верно и для Android-версии.
Существенное отличие по сути одно: к языковой модели сбоку пришили Whisper — нейронку от тех же OpenAI, которая переводит речь в текст. Так что по сути это Siri на максималках, вот! Жаль, что одновременно с этим не презентовали text-to-speech, был бы очень интересный коллаб.
Если у вас американский аккаунт, то скачать можно тут.
Существенное отличие по сути одно: к языковой модели сбоку пришили Whisper — нейронку от тех же OpenAI, которая переводит речь в текст. Так что по сути это Siri на максималках, вот! Жаль, что одновременно с этим не презентовали text-to-speech, был бы очень интересный коллаб.
Если у вас американский аккаунт, то скачать можно тут.
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Очень не очевидный подход к управлению результатами генераций через контроль опорных точек.
С помощью DragGAN можно деформировать изображение с точным контролем расположения пикселей, таким образом манипулируя позой, формой, выражением и расположением различных категорий, таких как животные, автомобили, люди, пейзажи и т. д.
Если попробовать проинтерполировать этот подход, то в какой-то момент мы приблизимся к управлению, подобному обычному вьюпорту трёхмерного софта с гизмами и вращением объектов в трёхмерном представлении.
Сорс
С помощью DragGAN можно деформировать изображение с точным контролем расположения пикселей, таким образом манипулируя позой, формой, выражением и расположением различных категорий, таких как животные, автомобили, люди, пейзажи и т. д.
Если попробовать проинтерполировать этот подход, то в какой-то момент мы приблизимся к управлению, подобному обычному вьюпорту трёхмерного софта с гизмами и вращением объектов в трёхмерном представлении.
Сорс
🔥6
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Тэкс, Google анонсировал модельки для генерации кода встроенные прямо в Colab. Скоро появятся во всех ноутбуках.
Под ноутбуком будут бегать модельки под названием Codey (типа аналог OpenAI Codex), которые основаны на Palm-2 и натренены на опенсоурсных исходниках. Теперь везде будут пихать этот Палм.
Хотя, думаю, народ в FAANG-ах уже давно пользуются аналогичным дополнялками внутри компаний. Не будешь же на работе в гугл колабе писать (если вы не стартап) или кодексу свои велосипеды показывать.
@ai_newz
Под ноутбуком будут бегать модельки под названием Codey (типа аналог OpenAI Codex), которые основаны на Palm-2 и натренены на опенсоурсных исходниках. Теперь везде будут пихать этот Палм.
Хотя, думаю, народ в FAANG-ах уже давно пользуются аналогичным дополнялками внутри компаний. Не будешь же на работе в гугл колабе писать (если вы не стартап) или кодексу свои велосипеды показывать.
@ai_newz
Forwarded from QWERTY
ИИ сам освоил новый язык, которому его не учили
Разработчики нейросети от Google были удивлены тому, что она стала обладать знаниями, которые знать не должна. В данном случае речь идет о бенгальском языке. Потребовалось совсем немного подсказок, чтобы получать внятные и вполне осмысленные ответы на этом языке. На данный момент профильные специалисты не находят ничего лучше, чем сказать, что открытое свойство ИИ является «загадочным». Разработчики озадачены еще и тем, что этот феномен становится все более распространенным.
Бенгальский язык распространен на северо-востоке Индийского субконтинента, на нем говорят более 260 млн чел.
Разработчики нейросети от Google были удивлены тому, что она стала обладать знаниями, которые знать не должна. В данном случае речь идет о бенгальском языке. Потребовалось совсем немного подсказок, чтобы получать внятные и вполне осмысленные ответы на этом языке. На данный момент профильные специалисты не находят ничего лучше, чем сказать, что открытое свойство ИИ является «загадочным». Разработчики озадачены еще и тем, что этот феномен становится все более распространенным.
Бенгальский язык распространен на северо-востоке Индийского субконтинента, на нем говорят более 260 млн чел.
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
lalamu
Липсинк. Заставляем любого персонажа шевелить губами под заданный аудиотрек с речью. Есть какой-то бесплатный функционал
Делитесь результатами в коментах!
#lipsync #speech2video #talkinghead
Липсинк. Заставляем любого персонажа шевелить губами под заданный аудиотрек с речью. Есть какой-то бесплатный функционал
Делитесь результатами в коментах!
#lipsync #speech2video #talkinghead
This media is not supported in your browser
VIEW IN TELEGRAM
Ecout — транскрипция любого видео в реальном времени
Он ещё и придумывает ответы на вопросы, которые звучат прямо в эфире, используя OpenAI GPT-3.5
Код
#speech2text #video2text
Он ещё и придумывает ответы на вопросы, которые звучат прямо в эфире, используя OpenAI GPT-3.5
Код
#speech2text #video2text
Forwarded from Градиент обреченный (Sergei Averkiev)
Всем продуктивной недели. Не обижайте языковые модели, они наши друзья.
Forwarded from Dreams and Robots
Вы наверняка слышали про Instruct pix2pix. Это модель, которая позволяет менять картинку на основе текстового запроса типа "make his hair blue" или "turn it into a wood carving".
Так вот, изначальный вариант pix2pix, который был реализован в Автоматике, уже устарел. Теперь гораздо удобнее пользоваться pix2pix моделью КонтролНета. Она позволяет работать с хайрезными изображениями и в ней не нужно париться с двойной настройкой Denoising strength.
Работает прямо в text2image. Добавьте исходную картинку в ControlNet, оставьте препроцессор в "none", выберите модель "Control_v11e_sd15_ip2p", поставьте правильное разрешение картинки, наберите вашу инструкцию в поле промпта и жмите Generate.
Например я взял исходную картинку с древним городом, превратил ее в схематичный рисунок, в зимнюю сцену и в ночную с огнём.
#совет #A1111 #stablehoudini
Так вот, изначальный вариант pix2pix, который был реализован в Автоматике, уже устарел. Теперь гораздо удобнее пользоваться pix2pix моделью КонтролНета. Она позволяет работать с хайрезными изображениями и в ней не нужно париться с двойной настройкой Denoising strength.
Работает прямо в text2image. Добавьте исходную картинку в ControlNet, оставьте препроцессор в "none", выберите модель "Control_v11e_sd15_ip2p", поставьте правильное разрешение картинки, наберите вашу инструкцию в поле промпта и жмите Generate.
Например я взял исходную картинку с древним городом, превратил ее в схематичный рисунок, в зимнюю сцену и в ночную с огнём.
#совет #A1111 #stablehoudini
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
CoDi: Any-to-Any Generation via Composable Diffusion
Microsoft сообразил генерацию чего угодно из чего угодно:
текст, звук, видео, картинки
[UPDATE]
Код
#multimodal #anything2anything
Microsoft сообразил генерацию чего угодно из чего угодно:
текст, звук, видео, картинки
[UPDATE]
Код
#multimodal #anything2anything
👍1