Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Вы, конечно, можете не впечатлиться результатом, но прогресс внимание на это не обращает.
Но часть из вас, таки, возможно, замечает улучшения в генерации трехмерных объектов.
Модель MVDream выстраивает объект, опираясь на текстовое описание и большое количество ракурсов, используемых для обучения. Авторы не пишут, откуда конкретно они берут данные, но могу предположить, что это Sketchfab или его аналоги.
Кто видел старт диффузионных моделей, тот над многоракурсной диффузией не смеется 🫡
Сорс
Но часть из вас, таки, возможно, замечает улучшения в генерации трехмерных объектов.
Модель MVDream выстраивает объект, опираясь на текстовое описание и большое количество ракурсов, используемых для обучения. Авторы не пишут, откуда конкретно они берут данные, но могу предположить, что это Sketchfab или его аналоги.
Кто видел старт диффузионных моделей, тот над многоракурсной диффузией не смеется 🫡
Сорс
🔥15
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Классный эксперимент с Гауссовскими Сплаттингом (я писал об этом методе на днях). Челик взял три картины, задал для них вручную разные позиции камер внутри ондной сцены и обучил сплаттинг.
В итоге при повороте камеры достигается такой интересный эффект перехода одной картины в другую. Сплатики научились отображать разные картины с различных углов.
Кстати, вот тут еще повилась имплементация рендеринга Gaussian Splatting внутри божественной библиотеки nerfstudio (подробнее про нее в этом посте).
@ai_newz
В итоге при повороте камеры достигается такой интересный эффект перехода одной картины в другую. Сплатики научились отображать разные картины с различных углов.
Кстати, вот тут еще повилась имплементация рендеринга Gaussian Splatting внутри божественной библиотеки nerfstudio (подробнее про нее в этом посте).
@ai_newz
👍6🔥3
FaceChain
Создает цифрового двойника по одной портретной фотографи (можно больше). Аватар громкое слово, потому чтоб грубо говоря, это что-то вроде LoRA, дообученной на конкретного персонажа, только работает не на базе SD, а на ModelScope. Поэтому и демка с иероглифами.
Планируют добавить поддержку нескольких базовых моделей, стили, ретушь и высокое разрешение.
Коротко по демо: Заливаете несколько фоток персонажа, жмете Start Traingng, ждете. Переходите на вкладку Inference, разворачиваете менюшку Expert, удаляете из промта 'chinese' если не хотите получить азиата. Жмете Start. Узнали Дэнни?
Код
Демо
Колаб
#image2face #finetuning #tools
Создает цифрового двойника по одной портретной фотографи (можно больше). Аватар громкое слово, потому чтоб грубо говоря, это что-то вроде LoRA, дообученной на конкретного персонажа, только работает не на базе SD, а на ModelScope. Поэтому и демка с иероглифами.
Планируют добавить поддержку нескольких базовых моделей, стили, ретушь и высокое разрешение.
Коротко по демо: Заливаете несколько фоток персонажа, жмете Start Traingng, ждете. Переходите на вкладку Inference, разворачиваете менюшку Expert, удаляете из промта 'chinese' если не хотите получить азиата. Жмете Start. Узнали Дэнни?
Код
Демо
Колаб
#image2face #finetuning #tools
This media is not supported in your browser
VIEW IN TELEGRAM
Голландский диджей Уммет Озкан показывает как превращать свой голос в любые музыкальные инструменты с помощью Musicfy (от $7.99 в месяц).
Можно напеть мелодию и получить полноценный инструментальный трек.
Полная инструкция
#voice2music #audio2audio #sound2music #music2music
Можно напеть мелодию и получить полноценный инструментальный трек.
Полная инструкция
#voice2music #audio2audio #sound2music #music2music
This media is not supported in your browser
VIEW IN TELEGRAM
Умер вокалист Smash Mouth Стив Харвелл. Милый трибьют от There I ruined it
❤4
This media is not supported in your browser
VIEW IN TELEGRAM
RunwayML теперь делает 3D на основе вашего видео. Можно настроить траекторию камеры и получить новое видео
Для лучшего результата:
• Отключите HDR в настройках камеры
• Снимайте 30 секунд или дольше (лучше всего от 1 до 3 минут)
• Не дергайте камеру резко
• Выберите настройки камеры с высоким FPS, например замедленную съёмку
#videoto3D #video2video #video2scene
Для лучшего результата:
• Отключите HDR в настройках камеры
• Снимайте 30 секунд или дольше (лучше всего от 1 до 3 минут)
• Не дергайте камеру резко
• Выберите настройки камеры с высоким FPS, например замедленную съёмку
#videoto3D #video2video #video2scene
🔥2
То там то сям кто-то с кем-то судится за использование ИИ. Тем временем организация по борьбе с детским трафиком FreeAGirl использует сгенерированные MidJourney фото вместо реальных чтобы защитить запечатленных на них людей.
❤5🤔1
Для генератора речи Bark появился демоспейс, можно клонировать голос по 20-секундному образцу.
Демо
#text2audio #tts #voicecloning #text2speech
Демо
#text2audio #tts #voicecloning #text2speech
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Я вам принес с утра немного скепсиса. Нельзя ведь проснуться и не похейтить!
Тулза Reverie, которая может скопипастить муд из референсной картинки! И не просто сгенерить и перенести LUT, а настроить ваш directional light, skylight, перенести воздушную перспективу и т.д.
В интерфейсе мы видим landscape, weather, lighting, soundscape. Выглядит и звучит как😒
Создатель обещает выложить в релиз в этом году, что же, посмотрим! Там, конечно, не обошлось без AI.
Тулза Reverie, которая может скопипастить муд из референсной картинки! И не просто сгенерить и перенести LUT, а настроить ваш directional light, skylight, перенести воздушную перспективу и т.д.
В интерфейсе мы видим landscape, weather, lighting, soundscape. Выглядит и звучит как😒
Создатель обещает выложить в релиз в этом году, что же, посмотрим! Там, конечно, не обошлось без AI.
❤5
Forwarded from QWERTY
Media is too big
VIEW IN TELEGRAM
Российская компания по шерингу самокатов сообщила, что провела испытания по управлению устройством "силой мысли"
Биотех-лаборатория Neiry совместно с одним из операторов кикшеринга смогла изменить скорость движения транспортного средства в соответствии с изменениями волновой активности головного мозга самокатчика. В эксперименте использовался нейроинтерфейс Neiry — устройство, которое снимает показатели электроэнцефалограммы головного мозга человека, позволяя определить когнитивную нагрузку, усталость, стресс и концентрацию внимания. Алгоритмы Neiry анализируют степень концентрации человека, которая определяется соотношением альфа- и бета-ритмов головного мозга. Этот показатель программисты связали со скоростью электроcамоката через API. Таким образом, скорость устройства возрастала по мере увеличения концентрации и наоборот, скорасть падала при снижении внимания.
Пока что эту функцию не планируют включать на общедоступных прокатных самокатах.
Биотех-лаборатория Neiry совместно с одним из операторов кикшеринга смогла изменить скорость движения транспортного средства в соответствии с изменениями волновой активности головного мозга самокатчика. В эксперименте использовался нейроинтерфейс Neiry — устройство, которое снимает показатели электроэнцефалограммы головного мозга человека, позволяя определить когнитивную нагрузку, усталость, стресс и концентрацию внимания. Алгоритмы Neiry анализируют степень концентрации человека, которая определяется соотношением альфа- и бета-ритмов головного мозга. Этот показатель программисты связали со скоростью электроcамоката через API. Таким образом, скорость устройства возрастала по мере увеличения концентрации и наоборот, скорасть падала при снижении внимания.
Пока что эту функцию не планируют включать на общедоступных прокатных самокатах.
😁1
VideoGen: A Reference-Guided Latent Diffusion Approach for High Definition Text-to-Video Generation
Генераторы видео поперли как грибы после дождя. Этот с претензией на высокое разрешение
Кода нет
Демо нет
#text2video
Генераторы видео поперли как грибы после дождя. Этот с претензией на высокое разрешение
Кода нет
Демо нет
#text2video
👍4❤1
Media is too big
VIEW IN TELEGRAM
ResFields:Residual Neural Fields for Spatiotemporal Signals
#nerf в движении
Непонятно за счет чего достигается такая точность. На видео показано три камеры с почти одинаковым ракурсом. На мой взгляд этого маловато чтобы захватить движущиеся сцены в объеме, даже с каналом глубины.
Код
Колаб. Если запустится на бесплатном аккаунте, дайте знать
#video2nerf #video2scene #novelview #rendering
#nerf в движении
Непонятно за счет чего достигается такая точность. На видео показано три камеры с почти одинаковым ракурсом. На мой взгляд этого маловато чтобы захватить движущиеся сцены в объеме, даже с каналом глубины.
Код
Колаб. Если запустится на бесплатном аккаунте, дайте знать
#video2nerf #video2scene #novelview #rendering
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Нейроперевод видео с липсинком от Heygen стал доступен. На старте дают 1 кредит, это в сумме на 1 минуту видео. Максимальный хронометраж одного видео 30 сек. И обещают накидывать 1 кредит в начале каждого расчетного периода (месяц? год? день?). И еще накидывают по кредиту за видео сгенеренное вашим реферралом.
Попробовать
#video2video #lipsync #speech2speech
Попробовать
#video2video #lipsync #speech2speech
🤯4👍2