Нейронавт | Нейросети в творчестве

6:40

Media is too big

MiniCPM-o 2.6

Опенсорсная мультимодальная модель от китайцев OpenBMB, превосходящая GPT-4V на визуальных задачах

8B параметров, работает на смартфонах и планшетах.

Под капотом SigLip-400M + Whisper-300M + ChatTTS-200M + Qwen2.5-7B

Голосовое общение в реальном времени, клонирование голоса

Гитхаб
Демо
Веса

#vlm #voicemode #realtime #mobile #voicecloning

❤8👍2🔥1

1.72K viewsedited 16:24

0:56

Dreamina

Генератор картинок и видео от Capcut.
Вопреки официальному твиту, видеогенератор в бете, мне недоступен.
И да, там у них так же в бете и генератор музыки есть

Для картинок есть редактор с холстом

Вход на сайт из РФ заблокирован

#text2image #text2video #image2video #text2music #imageediting

💩3👀3👍1

2.28K views17:14

Krea Convert to 3D

В Krea.ai новый инструмент, позволяющий конвертировать объекты с изображения в 3D модели и вертеть их чтобы получить референс с нужного угла для генерации картинки

Бесплатно для всех

#imageediting #novelview #image2image #imgaeediting

🤯20🔥6👍5❤1

2.67K views17:30

FLUX Pro Finetuning API

BlackForest Labs выпустили API для дообучения #FLUX

Уверяют что результат файнтюна будет работать со всеми официальными вариантами FLUX и совместим с FLUX Tools

FLUX Finetuning Beta Guide

#finetuning #lora #api

🔥8👍2

2.02K views18:09

SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces

Релайтинг портретов картами окружения

Кода нет

#relighting #hdri

❤12🤔1

1.74K views07:06

0:05

0:05

Cosmos1GP: Cosmos1GP for the GPU Poor by DeepBeepMeep

Нвидиевский видеогенератор миров Cosmos, версия для бедных.

с правильными настройками на 3090/4090 можно генерить по 10 секунд видео

#text2video #image2video #simulation #text2world #image2world

👍10

1.81K views07:38

FunAudioLLM/SenseVoiceSmall · Hugging Face

FunAudioLLM: Voice Understanding and Generation Foundation Models for Natural Interaction Between Humans and LLMs

Инструмент от Alibaba для голосового общения человека с языковыми моделями в реальном времени, можно собрать свой #Voicemode

Распознает речь на 50 языках.
Сам говорит и клонирует голос на 5 языках, русского пока нет

SenseVoice - распознавание голоса и эмоций

CosyVoice - генерирует речь по тексту

Демо CosyVoice 2.0

Демо CosyVoise 2.0 на modelscope

Код

#tts #text2speech #stt #speech2text #realtime

huggingface.co

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

👍8

1.8K views08:08

0:13

Gaussian Splatting for Nuke - irrealix plugin

Плагин для работы со сценами на гауссианах в #nuke

- Импорт .ply файлов или сжатого .ply из SuperSplat
- Обрезка cцен сферой, боксом, плоскостью Y
- До 10 сплатов в одной сцене
- работа с цветом
- некоторые возможности анимации
- Рендер в реальном времени на GPU
- Рендер пасса глубины

Купить платно за деньги

#gaussian

❤4

1.81K views13:40

ComfyUI Cosmos

Официальная поддержка видеогенератора от NVIDIA в #ComfyUI

Примеры и воркфлоу

#text2video #image2video

🔥12👍5🤔1

2.1K views14:31

0:33

AI Voice Mixer Studio - Kokoro TTS

Миксер ИИ-голосов на базе Kokoro
Можно из имеющихся 11 англоязычных голосов намешать свой кастомный голос

#tts #text2speech

👍2🤯1

1.66K viewsedited 16:44

kotaemon

Интерфейс для чата с вашими документами.

Но вообще-то рекомендую его для быстрого ознакомления с сутью препринтов с arxiv.org или HuggingFace- выбираете статью и просите суммаризацию или задаете вопрос по ней.
Для этого создан демоспейс

Демо Kotaemon Papers

И бонус, еще один демоспейс для тех же целей:

Демо Paper Central

#chatbot #assistant #paper2chat #summary

👍4

1.9K viewsedited 19:03

2:01

Upscayl v2.5.5

Обновился опенсорсный инструмент для апскейла изображений - интерфейс для RealESRGAN и других зарекомендовавших себя моделей

Код

#upscale #gui

🔥8🤔1

1.95K views06:29

0:16

Humva: Your Easiest Go-To Avatar Tool

Простейший, как заявлено в названии, инструмент для создания аватара. Хорошо говорит по-русски

В топе на Producthunt

Проверил, он довольно капризный. Аватар создается за 5-10 минут. Если создастся вообще. Закидываем фото, выбираем тему и окружение, голос и ждем.
Или можно выбрать один из готовых аватаров.

При попытке создать аватар из фото знаменитостей может выдать ошибку, и второго шанса создать свой аватар не даст. Но Юра Борисов, видимо не настолько знаменит

И не факт что ваш аватар сможет быть полезен. Мой кастомный аватар долго не мог ничего сказать на русском все время ошибка. Хотя голос стандартный, с библиотечными аватарами работает. Видимо, текст слишком длинный

Бесплатно можно создать 4 говорящих видео по 30 секунд. На вход можно подать текст, а можно готовое аудио с речью

#voicecloning #humanavatar #talkinghead #portraitanimation #facialanimation #text2speech #tts #image2avatar

👍4👎1😱1

1.89K views07:12