Нейронавт | Нейросети в творчестве
9.44K subscribers
3.66K photos
3.16K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Media is too big
VIEW IN TELEGRAM
Проактивного ИИ-агента Proactor уже можно потестить

На бесплатном тарифе дают 30 минут транскрибации и 100 кредитов на прочие ИИ-ничтяки

Попробовать

#agent #realtime
👍3🍌1
Dubnote

‼️Бесплатную пожизненную подписку можно получить до 10 июля 11:00 МСК

iOS приложение для записи музыкальных идей

AI Split: автоматическое разделение аудио на секции.

- Smart & Manual Edits: возможность редактировать секции с помощью AI или вручную.

- Export Sections: экспорт отдельных секций в файлы .wav или .aac

- Auto-Tagging: автоматическое тегирование аудио.

- On-Device Speech-to-Text: преобразование речи в текст без подключения к интернету

Я до сих пор пользовался MusicMemo но тут кажется покруче

AppStore

#iOS #mobile #memo #assistant
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥2😁1
Media is too big
VIEW IN TELEGRAM
4DSloMo: 4D Reconstruction for High Speed Scene with Asynchronous Capture

Работа с участием NVIDIA.
Реконструкция #4D слоумошен сцены из видео с нескольких ракурсов, снятого обычными камерами в 25 fps. Эффективная частота кадров получается 100-200 fps
Под капотом 4D модель на гауссианах

Код ждем

#videoto4d #gaussian #4d
👍9🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity Comet

Новый ИИ-браузер от Perplexity

Умный поиск Perplexity
Агентный поИСк
Умные вкладки
Блокировщик рекламы

Сейчас доступ дают только подписчикам MAX. Обещают в будущем бесплатный функционал.

Записаться в вейтлист

#search #browser
👍6👎1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Higgsfield Soul ID

Тут были наезды на Higgsfield Soul, что у них лица слегка одинаковые и вообще похоже не на генерацию, а на вытаскивание максимально похожих из датасета.

На что разрабы ответили с помощью Higgsfield Soul ID

Это типа быстрая тренировка (внутренняя) лор под ВАШИ фотачки.

Теперь вы можете загрузить 10+ своих фотографий, и Soul создаст вашу версию, которая будет выглядеть, двигаться и вести себя как вы:

- остается неизменной независимо от угла, выражения лица или освещения
- почти никаких подсказок не требуется

Дальше резвитесь промптами.

https://higgsfield.ai/

@cgevent
🔥10👍1
Нейронавт | Нейросети в творчестве
В четверг в 6 утра по Москве релиз Grok 4 Твит #news
Grok 4

Релизнули.

– Фокус на рассуждениях и академических способностях

– Контекст 256k токенов

– Есть две версии модели: обычная Grok 4 и продвинутая Grok 4 Heavy

– Grok 4 Heavy прошел тест по математике AIME25 на 100%

– В самом сложном бенчмарке «Последний экзамен человечества» обе модели побили прошлый рекорд, набрав 38,6% и 44,4% соответственно

– обещают, что Grok 4 может генерировать видеоигры по одному промпту и с высокой вероятностью редсказывать исход различных спортивных событий (не читал, думаю, высокая вероятность это где-то в районе 60%)

Ну все, наконец тотализаторы загнутся. Правда, и кожаные перестанут играть в игры и состязаться. А зачем если результат известен.

Доступен на офсайте по подписке
Grok 4 за $300 в год
Grok 4 Heavy за $3000 в год

в халявном твиттере все еще 3 версия, разумеется

#news #assistant #sota
😁6👍5🤯3
Media is too big
VIEW IN TELEGRAM
CSM

Один из самых первых сервисов генерации 3D моделей о котором я писал

Запустили новую версию, создание качественной сетки в один клик

Адаптивное количество полигонов
Разделение топологии на части при генерации, каждая часть обрабатывается отдельно.
Треугольники или квады.

Blender MCP - есть
API - есть

на бесплатном тарифе дают всего 10 кредитов

Сетка и правда красивая

#imageto3d #3d #textto3d
👍63
Vidu Reference-to-Video

Vidu интеллектуально объединяет в видео до 7 (!) загруженных референсов.

#referencing #image2video #text2video
🔥91👍1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну и наконец-то Google Flow раскатали почти на весь мир, включая Европу.

https://labs.google/fx/tools/flow

У меня открывается без всякого ВПН.

https://blog.google/technology/google-labs/flow-adds-speech-expands/

Нужна подписка Pro.

И да, это липсинк по начальной фотке.

@cgevent
👍101🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
UltraZoom: Generating Gigapixel Images from Regular Photos

Апскейлер, превращает обычные фотки в картинки с высоким разрешением.

Модель берёт несколько снимков объекта — один общий и парочку крупных планов — и делает из них одно большое изображение с кучей деталей. Она как бы «растягивает» общую картинку, чтобы она была такой же детальной, как крупные планы.

Для этого модель учится на парах изображений, понимая, как из не очень чёткого изображения сделать очень чёткое для конкретного объекта

Код ждем

Спасибо @p0lygon

#upscale
16👍7🤯1
Grok 4 выдали подписчикам Perplexity Pro и Max

#news #assistant
👍13
А вот Grok 4 на LMarena

Можно потыкать бесплатно.

Ищем модель grok-4-0709, пробуем

#news #assistant
👍7
OmniPart: Part-Aware 3D Generation with Semantic Decoupling and Structural Cohesion

Новый генератор 3D моделей по картинке от анонимов. Разбивает модель на части, генерирует по частям. Разбивку можно редактировать

Под капотом гауссианы

#тестбендера провалил. сегментировал успешно, модель выдал плоскую

Кода нет
Демо

#gaussian #3d #imageto3d
👍4😁21