Нейронавт | Нейросети в творчестве
9.32K subscribers
3.58K photos
3.09K videos
40 files
4.05K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
OmniAudio-2.6B

Самая быстрая и эффективная мультимодальная аудиоязыковая модель, пригодная для запуска на смартфонах и ноутбуках

Внутри Gemma-2-2b, Whisper turbo и модуль для обработки аудио и текста на потребительских устройствах

Репозиторий
Демо

#ALM #assistant #mobile
👍8🔥42
Grok iOS

Мобильное приложение вышло в AppStore в США

Веб-версию ждем

#assistant #mobile #ios
👍4🔥2
Deepseek ios

Приложение доступно в российском appstore

Кажется, доступ в интернет работает плохо или у меня кривые руки

#mobile #iOS #assistant
👍821👎1🤯1
Media is too big
VIEW IN TELEGRAM
MiniCPM-o 2.6

Опенсорсная мультимодальная модель от китайцев OpenBMB, превосходящая GPT-4V на визуальных задачах

8B параметров, работает на смартфонах и планшетах.

Под капотом SigLip-400M + Whisper-300M + ChatTTS-200M + Qwen2.5-7B

Голосовое общение в реальном времени, клонирование голоса

Гитхаб
Демо
Веса

#vlm #voicemode #realtime #mobile #voicecloning
8👍2🔥1
Gigapixel AI Recover & Enhance

Мобильное приложение от Topaz Labs для апскейла и реставрации фото доступно в AppStore

При первом запуске приложение скачивает 1.4 Гб моделей локально. Но это какой-то ограниченный функционал, только обработка лиц. Для полного функционала потребуется обработка в облаке

Халявная ли локальная обработка - непонятно 🤷

Обработка в облаке за кредиты. На старте дают 100 кредитов, на обработку одного фото у меня ушло 3 кредита

#upscale #mobile #iOS #deblur #imagerestoration #enhance #facerestoration
👍4👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Audio Open + Arm Kleidi

Stability AI объявили о партнерстве с ARM в области генерации аудио на мобильных устройствах.

Вы конечно уже забыли что у них есть генератор звука Stable Audio Open. В самом деле, им кто-нибудь пользовался?

Так вот, женят этот генератор с библиотекой Kleidi для быстрого инференса на процессорах ARM

Ни демо, ни саму библиотеку я не нашел где посмотреть, тем более мобильное приложение...

Продолжаем вялое наблюдение

#news #mobile
👍6🤷‍♂2🔥1
Мобильное приложение видеогенератора Vidu

Вы вообще генерируете видео на мобилах?

iOS
Android

#ios #android #mobile #text2image #image2image
👍1
PixVerse v4 / App 2.0

Видеогенератор PixVerse выпустил модель v4 и новую версию мобильного приложения с функциями Transition, AI Dance Templates, AI Style Live (Переход, Шаблоны танцев, ИИ-стиль)

На сайте сейчас ежедневно раздают по 60 кредитов за вход

iOS
Android

А также запустили конкурс короткометражек на Dzine (бывший Stylar) с призами
🥇$500 (2 победителя)
🥈$250 (2 победителя)
🥉$100 (2 победителя)

Для участия нужно

1) запостить видео на TikTok, Instagram, Twitter/X, Youtube, и т д с тегом #PixVerse #Dzine или #PixVerseDzine

2) заполнить форму

#mobile #ios #android #contest #text2video #video2video #stylize #motioncontrol #videoediting
👍2🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
LAM: Large Avatar Model for One-shot Animatable Gaussian Head

Анимируемые аватары по одному изображению на гауссианах от Alibaba.

Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах

Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить

#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
👍5🤔21👎1
Stable Audio Open Small

Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM

До 11 секунд 44.1kHz стерео по тексту локально на мобилках

Веса
Гитхаб

#news #mobile #text2audio
🤔2👍1👏1
PocketPal AI

Приватный ИИ-ассистент на мобилке на небольших языковых моделях - #SLM

Код
iOS
Android

#mobile #assistant
👍8🔥21
Вы пробовали пользоваться NotebookLM на телефоне? Я пробовал. Все криво-косо

Но они выпустили мобильные приложения, теперь жить стало легче в правильных странах

iOS
Android

#text2podcast #podcast #mobile
👍3
Sora бесплатно

Но только в мобильном приложении Bing

Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.

Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд

IOS / Android

#mobile #iOS #android #text2video
👍4
Google AI Edge Gallery

Экспериментальное приложение Гугла для локального запуска ИИ-моделей на смартфоне

Основные возможности:

- Генерация изображений
- ИИ-чат без интернета
- Написание и редактирование кода
- Анализ изображений ("Ask Image")
- Prompt Lab с готовыми шаблонами для различных задач
- Поддержка моделей Google Gemma 3n и других
- AI Chat: участвуйте в многопользовательских беседах.
- Анализ производительности: тесты в реальном времени (TTFT, скорость декодирования, задержка).
- Загрузите свою собственную модель: протестируйте местные .taskмодели LiteRT.
- Ресурсы для разработчиков: быстрые ссылки на карточки моделей и исходный код.

Android
iOS ждем

#mobile #android #assistant #tools
8
This media is not supported in your browser
VIEW IN TELEGRAM
fluxions AI vui

Небольшие разговорные модели речи, которые могут запускаться на устройстве

Это опенсорсный конкурент notebooklm

Голосовая модель 100М параметров

Умеет клонировать голос

модели могут издавать различные неречевые звуки. Добавляйте в текст охи-ахи, это должно улучшить результат

Vui.BASE - базовая модель, обученная на 40 тысячах часов аудио-разговоров.

Vui.ABRAHAM - модель одного говорящего, может отвечать с учетом контекста.

Vui.COHOST - диалоговая модель двух собеседников

Попробовать на офсайте - на старте дают 10000 кредитов. По русски ни бельмес к сожалению. Качество речи ужасное. Ах да, это ж мелкие модели для смартфонов

Код
Веса
Демо - здесь будет HF демоспейс

#tts #text2speech #voicecloning #conversation #mobile
🔥82
Dubnote

‼️Бесплатную пожизненную подписку можно получить до 10 июля 11:00 МСК

iOS приложение для записи музыкальных идей

AI Split: автоматическое разделение аудио на секции.

- Smart & Manual Edits: возможность редактировать секции с помощью AI или вручную.

- Export Sections: экспорт отдельных секций в файлы .wav или .aac

- Auto-Tagging: автоматическое тегирование аудио.

- On-Device Speech-to-Text: преобразование речи в текст без подключения к интернету

Я до сих пор пользовался MusicMemo но тут кажется покруче

AppStore

#iOS #mobile #memo #assistant
Please open Telegram to view this post
VIEW IN TELEGRAM
👍53🔥2😁1
Kimi K2

Новая версия китайской мультимодалки.

Пишут что убийца cHatGPT и DeepSeek, но как всегда преувеличивают

Архитертура #MoE, Триллион параметров, из них 32B активных. Заточена на агентные и программерские задачи. Есть две версии:

Kimi-K2-Base: Базовая модель, с которой можно начинать работу исследователям и разработчикам, которым нужен полный контроль для точной настройки и создания пользовательских решений.

Kimi-K2-Instruct: модель после обучения, которая лучше всего подходит для работы с клиентами, общения в чате общего назначения и взаимодействия с агентами. Это модель рефлекторного уровня, о которой не нужно долго думать.

- Обрабатывает 100 тысяч строк данных за раз - Строит визуализации
- Создаёт игры в вебе, на создание клона Minecraft у Kimi K2 ушла одна попытка
- Планирует путешествия через 17 инструментов
- Токены в 5 раз дешевле чем у конкурентов

Уже на Perplexity
Хотя какая разница если можно пользоваться прямо на офсайте и в мобильном приложении

Мультимодальные функции пока не работают

Гитхаб
Веса - вам точно это надо?
Попробовать на офсайте - в левом нижнем углу переключаем на английский

На мобиле не факт что K2 уже есть, не проверял
AppStore
Android

#assistant #mllm #mlm #reasoning #mobile #ios
6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Pika audio-driven performance model

Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.

Похоже что доступно (или будет доступно) только в мобильном приложении

AppStore

#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
👍2