This media is not supported in your browser
VIEW IN TELEGRAM
OmniAudio-2.6B
Самая быстрая и эффективная мультимодальная аудиоязыковая модель, пригодная для запуска на смартфонах и ноутбуках
Внутри Gemma-2-2b, Whisper turbo и модуль для обработки аудио и текста на потребительских устройствах
Репозиторий
Демо
#ALM #assistant #mobile
Самая быстрая и эффективная мультимодальная аудиоязыковая модель, пригодная для запуска на смартфонах и ноутбуках
Внутри Gemma-2-2b, Whisper turbo и модуль для обработки аудио и текста на потребительских устройствах
Репозиторий
Демо
#ALM #assistant #mobile
👍8🔥4❤2
Deepseek ios
Приложение доступно в российском appstore
Кажется, доступ в интернет работает плохо или у меня кривые руки
#mobile #iOS #assistant
Приложение доступно в российском appstore
Кажется, доступ в интернет работает плохо или у меня кривые руки
#mobile #iOS #assistant
👍8⚡2❤1👎1🤯1
Media is too big
VIEW IN TELEGRAM
MiniCPM-o 2.6
Опенсорсная мультимодальная модель от китайцев OpenBMB, превосходящая GPT-4V на визуальных задачах
8B параметров, работает на смартфонах и планшетах.
Под капотом SigLip-400M + Whisper-300M + ChatTTS-200M + Qwen2.5-7B
Голосовое общение в реальном времени, клонирование голоса
Гитхаб
Демо
Веса
#vlm #voicemode #realtime #mobile #voicecloning
Опенсорсная мультимодальная модель от китайцев OpenBMB, превосходящая GPT-4V на визуальных задачах
8B параметров, работает на смартфонах и планшетах.
Под капотом SigLip-400M + Whisper-300M + ChatTTS-200M + Qwen2.5-7B
Голосовое общение в реальном времени, клонирование голоса
Гитхаб
Демо
Веса
#vlm #voicemode #realtime #mobile #voicecloning
❤8👍2🔥1
Gigapixel AI Recover & Enhance
Мобильное приложение от Topaz Labs для апскейла и реставрации фото доступно в AppStore
При первом запуске приложение скачивает 1.4 Гб моделей локально. Но это какой-то ограниченный функционал, только обработка лиц. Для полного функционала потребуется обработка в облаке
Халявная ли локальная обработка - непонятно 🤷
Обработка в облаке за кредиты. На старте дают 100 кредитов, на обработку одного фото у меня ушло 3 кредита
#upscale #mobile #iOS #deblur #imagerestoration #enhance #facerestoration
Мобильное приложение от Topaz Labs для апскейла и реставрации фото доступно в AppStore
При первом запуске приложение скачивает 1.4 Гб моделей локально. Но это какой-то ограниченный функционал, только обработка лиц. Для полного функционала потребуется обработка в облаке
Халявная ли локальная обработка - непонятно 🤷
Обработка в облаке за кредиты. На старте дают 100 кредитов, на обработку одного фото у меня ушло 3 кредита
#upscale #mobile #iOS #deblur #imagerestoration #enhance #facerestoration
👍4👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Audio Open + Arm Kleidi
Stability AI объявили о партнерстве с ARM в области генерации аудио на мобильных устройствах.
Вы конечно уже забыли что у них есть генератор звука Stable Audio Open. В самом деле, им кто-нибудь пользовался?
Так вот, женят этот генератор с библиотекой Kleidi для быстрого инференса на процессорах ARM
Ни демо, ни саму библиотеку я не нашел где посмотреть, тем более мобильное приложение...
Продолжаем вялое наблюдение
#news #mobile
Stability AI объявили о партнерстве с ARM в области генерации аудио на мобильных устройствах.
Вы конечно уже забыли что у них есть генератор звука Stable Audio Open. В самом деле, им кто-нибудь пользовался?
Так вот, женят этот генератор с библиотекой Kleidi для быстрого инференса на процессорах ARM
Ни демо, ни саму библиотеку я не нашел где посмотреть, тем более мобильное приложение...
Продолжаем вялое наблюдение
#news #mobile
👍6🤷♂2🔥1
Мобильное приложение видеогенератора Vidu
Вы вообще генерируете видео на мобилах?
iOS
Android
#ios #android #mobile #text2image #image2image
Вы вообще генерируете видео на мобилах?
iOS
Android
#ios #android #mobile #text2image #image2image
👍1
PixVerse v4 / App 2.0
Видеогенератор PixVerse выпустил модель v4 и новую версию мобильного приложения с функциями Transition, AI Dance Templates, AI Style Live (Переход, Шаблоны танцев, ИИ-стиль)
На сайте сейчас ежедневно раздают по 60 кредитов за вход
iOS
Android
А также запустили конкурс короткометражек на Dzine (бывший Stylar) с призами
🥇$500 (2 победителя)
🥈$250 (2 победителя)
🥉$100 (2 победителя)
Для участия нужно
1) запостить видео на TikTok, Instagram, Twitter/X, Youtube, и т д с тегом #PixVerse #Dzine или #PixVerseDzine
2) заполнить форму
#mobile #ios #android #contest #text2video #video2video #stylize #motioncontrol #videoediting
Видеогенератор PixVerse выпустил модель v4 и новую версию мобильного приложения с функциями Transition, AI Dance Templates, AI Style Live (Переход, Шаблоны танцев, ИИ-стиль)
На сайте сейчас ежедневно раздают по 60 кредитов за вход
iOS
Android
А также запустили конкурс короткометражек на Dzine (бывший Stylar) с призами
🥇$500 (2 победителя)
🥈$250 (2 победителя)
🥉$100 (2 победителя)
Для участия нужно
1) запостить видео на TikTok, Instagram, Twitter/X, Youtube, и т д с тегом #PixVerse #Dzine или #PixVerseDzine
2) заполнить форму
#mobile #ios #android #contest #text2video #video2video #stylize #motioncontrol #videoediting
👍2🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
LAM: Large Avatar Model for One-shot Animatable Gaussian Head
Анимируемые аватары по одному изображению на гауссианах от Alibaba.
Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах
Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить
#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
Анимируемые аватары по одному изображению на гауссианах от Alibaba.
Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах
Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить
#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
👍5🤔2❤1👎1
Stable Audio Open Small
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
🤔2👍1👏1
👍8🔥2❤1
Sora бесплатно
Но только в мобильном приложении Bing
Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.
Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд
IOS / Android
#mobile #iOS #android #text2video
Но только в мобильном приложении Bing
Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.
Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд
IOS / Android
#mobile #iOS #android #text2video
👍4
Google AI Edge Gallery
Экспериментальное приложение Гугла для локального запуска ИИ-моделей на смартфоне
Основные возможности:
- Генерация изображений
- ИИ-чат без интернета
- Написание и редактирование кода
- Анализ изображений ("Ask Image")
- Prompt Lab с готовыми шаблонами для различных задач
- Поддержка моделей Google Gemma 3n и других
- AI Chat: участвуйте в многопользовательских беседах.
- Анализ производительности: тесты в реальном времени (TTFT, скорость декодирования, задержка).
- Загрузите свою собственную модель: протестируйте местные .taskмодели LiteRT.
- Ресурсы для разработчиков: быстрые ссылки на карточки моделей и исходный код.
Android
iOS ждем
#mobile #android #assistant #tools
Экспериментальное приложение Гугла для локального запуска ИИ-моделей на смартфоне
Основные возможности:
- Генерация изображений
- ИИ-чат без интернета
- Написание и редактирование кода
- Анализ изображений ("Ask Image")
- Prompt Lab с готовыми шаблонами для различных задач
- Поддержка моделей Google Gemma 3n и других
- AI Chat: участвуйте в многопользовательских беседах.
- Анализ производительности: тесты в реальном времени (TTFT, скорость декодирования, задержка).
- Загрузите свою собственную модель: протестируйте местные .taskмодели LiteRT.
- Ресурсы для разработчиков: быстрые ссылки на карточки моделей и исходный код.
Android
iOS ждем
#mobile #android #assistant #tools
❤8
This media is not supported in your browser
VIEW IN TELEGRAM
fluxions AI vui
Небольшие разговорные модели речи, которые могут запускаться на устройстве
Это опенсорсный конкурент notebooklm
Голосовая модель 100М параметров
Умеет клонировать голос
модели могут издавать различные неречевые звуки. Добавляйте в текст охи-ахи, это должно улучшить результат
Vui.BASE - базовая модель, обученная на 40 тысячах часов аудио-разговоров.
Vui.ABRAHAM - модель одного говорящего, может отвечать с учетом контекста.
Vui.COHOST - диалоговая модель двух собеседников
Попробовать на офсайте - на старте дают 10000 кредитов. По русски ни бельмес к сожалению. Качество речи ужасное. Ах да, это ж мелкие модели для смартфонов
Код
Веса
Демо - здесь будет HF демоспейс
#tts #text2speech #voicecloning #conversation #mobile
Небольшие разговорные модели речи, которые могут запускаться на устройстве
Это опенсорсный конкурент notebooklm
Голосовая модель 100М параметров
Умеет клонировать голос
модели могут издавать различные неречевые звуки. Добавляйте в текст охи-ахи, это должно улучшить результат
Vui.BASE - базовая модель, обученная на 40 тысячах часов аудио-разговоров.
Vui.ABRAHAM - модель одного говорящего, может отвечать с учетом контекста.
Vui.COHOST - диалоговая модель двух собеседников
Попробовать на офсайте - на старте дают 10000 кредитов. По русски ни бельмес к сожалению. Качество речи ужасное. Ах да, это ж мелкие модели для смартфонов
Код
Веса
Демо - здесь будет HF демоспейс
#tts #text2speech #voicecloning #conversation #mobile
🔥8❤2
заработал демоспейс мобильного генератора речи и подкастов vui
По-русски ни бельмес
Демо
#tts #text2speech #voicecloning #conversation #mobile #podcast
По-русски ни бельмес
Демо
#tts #text2speech #voicecloning #conversation #mobile #podcast
Telegram
Нейронавт | Нейросети в творчестве
fluxions AI vui
Небольшие разговорные модели речи, которые могут запускаться на устройстве
Это опенсорсный конкурент notebooklm
Голосовая модель 100М параметров
Умеет клонировать голос
модели могут издавать различные неречевые звуки. Добавляйте в текст…
Небольшие разговорные модели речи, которые могут запускаться на устройстве
Это опенсорсный конкурент notebooklm
Голосовая модель 100М параметров
Умеет клонировать голос
модели могут издавать различные неречевые звуки. Добавляйте в текст…
🔥5🎃1
Dubnote
‼️ Бесплатную пожизненную подписку можно получить до 10 июля 11:00 МСК
iOS приложение для записи музыкальных идей
AI Split: автоматическое разделение аудио на секции.
- Smart & Manual Edits: возможность редактировать секции с помощью AI или вручную.
- Export Sections: экспорт отдельных секций в файлы .wav или .aac
- Auto-Tagging: автоматическое тегирование аудио.
- On-Device Speech-to-Text: преобразование речи в текст без подключения к интернету
Я до сих пор пользовался MusicMemo но тут кажется покруче
AppStore
#iOS #mobile #memo #assistant
iOS приложение для записи музыкальных идей
AI Split: автоматическое разделение аудио на секции.
- Smart & Manual Edits: возможность редактировать секции с помощью AI или вручную.
- Export Sections: экспорт отдельных секций в файлы .wav или .aac
- Auto-Tagging: автоматическое тегирование аудио.
- On-Device Speech-to-Text: преобразование речи в текст без подключения к интернету
Я до сих пор пользовался MusicMemo но тут кажется покруче
AppStore
#iOS #mobile #memo #assistant
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤3🔥2😁1
Kimi K2
Новая версия китайской мультимодалки.
Пишут что убийца cHatGPT и DeepSeek, но как всегда преувеличивают
Архитертура #MoE, Триллион параметров, из них 32B активных. Заточена на агентные и программерские задачи. Есть две версии:
Kimi-K2-Base: Базовая модель, с которой можно начинать работу исследователям и разработчикам, которым нужен полный контроль для точной настройки и создания пользовательских решений.
Kimi-K2-Instruct: модель после обучения, которая лучше всего подходит для работы с клиентами, общения в чате общего назначения и взаимодействия с агентами. Это модель рефлекторного уровня, о которой не нужно долго думать.
- Обрабатывает 100 тысяч строк данных за раз - Строит визуализации
- Создаёт игры в вебе, на создание клона Minecraft у Kimi K2 ушла одна попытка
- Планирует путешествия через 17 инструментов
- Токены в 5 раз дешевле чем у конкурентов
Уже на Perplexity
Хотя какая разница если можно пользоваться прямо на офсайте и в мобильном приложении
Мультимодальные функции пока не работают
Гитхаб
Веса - вам точно это надо?
Попробовать на офсайте - в левом нижнем углу переключаем на английский
На мобиле не факт что K2 уже есть, не проверял
AppStore
Android
#assistant #mllm #mlm #reasoning #mobile #ios
Новая версия китайской мультимодалки.
Пишут что убийца cHatGPT и DeepSeek, но как всегда преувеличивают
Архитертура #MoE, Триллион параметров, из них 32B активных. Заточена на агентные и программерские задачи. Есть две версии:
Kimi-K2-Base: Базовая модель, с которой можно начинать работу исследователям и разработчикам, которым нужен полный контроль для точной настройки и создания пользовательских решений.
Kimi-K2-Instruct: модель после обучения, которая лучше всего подходит для работы с клиентами, общения в чате общего назначения и взаимодействия с агентами. Это модель рефлекторного уровня, о которой не нужно долго думать.
- Обрабатывает 100 тысяч строк данных за раз - Строит визуализации
- Создаёт игры в вебе, на создание клона Minecraft у Kimi K2 ушла одна попытка
- Планирует путешествия через 17 инструментов
- Токены в 5 раз дешевле чем у конкурентов
Уже на Perplexity
Хотя какая разница если можно пользоваться прямо на офсайте и в мобильном приложении
Мультимодальные функции пока не работают
Гитхаб
Веса - вам точно это надо?
Попробовать на офсайте - в левом нижнем углу переключаем на английский
На мобиле не факт что K2 уже есть, не проверял
AppStore
Android
#assistant #mllm #mlm #reasoning #mobile #ios
❤6👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Pika audio-driven performance model
Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.
Похоже что доступно (или будет доступно) только в мобильном приложении
AppStore
#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
Оживлятор картинок по звуку от Pika.
В 20 раз быстрее и дешеле предыдущей модели.
Создает видео за 6 секунд.
Похоже что доступно (или будет доступно) только в мобильном приложении
AppStore
#lipsync #portraitanimation #characteranimation #speech2video #mobile #ios
👍2