Нейронавт | Нейросети в творчестве
9.43K subscribers
3.65K photos
3.15K videos
40 files
4.11K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus
加入频道
Jan-v1

Модель для агентского мышления и решения задач, в частности для веб-поиска.
Опенсорсная альтернатива Perplexity


Построена на базе их же модели для мобильного веб-поиска Lucy и Qwen3-4B-thinking

Интегрируется с Jan App или llama.cpp

#macos / #windows / #linux

Веса
Веса GGUF
Гитхаб

#search #GGUF #agent #assistant
👍83🔥3
Пока Perplexity пытается выкупить Chrome у Google за 34,5 млрд долларов, у нас новый игрок на рынке ИИ-браузеров

Основная фишка Strawberry - автоматизация. Он запоминает ваши действия и может повторять их. Ну и сам не промах - может исследовать компании, находить лиды в LinkedIn, работать с CRM, суммировать заметки, составлять последующие сообщения и автоматизировать задачи на любых сайтах.

Данные хранит локально, но при взаимодействии с AI-провайдерами (Google, OpenAI, Anthropic) информация обрабатывается через них.

Есть пробный период, а после его окончания доступ к функциям обойдётся в 30 долларов США в месяц.

Записаться в вейтлист

#browser #assistant
👍5🔥1
GPT-OSS-120B on AMD MI300X

Не знаю зачем вам это, но вдруг кому-то нужно
Демоспейс GPT-OSS-120B от AMD

#assistant #chat
👍7😁7
Miromind

Полностью опенсорсный фреймворк для deepresearch, по приборам побивающий Opean AI

MiroThinker - набор моделей deepresearch

MiroTrain / MiroRL - микроструктура для обучения MiroThinker

MiroFlow - #sota агент умеющий пользоваться инструментами.

Я дал ему задание найти средний рост мужчин за последние 1000 лет. Выдал подробный результат за 1 минуту, см картинку

Попробовать

#deepresearch #assistant
👍9
Пришло письмо счастья от ИИ-генератора песен Producer AI

Проверьте почту

Есть голосовой режим, назовем его вайб-композинг. Пытался ему напеть мелодию, но он, похоже, переводит все в текст. Сказал что слышит ритм. Но в генерации ничего похожего. Но это я играл в лентяя. На самом деле можно и загрузить кусок музыки, и записать в микрофон звук, только не в голосовом режиме

Да, выдали один инвайт, поделюсь в коментах

Накидывайте свои генерации и инвайты в коменты

Producer.ai

#music #musicediting #text2music #agent #assistant
👍4👎1
DeepSeek-V3.1-Base

Обновку выложили на HF без официального релиза.

Контекстное окно увеличили до 128К.
Знания до июля 2024.

#news #assistant
👍3🔥1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Локальный Qwen 2.5 Omni распознает аккорды по звуку с микрофона

Сделано в Gabber - Real-time AI Engine

Реддит

#assistant #music2text #realtime
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
DeepSeek-V3.1 уже в официальном чате.

21 августа опубликовали релиз.

- гибридный вывод: два режима — Think (с мышлением) и Non-Think;

- ускоренное получение ответов в режиме Think по сравнению с DeepSeek-R1-0528;

- улучшенные навыки агента: после обучения модель лучше использует инструменты и справляется с многошаговыми задачами;

- API-обновления: поддерживаются формат Anthropic API и строгий вызов функций в бета-API;

- контекст до 128K для режимов deepseek-chat (Non-Think) и deepseek-reasoner (Think); 1

- обновления в области инструментов и агентов: улучшены результаты в тестах SWE и Terminal-Bench, повышена эффективность многошагового рассуждения и мышления;

Попробовать в чате

#news #assistant
👍7😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Intent: Next-Gen AI Messenger

ИИ-мессенджер с встроенными фичами для которых вы обычно переключаетесь в эти ваши разные ИИшки

Записаться в вейтлист

#assistant #messenger #news
👍6👎2👀1
Hermes 4

LLM на базе Llama-3.1-405B с гибридным режимом рассуждений от Nous Research

— избегает назидательности и подхалимства

— хорош в математике, программировании, STEM, логике, творческом письме и субъективных ответах

— обучен создавать валидный JSON по заданным схемам и исправлять некорректные объекты

— легче поддаётся управлению и выравниванию, имеет сниженные показатели отказа

— поддерживает вызовы функций и использование инструментов в рамках одного хода ассистента

— способен адаптироваться к дополнительным системным инструкциям, изменяя стиль, формат и подход к решению задач

— работает с разными форматами чата

— сохраняет воспоминания для использования в разных моделях

70B и 405B параметров. Есть полные и FP8 веса

Попробовать в чате - чат шикарный, с настройками, но GUI тормозной
HF

#assistant #chat
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Kimi Slides

В Kimi сделали генератор презентаций.

У меня на глазах сделал презу про Rock 'n' Roll: A Sonic Revolution. PPT кину в коменты

Обещают прикрутить адаптивную верстку, автопоиск картинок и агентные слайды (Что??? 👀)

Попробовать

#assistant #text2slides #slides
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥112👍2
Тестовый бот для генерации стихов, песенной лирики и поэтического перевода от команды Сбера

@vika_chatbot

Автор собирает фидбэк, предложения

Ключевые изменения в этой версии в сравнении с @verslibre_bot касаются песенной лирики и рэпа:

1) Если попросить "сочини песню с припевами ...", то первый выданный вариант будет обязательно с припевами. Иногда всё получается прямо нормально.

2) Можно попросить "Сочини первый куплет песни про ....", тогда модель выдаст только один куплет.

3) Можно попросить "Сочини и выведи припев для песни с такими куплетами: ...тут текст песни ...", добавить в промпт куплеты песни - модель выдаст только припев. Пп2 и 3 должны подойти тем, кто хочет собирать песню по кусочкам. Например, можно сначала попросить модель сгенерировать лирическое стихотворение, а потом выбрать "распевный" вариант и использовать его с данным промптом для генерации припева.

4) Должен работать промпт "Сочини и выведи следующий куплет песни: ... тут начало песни ...". Так можно добавлять к тексту песни по 1 куплету до нужной длины.

5) Можно пробовать генерировать рэп - см. примерчик. Получается не всегда, но по сравнению с предыдущей версией модели прогресс огромный. Самый прикольный момент в том, что это всё генерирует одна модель, поэтому она должна правильно учитывать нюансы жанра: в рэпе не должно быть размера, но должны быть рифмы.

#assistant #bot #poem
🥴8👍5👎32😁2
Media is too big
VIEW IN TELEGRAM
Step-Audio 2: Breakthrough in End-to-End Large Audio Language Model

Вторая версия китайской аудиоязыковой модели (#LALM) от Степана (Step-fun)

Две модели:
Step-Audio 2 mini
Step-Audio 2 mini Base

— может обрабатывать аудио в режиме end-to-end, минуя сложные многоступенчатые пайплайны;

— понимает паралингвистическую информацию: стили речи, эмоции, интонацию;

— обращается к внешним инструментам, например, веб-поиску, чтобы уменьшить количество ошибок;

— переключает тембры в реальном времени по текстовому запросу;

— демонстрирует лучшие в отрасли результаты (верим, верим) в тестах на понимание аудио и ведение диалогов;

— поддерживает многоязычность, включая английский и китайские диалекты;

— генерирует повествования и учитывает эмоции в диалогах.

Гитхаб
Демо
HF
Чат на офсайте - без новой говорилки
AppStore - но доступно в мобильной аппке

#ALM #voicechat #assistant #iOS #mobile #chat #voicemode
🔥4👍31