Нейронавт | Нейросети в творчестве

Multi-Model Consensus Chat

В Anychat добавили экспериментальную функцию. Здесь разные #LLM коллегиально решат вашу задачу

#assistant

👍7🔥1

1.63K views07:56

Pleias

Семейство небольших языковых моделей, обученных только на открытых данных.

350M, 1.2B и 3B параметров

- мультиязычные, несколько европейских языков (каких?)
- безопасные, самые низкие результаты в тесте токсичности
- эффективны при выполнении ключевых задач, таких как поиск знаний.
- способны эффективно работать на локальном железе потребительского уровня (CPU, без квантизации)

веса

#news #llm

👍4❤1

1.6K views07:45

Нейронавт | Нейросети в творчестве

MiniMax-01

Hailuo AI выпустили языковую модель MiniMax-01 с контекстом 4 миллиона токенов. Это ооочень много

MiniMax-VL-01 - визуально-языковая
MiniMax-Text-01 - гибридная архитектура Lightning Attention / Softmax Attention / Mixture-of-Experts (MoE) на 456B параметров

PS. Мертвых с косами тоже приписал Цою и Есенину, как и Deepseek. Это заговор

Попробовать можно на офсайте - там же генерируем видео и речь, есть изолятор голоса на аудио
Или тут (API) - там у них и генератор речи есть speech-01 и генератор музыки music-01

Гитхаб

Демо MiniMax-VL-01
Демо MiniMax-Text-01

#vlm #llm #assistant #text2speech #tts #voiceisolation

👍4❤2

2.17K views20:41

Нейронавт | Нейросети в творчестве

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

FilmAgent: A Multi-Agent Framework for End-to-End Film Automation in Virtual 3D Spaces

Мультиагентная платформа для автоматизации и оптимизации производства фильмов.

FilmAgent имитирует ключевые роли съемочной группы — режиссеров, сценаристов, актеров и кинематографистов. Процесс делится на три этапа: планирование, написание сценария и "съемки"

Все это работает на #LLM и #Unity

Код

#agent #assistant #text2movie #filmmaking

🔥8

1.96K viewsedited 10:13

Нейронавт | Нейросети в творчестве

LLM Arena: Бенчмарк LLM моделей на русском языке

Арена русскоязычных моделей.
А вот на днях еще и запустили приложение в тг

#arena #leaderboard #llm

👍5🥴4👎2

1.91K views15:52

Нейронавт | Нейросети в творчестве

Liquid: Language Models are Scalable and Unified Multi-modal Generators

Единая языковая модель в качестве мультимодального генератора без костылей типа CLIP. В данном случае картинки/текст, 7B параметров

Код
Демо
Веса

#llm #mlm #text2image#image2text #text2text

🔥4👍1

2.03K views07:33

Нейронавт | Нейросети в творчестве

Hunyuan-TurboS

Hunyuan ~~выкатил~~ показал свою #LLM, вдохновленную, на минуточку, человеческими когнитивными процессами

По-русски шпрехает, вот доказательства

Демо

#assistant

😁10🤷‍♂3👍1

1.84K views11:14

Нейронавт | Нейросети в творчестве

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Немножко ресерча, который скоро вдохнет новые силы в LLM

TLDR: LoRa для языковых моделей без дообучения

Проект Drag-and-Drop LLMs (DnD) — это метод, который позволяет быстро адаптировать большие языковые модели к новым задачам без дополнительного обучения. Модель использует текстовые подсказки для создания необходимых параметров и работает быстрее, чем традиционные методы настройки. Это делает её эффективной для решения различных задач, включая математику, кодирование и анализ мультимодальных данных

Код ждем

#llm #research

❤10👍4

1.6K views08:41

Нейронавт | Нейросети в творчестве

HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context

Ресерч.
Если встретите название HumanOmniV2, не путайте его с OmniHuman

Проект HumanOmniV2 от Alibaba направлен на улучшение способности больших языковых моделей (LLM) понимать и интерпретировать человеческие намерения и эмоции через мультимодальные данные.

Если кому нужен код, вот

Код

#llm #research

huggingface.co

Paper page - HumanOmniV2: From Understanding to Omni-Modal Reasoning with Context

Join the discussion on this paper page

👍6

1.52K views11:14

Нейронавт | Нейросети в творчестве

NeMo Canary-Qwen-2.5B

#SOTA в транскрибации аудио речи в текст от NVIDIA.
Умеет и отвечать на вопросы по обработанному аудио.
Знает только английский язык.

Влез на вершину Open ASR Leaderboard

Гитхаб
HF
Демо

#ASR #speech2text #stt #llm #leaderboard

👍10

1.82K viewsedited 17:36

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Метод позволяет быстро адаптировать большие языковые модели к различным задачам без необходимости их полного переобучения.

Параметры настройки генерируются за секунды на основе текстового промпта и упаковываются в LoRa

Код
Демо

#llm #lora #finetuning

👍10❤1

1.71K views08:11

Нейронавт | Нейросети в творчестве

Дообучение gpt-oss от Unsloth

Гитхаб
Колаб
Инструкция

#finetuning #llm #assistant

👍5🤔3

1.55K views07:41

Нейронавт | Нейросети в творчестве

6:28

Media is too big

VIEW IN TELEGRAM

Blocky: AI-Powered Agent Builder (Beta)

Голосовой сервис Ultravox представил Blocky - ИИ-конструктор голосовых агентов по промпту. Доступно в бета-тесте.

Ultravox n8n
Примеры на гитхабе

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online

👍2

1.39K views07:11

About

Blog

Apps

Platform