Python/ django

This media is not supported in your browser

🖥

Vanna

Это Python-фреймворк с открытым исходным кодом, в котором используется LLM для создания SQL-запросов на основе естественного языка.

✔️ Всё просто: сначала обучаете модель на своих данных, а потом можно задать вопросы на обычном языке.

В ответ модель выдает готовые SQL-запросы, которые можно сразу запускать в своей базе данных.

⚡️ Установка:
pip install vanna

▪GitHub: https://github.com/vanna-ai/vanna

@ai_machinelearning_big_data

#python #sql #opensource #vanna #llm

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍16❤5😁5🔥4

11.3K views17:21

Python/ django

🌟 Model2Vec: создание компактных и быстрых моделей на основе Sentence Transformer.

Model2Vec - библиотека для создания компактных и быстрых моделей на основе предобученных Sentence Transformer моделей.

Model2Vec позволяет создавать эмбединг-модели слов и предложений, которые значительно меньше по размеру, но при этом сопоставимы по производительности с исходными Sentence Transformer моделями.

Отличительные особенности:

🟢

быстрая дистилляция, процесс создания модели занимает несколько минут;

🟢

быстрый инференс, в 500 раз быстрее на CPU относительно родительской модели;

🟢

BYOM и BYOV, можно использовать на любой Sentence Transformer модели с любым словарем;

🟢

мультиязычность, все что нужно - только мультиязычная модель в качестве источника;

🟢

интеграция с Huggingface, загрузка\выгрузка моделей привычными from_pretrained и push_to_hub.

Пайплайн Model2Vec трехэтапный. На первом этапе словарь пропускается через модель Sentence Transformer для получения векторов эмбедингов для каждого слова.

Далее, размерность полученных эмбеддингов сокращается с помощью метода главных компонент (PCA). Наконец, применяется zipf-взвешивание для учета частотности слов в словаре.

Model2Vec работает в двух режимах:

🟠

Output, в котором модель работает подобно Sentence Transformer, используя subword токенизацию;

🟠

Vocab, в котором создается набор статических эмбедингов слов, аналогично GloVe или Word2Vec.

Оценку производительности Model2Vec делали на наборе данных MTEB на задачах PEARL (оценка качества представления фраз) и WordSim (оценка семантической близости слов).

Результаты показывают, что Model2Vec превосходит по производительности GloVe и модели, основанные на WordLlama по всем задачам оценки.

▶️Пример дистилляции:


from model2vec.distill import distill

# Choose a Sentence Transformer model
model_name = "BAAI/bge-base-en-v1.5"

# Distill the model
m2v_model = distill(model_name=model_name, pca_dims=256)

# Save the model
m2v_model.save_pretrained("m2v_model")

▶️Пример инференса:


from model2vec import StaticModel

# Load a model from the HuggingFace hub, or a local one.
model_name = "minishlab/M2V_base_output"
# You can optionally pass a token if you're loading a private model
model = StaticModel.from_pretrained(model_name, token=None)

# Make embeddings
embeddings = model.encode(["It's dangerous to go alone!", "It's a secret to everybody."])

📌Лицензирование : MIT License.

▪Набор моделей
▪GitHub

@pythonl

#AI #ML #LLM #Embedding #Model2Vec #python

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍7🔥4

9.96K views11:02

Python/ django

Forwarded from Machinelearning

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

🌐

Nanobrowser – Мультиагентная AI-ситсема для веб-автоматизации.

Это open-source инструмент, который использует LLM для автоматизации работы у вас в браузере.

По сути это альтернатива OpenAI Operator, работающая локально.

Оператору можно задавать промпты на естественном языке (или через код), а умные агенты (Планировщик, Навигатор, Валидатор) выполняют их в веб-окружении.

Чем полезен ?

🟢

Автоматизация тестирования UI: Быстро просит пользовательские сценарии, заполнение форм, клики по элементам без написания сложного Selenium/Puppeteer кода.

🟢

Прототипирование веб-скрапинга/сбора данных: Легко настраивайте сбор нужной информации с веб-страниц.

🟢

Ускорение рутинных задач: Автоматизируйте взаимодействие с внутренними админками, дашбордами или любыми веб-интерфейсами.

Главное, что ваши данные не уходят на сторонние серверы (если вы используете локальную LLM).

Поддерживает различные большие языковые модели, не привязывая вас к одному провайдеру.

🔗GitHub: https://github.com/nanobrowser/nanobrowser

@ai_machinelearning_big_data

#Nanobrowser #AI #WebAutomation #OpenSource #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11❤5🔥2

6.32K views17:01

Python/ django

Forwarded from Machinelearning

1:04

This media is not supported in your browser

VIEW IN TELEGRAM

🤖

MiniMax Agent — новый универсальный ИИ-агент для сложных задач

Команда MiniMax представила MiniMax Agent — интеллектуального агента, способного решать многошаговые, долгосрочные и комплексные задачи.

Что умеет MiniMax Agent:
- Поддерживает комплексное и многошаговое планирование на уровне
- Разбиение задач на подзадачи и их исполнение
- МОщные инструменты генерации кода
- Мультимодальность
- Интеграция с MCP

🔗 https://agent.minimax.io

@ai_machinelearning_big_data

#AI #IntelligentAgent #MiniMax #MultiStepPlanning #Automation #ToolUse #MCP #LLM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8🔥4👍2🤩1

5.68K views07:30

Python/ django

📈 TradingAgents — мультиагентная LLM-платформа для алгоритмической торговли

🎉 TradingAgents официально открыт! После большого интереса со стороны сообщества разработчики решили выложить весь фреймворк в open-source.

🔧 Что такое TradingAgents:
• Это мультиагентная система, имитирующая работу реальной трейдинговой фирмы
• Каждый агент выполняет свою роль — от анализа данных до принятия решений
• Все агенты основаны на LLM-моделях и взаимодействуют между собой

👥 Роли агентов:
• Fundamentals Analyst — анализ финансовых показателей компаний
• Sentiment Analyst — оценка настроений по соцсетям и новостям
• News Analyst — отслеживание глобальных событий и их влияния на рынок
• Technical Analyst — прогноз на основе графиков, индикаторов (MACD, RSI и др.)

⚠️ Важно: проект предназначен для исследовательских целей и не является финансовой рекомендацией. Результаты могут зависеть от модели, данных и параметров генерации.

📦 Возможности:
• CLI и GUI-интерфейс
• Быстрый запуск и кастомизация
• Структура, готовая к масштабированию

🔗 Репозиторий: https://github.com/AI4Finance-Foundation/TradingAgents
#AItrading #LLM #MultiAgent #TradingAgents #fintech #opensource

❤10🔥7👍3😢2🤩2😁1

7.73K views11:01

Python/ django

Forwarded from Machinelearning

0:56

This media is not supported in your browser

VIEW IN TELEGRAM

📓🦙 NotebookLlama — open-source альтернатива NotebookLM!

Практически полный функционал NotebookLM — в опенсорсе.

✔️ Собирает базу знаний из документов — с точным разбором через LlamaCloud
✔️ Автоматически пишет резюме и строит mind map-графы
✔️ Позволяет генерировать подкасты (работает на базе ElevenLabs)
✔️ Позволяет вести чат с агентом по документам
✔️ Метрики и аналитика через opentelemetry

🛠 Всё в открытом репо — можешь форкать, кастомизировать, заменять компоненты под себя.

Установка:


git clone https://github.com/run-llama/notebookllama

▪GitHub: https://github.com/run-llama/notebookllama
▪Попробовать в LlamaCloud: https://cloud.llamaindex.ai

@ai_machinelearning_big_data

#AI #ML #LLM #opensource #NotebookLM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍4🔥3🤩2

3.86K views08:10

About

Blog

Apps

Platform