Python/ django
58.9K subscribers
2.07K photos
61 videos
47 files
2.79K links
по всем вопросам @haarrp

@itchannels_telegram - 🔥 все ит-каналы

@ai_machinelearning_big_data -ML

@ArtificialIntelligencedl -AI

@datascienceiot - 📚

@pythonlbooks

РКН: clck.ru/3FmxmM
加入频道
🌟 Model2Vec: создание компактных и быстрых моделей на основе Sentence Transformer.

Model2Vec - библиотека для создания компактных и быстрых моделей на основе предобученных Sentence Transformer моделей.

Model2Vec позволяет создавать эмбединг-модели слов и предложений, которые значительно меньше по размеру, но при этом сопоставимы по производительности с исходными Sentence Transformer моделями.

Отличительные особенности:

🟢быстрая дистилляция, процесс создания модели занимает несколько минут;

🟢быстрый инференс, в 500 раз быстрее на CPU относительно родительской модели;

🟢BYOM и BYOV, можно использовать на любой Sentence Transformer модели с любым словарем;

🟢мультиязычность, все что нужно - только мультиязычная модель в качестве источника;

🟢интеграция с Huggingface, загрузка\выгрузка моделей привычными from_pretrained и push_to_hub.

Пайплайн Model2Vec трехэтапный. На первом этапе словарь пропускается через модель Sentence Transformer для получения векторов эмбедингов для каждого слова.

Далее, размерность полученных эмбеддингов сокращается с помощью метода главных компонент (PCA). Наконец, применяется zipf-взвешивание для учета частотности слов в словаре.

Model2Vec работает в двух режимах:

🟠Output, в котором модель работает подобно Sentence Transformer, используя subword токенизацию;

🟠Vocab, в котором создается набор статических эмбедингов слов, аналогично GloVe или Word2Vec.

Оценку производительности Model2Vec делали на наборе данных MTEB на задачах PEARL (оценка качества представления фраз) и WordSim (оценка семантической близости слов).

Результаты показывают, что Model2Vec превосходит по производительности GloVe и модели, основанные на WordLlama по всем задачам оценки.

▶️Пример дистилляции:


from model2vec.distill import distill

# Choose a Sentence Transformer model
model_name = "BAAI/bge-base-en-v1.5"

# Distill the model
m2v_model = distill(model_name=model_name, pca_dims=256)

# Save the model
m2v_model.save_pretrained("m2v_model")


▶️Пример инференса:


from model2vec import StaticModel

# Load a model from the HuggingFace hub, or a local one.
model_name = "minishlab/M2V_base_output"
# You can optionally pass a token if you're loading a private model
model = StaticModel.from_pretrained(model_name, token=None)

# Make embeddings
embeddings = model.encode(["It's dangerous to go alone!", "It's a secret to everybody."])



📌Лицензирование : MIT License.


Набор моделей
GitHub


@pythonl

#AI #ML #LLM #Embedding #Model2Vec #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 MicroPie — это ультра-микро веб-фреймворк на языке Python, разработанный для создания веб-приложений с минимальными усилиями!

🌟 Он поддерживает асинхронные веб-приложения благодаря реализации спецификации ASGI и обеспечивает высокую производительность и гибкость. Среди ключевых возможностей MicroPie — автоматическое сопоставление URL с функциями, управление сессиями с использованием cookies, поддержка шаблонов через Jinja2 (если установлена), а также минимальные зависимости, что упрощает разработку и развертывание приложений.

🔐 Лицензия: BSD-3-Clause

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 web2py — это фреймворк для веб-приложений с открытым исходным кодом, написанный на Python!

🌟 Он предназначен для быстрой разработки безопасных веб-приложений, управляемых базами данных, и предоставляет полный стек инструментов, включая генерацию HTML, обработку запросов, управление сессиями, а также абстрактный слой работы с базами данных (DAL), который поддерживает различные СУБД, такие как SQLite, MySQL, PostgreSQL и другие.

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
⭐️ Python 1.0.0 был выпущен 31 год назад

https://groups.google.com/g/comp.lang.misc/c/_QUzdEGFwCo/m/KIFdu0-Dv7sJ?pli=1
🖥 reaktiv Python Version PyPI Version License


Если вы работали с современными фронтенд-фреймворками, такими как React, Vue или Angular, вы знакомы с мощью реактивного управления состояниями.

Это магия, лежащая в основе динамических пользовательских интерфейсов и систем реального времени.

Но почему Python должен упускать преимущества реактивности? reaktiv привносит эти преимущества реактивного программирования в ваши Python-проекты.

pip install reaktiv

Github

@pythonl

#python #frontend #react #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️ Surprise

Создание надежной рекомендательной системы с нуля может занять много времени и большого объема кода.

Surprise упрощает процесс и позволяет создавать рекомендательные системы с минимальным кодом, предоставляя встроенные алгоритмы, готовый датасет и встроенную оценку модели.

Github
Пример

@pythonl
🐼 Pandas умирает медленной и мучительной смертью.

Это самая популярная в мире библиотека обработки данных, но она медленная, и многие библиотеки значительно превзошли ее.

Проблема альтернатив Pandas в том, что никто не хочет изучать новый API.

Давайте посмотрим правде в глаза: люди не будут переносить свои проекты, га другие фреймворки, без особой причины.

Я уже давно работаю с FireDucks 🦆

Эта библиотека в разы быстрее Pandas, и вам не придется менять код старых проектов для перехода на нее.

Вы можете изменить *одну* строку кода и весь остальной код будет работать на FireDucks :


import fireducks.pandas as pd


Вы также можете запустить свой код *не* изменяя ни одной строки, используя хук:

python 
$ python -mfireducks.imhook yourfile[.]py


FireDucks — это многопоточная библиотека с ускорением компилятора и полностью совместимым с pandas API.

Она быстрее, чем Polars. Ниже приведена ссылка на некоторые бенчмарки, сравнивающие Pandas, Polars и FireDucks.

FireDucks побеждает с отрывом.

⛓️Здесь находится репозиторий FireDucks на GitHub:
https://github.com/fireducks-dev/fireducks

⛓️Если вы хотите пощупать либу, откройте этот пример:
https://github.com/fireducks-dev/fireducks/tree/main/notebooks/nyc_demo

⛓️Если вы хотите сравнить FireDucks с Polars и Pandas, вот еще один блокнот:
https://github.com/fireducks-dev/fireducks/blob/main/notebooks/FireDucks_vs_Pandas_vs_Polars.ipynb

⛓️И наконец, бенчмарки, с которыми стоит ознакомиться:

https://fireducks-dev.github.io/docs/benchmarks/

@pythonl

#fireducks #Pandas #dataanalysis #datascience #python #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 httpdbg — это инструмент с открытым исходным кодом, предназначенный для отладки HTTP(S)-запросов в Python-программах!

🌟 Он позволяет разработчикам перехватывать и анализировать HTTP(S)-клиентские запросы, выполняемые их приложениями, без необходимости вносить изменения в исходный код. Для использования достаточно запустить программу с помощью команды pyhttpdbg вместо стандартного python, после чего можно просматривать перехваченные запросы через веб-интерфейс по адресу http://localhost:4909.

🔐 Лицензия: Apache-2.0

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 Fastcore — это библиотека Python, расширяющая возможности языка для работы с библиотекой fastai!

💡 Она включает функции для тестирования, многократной диспетчеризации, композиции объектов и функционального программирования. Fastcore добавляет возможности из других языков, таких как множественная диспетчеризация из Julia и mixins из Ruby, а также улучшает стандартные возможности Python, такие как параллельная обработка.

🔐 Лицензия: Apache-2.0

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 Ollama Python — это библиотека, предназначенная для интеграции проектов на Python версии 3.8 и выше с платформой Ollama!

🌟 Она предоставляет простой интерфейс для взаимодействия с языковыми моделями, такими как Llama 3.2, позволяя разработчикам легко интегрировать возможности обработки естественного языка в свои приложения.

🔐 Лицензия: MIT

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
🔬MedRAX: новаторский ИИ-агент, разработанный для медицинских задач!

Что такое MedRAX?

MedRAX - это первый универсальный ИИ-агент, который объединяет современные инструменты для анализа рентгеновских снимков грудной клетки и мультимодальные большие языковые модели в единую структуру, позволяющую динамически обосновывать сложные медицинские запросы без дополнительного обучения.

🎯 Чем хорош именно MedRAX?

Хотя специализированные модели ИИ отлично справляются с конкретными задачами рентгенографии грудной клетки, они часто не справляются с комплексным анализом и могут выдавать неточные рекомендации . Многим медицинским работникам нужна единая, надежная система, способная обрабатывать сложные запросы, сохраняя при этом точность. MedRAX призван стать таким инструментом

🛠️ Интегрированные инструменты:


- Визуальный контроль качества: CheXagent и LLaVA-Med
- Сегментация: MedSAM & ChestX-Det
- Формирование отчетов: CheXpert Plus
- Классификация: TorchXRayVision
- Grounding Maira-2
- Синтетические данные: RoentGen

💡 Ключевые особенности:

- Бесшовная интеграция специализированных медицинских инструментов с мультимодальными рассуждениями на основе больших языковых моделей.
- Динамическая оркестровка: Интеллектуальный выбор и координация инструментов для сложных запросов.
- Клиническая направленность: Разработан для реальных медицинских процессов.

📊 ChestAgentBench:

Разработчики также выпустили ChestAgentBench, комплексный эталон медицинского агента, созданный на основе 675 клинических случаев, проверенных экспертами, и включающий 2500 сложных медицинских запросов по 7 категориям.

🎉 Результаты говорят сами за себя:
- 63,1% точности на ChestAgentBench
- Sota результативность на CheXbench
- Превосходит как универсальные, так и специализированные медицинские модели

Paper: https://arxiv.org/abs/2502.02673
Github: https://github.com/bowang-lab/MedRAX

@ai_machinelearning_big_data


#ai #agents #ml #opensource #med #medicine
🖥 python-benedict — это расширение стандартного словаря Python, предоставляющее дополнительные возможности для удобной работы с данными!

💡 Ключевые особенности включают поддержку доступа к значениям по списку ключей (keylist), доступ к вложенным данным с использованием разделителей (keypath), а также доступ к элементам словаря через атрибуты (keyattr). Кроме того, библиотека предлагает встроенные методы для чтения и записи данных в различных форматах, таких как JSON, YAML, XML, CSV, INI, TOML, HTML, Base64, а также работу с файлами Excel и строками запросов.

🔐 Лицензия: MIT

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 NiceGUI — это удобный фреймворк на языке Python, предназначенный для создания веб-интерфейсов, которые отображаются непосредственно в вашем браузере!

🌟 С его помощью можно легко создавать такие элементы, как кнопки, диалоги, разметку Markdown, 3D-сцены, графики и многое другое. NiceGUI особенно подходит для разработки небольших веб-приложений, информационных панелей, проектов в области робототехники, решений для умного дома и аналогичных задач.

🔐 Лицензия: MIT

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 CodeCapy — это бот для автоматического тестирования кода в пулл-реквестах на GitHub!

🌟 Он обнаруживает новые пулл-реквесты, генерирует на естественном языке сквозные UI-тесты на основе внесённых изменений, выполняет эти тесты в изолированных средах Scrapybara и публикует результаты в комментариях к пулл-реквестам.

🔐 Лицензия: MIT

🖥 Github

@python_job_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 LLM Functions — это проект с открытым исходным кодом, предназначенный для упрощения создания инструментов и агентов на основе больших языковых моделей с использованием языков программирования, таких как Bash, JavaScript и Python!

🌟 Он позволяет разработчикам легко интегрировать LLM с пользовательским кодом, что открывает широкие возможности для выполнения системных команд, обработки данных, взаимодействия с API и многого другого.

🔐 Лицензия: MIT

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 Mail0 — это проект с открытым исходным кодом, ориентированный на создание альтернативы Gmail, позволяющей пользователям управлять своей электронной почтой без зависимости от крупных провайдеров!

🌟 Он предлагает возможность самохостинга почтового сервера, интеграции с внешними сервисами (например, Gmail и Outlook) и обеспечивает конфиденциальность, так как данные остаются под полным контролем пользователя. Проект фокусируется на прозрачности, приватности и гибкости настройки.

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 PdfDing — это менеджер, просмотрщик и редактор PDF-файлов, обеспечивающий удобную работу на различных устройствах!

🌟 Он позволяет просматривать PDF-документы непосредственно в браузере, сохраняя позицию чтения для последующего продолжения с того же места. Пользователи могут организовывать свои PDF-файлы с помощью многоуровневых тегов, добавлять аннотации, выделения и рисунки, а также использовать такие функции, как темный режим, инвертированные цвета и настраиваемые цветовые темы. Кроме того, PdfDing поддерживает единый вход (SSO) через OIDC и предоставляет возможность делиться PDF-файлами с внешними пользователями посредством ссылок или QR-кодов с опциональным контролем доступа.

🔐 Лицензия: GPL-3.0

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🖥 Rich — это библиотека Python, предназначенная для отображения форматированного текста и улучшения вывода в терминале!

🌟 Она позволяет легко добавлять цвета, стили, таблицы, прогресс-бары, подсветку синтаксиса, отображение Markdown и многое другое в консольные приложения.

🔐 Лицензия: MIT

🖥 Github

@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM