Python RU

✔️

Microsoft выпустила в опенсорс библиотеку MarkItDown на Python для преобразования файлов в Markdown

MarkItDown представляет собой эффективное средство для конвертации различных типов файлов и документов в формат Markdown. Эта библиотека идеально подходит для анализа, индексирования и систематизации данных.

Вот перечень поддерживаемых форматов:
— PDF, PowerPoint, Word, Excel.
— Изображения (в том числе EXIF-данные и распознавание текста с помощью OCR).
— Аудио (метаданные и расшифровка речи).
— HTML (включая специализированную обработку контента из Wikipedia).
— Текстовые форматы: CSV, JSON, XML и другие.
▪MarkItDown ▪Github

@pro_python_code

Please open Telegram to view this post

VIEW IN TELEGRAM

1.8K viewsedited 10:26

Python RU

Forwarded from Python/ django

🖥

Разработка игры в стиле Mario с нуля на Python

Создание собственной игры в духе легендарного Super Mario Bros — это отличный способ прокачать навыки программирования, погрузиться в основы геймдева и просто повеселиться.

Гайд по разработке простой платформенной игры с нуля Python, используя библиотеку Pygame.

📌 Гайд

@pythonl

Please open Telegram to view this post

VIEW IN TELEGRAM

1.7K views12:43

Python RU

👩‍💻

Docker - признанный обучающий канал о Devops и Docker

С помощью картинок и шортсов даже новички научаться применять продвинутые инструменты разработчика и контейнеры.

Стоит подписаться: t.me/DevopsDocker

Please open Telegram to view this post

VIEW IN TELEGRAM

1.9K views18:34

Python RU

🐍 Задача по Python: Ловушка замыканий

Что выведет следующий код?


def create_funcs():
    funcs = []
    for i in range(3):
        def f():
            return i
        funcs.append(f)
    return funcs

for func in create_funcs():
    print(func())

Варианты ответа:
A)

1
2

2
2

0
0

D) Ошибка выполнения

---

✅ Правильный ответ: B

Почему:
Это классическая late binding: функция

f()

не сохраняет значение

i

на момент создания, а берёт его из текущей области видимости при вызове.
К моменту вызова

i == 2

(последнее значение в

range(3)

), поэтому все три функции возвращают

2

.

Чтобы избежать этого — можно использовать аргументы по умолчанию:

def f(i=i): return i

1.9K viewsedited 11:17

Python RU

🖥

Удалить пунктуацию из строки

Строковый метод translate позволяет заменять (или удалять) несколько символов строки за один проход. (Это похоже на множественные вызовы метода replace.)

Please open Telegram to view this post

VIEW IN TELEGRAM

1.9K views07:41

Python RU

🧹 Очистка данных в Docker: как освободить место и ускорить работу

Docker — мощный инструмент, но со временем он начинает засоряться контейнерами, образами, томами и сетями. Это тормозит систему и забивает диск.

Вот как быстро навести порядок:

▪ Удалить остановленные контейнеры


docker container prune

▪ Удалить неиспользуемые образы


docker image prune
docker image prune -a

▪ Удалить неиспользуемые сети


docker network prune

▪ Удалить неиспользуемые тома


docker volume prune

▪ Комплексная очистка всего окружения


docker system prune
docker system prune -a

⚙️ Автоматизация очистки (раз в неделю через cron)


 0 * * 0 /usr/bin/docker system prune -f

📦 Для Docker Compose-проектов


docker-compose down --remove-orphans

✅ Регулярная очистка — залог стабильности и свободного пространства. Привычка, за которую ваша система скажет спасибо.

@DevopsDocker

2.3K views12:03

Python RU

❓ Что выведет следующий код на Python?


a = 256
b = 256
c = 257
d = 257

print(a is b)  # #1
print(c is d)  # #2

print(True + True + True == 3)  # #3
print(True is 1)               # #4
print(False == 0)              # #5
print(False is 0)              # #6

🔢 Варианты ответа:

A)


True
True
True
True
True


False
True
False
True
False


False
True
False
True
False


True
False
False
False
False

✅ Правильный ответ: B

💡 Почему?
-

a is b

→

True

, потому что

int

от -5 до 256 кэшируются.
-

c is d

→

False

, число 257 не кэшируется.
-

True + True + True == 3

→

True

, более того,

True == 1

.
-

True is 1

→

False

— это разные типы (bool и int).
-

False == 0

→

True

False is 0

→

False

2.7K views12:03

Python RU

🖥

Огромная библиотеку Linux-команд

Реально огромная: более 5000 страниц, всё удобно разложено по категориям.

Можно пользоваться онлайн или скачать для локального использования.

#linux #commands #library

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

2.7K views12:02

Python RU

🤖 Исследователи обнаружили тревожный тренд: ИИ-ассистенты вроде ChatGPT и Gemini всё чаще предлагают код с несуществующими зависимостями. Злоумышленники быстро адаптировались — они регистрируют эти галлюцинированные названия в PyPI и NPM, наполняя их вредоносным кодом.

Под особой угрозой разработчики, практикующие vibe-coding — бездумное копирование ИИ-подсказок. Некоторые фейковые пакеты выглядят убедительно: имеют документацию, GitHub-репозитории и даже блоги-однодневки.

‼️ Фонд Python называет эту тактику «слопсквоттинг» (от *slop* — «мусорный вывод ИИ») и усиливает защиту репозиториев. Пока главная рекомендация — вручную проверять каждую зависимость, даже если её рекомендует ИИ.

🔗 Ссылка - *клик*

3.0K views13:05

Python RU

🌐

GeoPincer — это Python-скрипт, использующий Overpass API OpenStreetMap для поиска местоположений, где определенные объекты находятся в непосредственной близости друг от друга!

🌟 Скрипт принимает в качестве входных данных базовую область поиска и как минимум два названия объектов (например, магазины или достопримечательности), которые расположены рядом. По умолчанию, расстояние между объектами устанавливается в 500 метров, но может быть изменено с помощью аргумента --distance. Результаты поиска предоставляются в виде URL-адресов Google Maps, указывающих на найденные локации.

🔐 Лицензия: MIT

🖥

Github

@pro_python_code

Please open Telegram to view this post

VIEW IN TELEGRAM

2.9K views12:02

Python RU

2.6K views06:39

Python RU

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Python на скорости Rust

Новый Function (fxn) — фреймворк, который компилирует Python-функции в нативный код с производительностью, сравнимой с Rust.

🧠 Как это работает?
- Использует символическое трассирование на CPython для анализа функций
- Генерирует промежуточное представление (IR)
- Транслирует IR в C++ или Rust, а затем компилирует в бинарный код
- Поддерживает платформы: Linux, Android, WebAssembly и др.

📦 Пример:
@compile
def fma(x: float, y: float, z: float) -> float:
return x * y + z
После компиляции вы получаете нативный бинарник, который можно запускать без интерпретатора Python.

🔗 Подробнее
🔗 Github

@pro_python_code

#Python #Rust #fxn #Compiler #Performance #AI #ML #Wasm

Please open Telegram to view this post

VIEW IN TELEGRAM

3.0K viewsedited 08:42

Python RU

Forwarded from Machinelearning

🌟 Kimi-Audio: открытая модель для аудиозадач.

Kimi-Audio — инструктивная модель с 7 млрд. параметров, разработанная командой MoonshotAI, которая объединяет распознавание речи, анализ аудиоконтента и генерацию ответов в реальном времени в единую архитектуру. Модель показала SOTA-результаты на множестве аудиобенчмарков, от распознавания речи до эмоционального анализа.

Архитектура Kimi-Audio — это 3 компонента:

🟢Гибридный токенизатор, который преобразует аудио в дискретные семантические токены (12.5 Гц) через векторное квантование и дополняет их непрерывными акустическими признаками из Whisper.

🟢Модифицированная LLM (на базе Qwen 2.5 7B) с общими слоями для мультимодальных данных и раздельными «головами» для генерации текста и аудио.

🟢Детокенизатор на основе flow matching и BigVGAN. Он превращает токены обратно в звук с задержкой менее секунды благодаря чанковому потоковому декодированию и look-ahead механизму.

Отдельного внимания заслуживает пайплайн обучения, к нему команда разработки подошла ответственно и скрупулезно: 13 млн часов аудио были обработаны через автоматический конвейер, включающий шумоподавление, диаризацию и транскрипцию.

Для повышения качества сегменты объединялись по контексту, а транскрипции дополнялись пунктуацией на основе пауз. После предобучения на задачах ASR и TTS модель прошла этап SFT на 300 тыс. часов данных (развернутые диалоги и аудиочаты).

В тестах ASR Kimi-Audio показала: WER 1.28 на LibriSpeech test-clean против 2.37 у Qwen2.5-Omni. В аудиопонимании она лидирует на ClothoAQA (73.18) и MELD (59.13), а в классификации сцен (CochlScene) показывает 80.99 — на 17 пунктов выше ближайшего соперника. В диалогах модель близка к GPT-4o (3.90 против 4.06 по субъективной оценке).

📌 Лицензирование кода : Apache 2.0 License.

📌 Лицензирование модели: MIT License.

🟡

Модель

🟡

Техотчет

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #KimiAudio #MoonshotAI

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

2.3K views07:16