vidgear – высокопроизводительный кроссплатформенный фреймворк Python для обработки видео с хорошим функционалом
#Interesting #Python #Useful #Video
@pro_python_code
Please open Telegram to view this post
VIEW IN TELEGRAM
Парсинг на Python
1. Быстрый Парсинг с библиотекой Polars на Python
2. Продвинутый парсинг. Обход блокировки
3. Полный Гайд по парсингу на Python: от азов до продвинутых техниик,. Часть 1
4. Полный Гайд по парсингу на Python: Практика. Часть 2
5. Практика парсинга Python
6. Большой гайд по парсингу на Python. Часть 3 Работаем с selenium
7. Уроки Парсинга на Python Сравниваем Scrappy и bs4
8. Продвинутый парсинг на Python со сменой прокси
9. Многопоточный парсер на Python. ООП подход
10. Асинхронный парсинг сайтов на Python
#video #python
https://www.youtube.com/watch?v=dqEHY9zKc8M&list=PLysMDSbb9HcwWWhs1Cm9EF1sv0fo8kII5
@pro_python_code
1. Быстрый Парсинг с библиотекой Polars на Python
2. Продвинутый парсинг. Обход блокировки
3. Полный Гайд по парсингу на Python: от азов до продвинутых техниик,. Часть 1
4. Полный Гайд по парсингу на Python: Практика. Часть 2
5. Практика парсинга Python
6. Большой гайд по парсингу на Python. Часть 3 Работаем с selenium
7. Уроки Парсинга на Python Сравниваем Scrappy и bs4
8. Продвинутый парсинг на Python со сменой прокси
9. Многопоточный парсер на Python. ООП подход
10. Асинхронный парсинг сайтов на Python
#video #python
https://www.youtube.com/watch?v=dqEHY9zKc8M&list=PLysMDSbb9HcwWWhs1Cm9EF1sv0fo8kII5
@pro_python_code
1. Django REST Framework - что это такое
2. Установка Django Rest Framework
3. Базовый класс APIView для представлений
4. Введение в сериализацию. Класс Serializer
5. Методы save(), create() и update() класса Serializer
6. Класс ModelSerializer и представление ListCreateAPIView
7. Представления UpdateAPIView и RetrieveUpdateDestroyAPIView
8. Viewsets и ModelViewSet
9. Роутеры: SimpleRouter и DefaultRouter
10. Ограничения доступа (permissions)
#video #django
https://www.youtube.com/watch?v=i-uvtDKeFgE&list=PLA0M1Bcd0w8xZA3Kl1fYmOH_MfLpiYMRs
@pro_python_code
Please open Telegram to view this post
VIEW IN TELEGRAM
Cемантика языков программирования
1. Семантика и её значение
2. Введение в Coq
3. Семантика большого шага для императивного языка
4. Множественные цели в Coq. Д-во корректности Constant Folding
5. Coq. Разбор д-ва терминируемости алгоритма Евклида
6. Семантика малого шага, логика Хоара
7. Coq. Семантика малого шага, логика Хоара
8. Введение в слабые модели памяти
9. Декларативные модели памяти (1/2)
10. Декларативные модели памяти (2/2)
#video
https://www.youtube.com/playlist?list=PLlb7e2G7aSpTA0aT2M1CvIWof3Osslo7Z
@pro_python_code
1. Семантика и её значение
2. Введение в Coq
3. Семантика большого шага для императивного языка
4. Множественные цели в Coq. Д-во корректности Constant Folding
5. Coq. Разбор д-ва терминируемости алгоритма Евклида
6. Семантика малого шага, логика Хоара
7. Coq. Семантика малого шага, логика Хоара
8. Введение в слабые модели памяти
9. Декларативные модели памяти (1/2)
10. Декларативные модели памяти (2/2)
#video
https://www.youtube.com/playlist?list=PLlb7e2G7aSpTA0aT2M1CvIWof3Osslo7Z
@pro_python_code
Forwarded from Machinelearning
Tencent выпустила HunyuanCustom, фреймворк, который не только генерирует видео по заданным условиям, но и умеет сохранять консистентность субъектов, будь то человек, животное или предмет. Модель справляется даже с мультисубъектными сценами: в демо-роликах люди естественно взаимодействуют с предметами, а текст на упаковках не плывет между кадрами.
В основе модели лежит улучшенный механизм слияния текста и изображений через LLaVA. Например, если вы загружаете фото женщины в платье и текст «танцует под дождем», система анализирует оба инпута, связывая описание с визуальными деталями.
Но главное - это модуль временной конкатенации: он «растягивает» особенности изображения вдоль временной оси видео, используя 3D-VAE. Это помогает избежать «прыгающих» лиц или внезапных изменений фона, проблемы, которая характерна даже для топовых моделей видеогенерации.
Tencent переработали и пайплайн аудио. Для синхронизации звука с движениями губ или действиями в кадре HunyuanCustom использует AudioNet, модуль, который выравнивает аудио- и видеофичи через пространственное кросс-внимание.
Фреймворк поддерживает возможность замены объекта в готовом ролике (скажем, подставить новую модель кроссовок в рекламу), модель сжимает исходное видео в латентное пространство, выравнивает его с шумными данными и встраивает изменения без артефактов на границах.
Экспериментальные тесты показали, что HunyuanCustom обходит конкурентов по ключевым метрикам. Например, Face-Sim (сохранение идентичности лица) у Tencent — 0.627 против 0.526 у Hailuo, а с Keling, Vidu, Pika и Skyreels разрыв еще больше.
⚠️ Для работы модель требует минимум 24 ГБ видеопамяти для роликов 720p, но чтобы раскрыть все возможности, разработчики рекомендуют 80 ГБ VRAM.
Код и чекпоинты уже доступны в открытом доступе, а в репозитории есть примеры запуска как на нескольких GPU, так и в экономном режиме для потребительских видеокарт.
@ai_machinelearning_big_data
#AI #ML #Video #HunyuanCustom #Tencent
Please open Telegram to view this post
VIEW IN TELEGRAM