🖼️ دیتاست GPT-Image-Edit-1.5M بهعنوان بزرگترین مجموعهی متنمحور برای ویرایش تصویر
این مجموعه شامل ۱.۵ میلیون نمونه است که هر نمونه از دستور متنی، تصویر اصلی و تصویر ویرایششده تشکیل شده و برای بهبود کیفیت ویرایش تصویر بر اساس متن طراحی شده است.
🔍 روش تولید:
سه دیتاست شناختهشده OmniEdit، HQ-Edit و UltraEdit با بهرهگیری از GPT-Image API بازطراحی و ارتقا یافتهاند.
📊 نتایج مدل FluxKontext آموزشدیده روی این مجموعه:
امتیاز ۷.۲۴ در GEdit-EN
امتیاز ۳.۸۰ در ImgEdit-Full
امتیاز ۸.۷۸ در Complex-Edit
این نتایج همسطح با مدلهای انحصاری پیشرفته است.
💡 ویژگیهای کلیدی:
♻️دقت بالا در اجرای دستورهای متنی
♻️تولید تصاویر با واقعگرایی بالا
♻️کاهش فاصله بین سیستمهای متنباز
♻️مدلهای بسته در ویرایش تصویر
🔗 لینکهای مرتبط:
🌐 پروژه: ucsc-vlaa.github.io/GPT-Image-Edit
💻 کد: github.com/wyhlovecpp/GPT-Image-Edit
📦 دیتاست: huggingface.co/datasets/UCSC-VLAA/GPT-Image-Edit-1.5M
🤖 مدل: huggingface.co/UCSC-VLAA/gpt-image-edit-training
📄 مقاله: arxiv.org/abs/2507.21033
#هوش_مصنوعی #پردازش_تصویر #چندوجهی #OpenSource #GPT4V
این مجموعه شامل ۱.۵ میلیون نمونه است که هر نمونه از دستور متنی، تصویر اصلی و تصویر ویرایششده تشکیل شده و برای بهبود کیفیت ویرایش تصویر بر اساس متن طراحی شده است.
🔍 روش تولید:
سه دیتاست شناختهشده OmniEdit، HQ-Edit و UltraEdit با بهرهگیری از GPT-Image API بازطراحی و ارتقا یافتهاند.
📊 نتایج مدل FluxKontext آموزشدیده روی این مجموعه:
امتیاز ۷.۲۴ در GEdit-EN
امتیاز ۳.۸۰ در ImgEdit-Full
امتیاز ۸.۷۸ در Complex-Edit
این نتایج همسطح با مدلهای انحصاری پیشرفته است.
💡 ویژگیهای کلیدی:
♻️دقت بالا در اجرای دستورهای متنی
♻️تولید تصاویر با واقعگرایی بالا
♻️کاهش فاصله بین سیستمهای متنباز
♻️مدلهای بسته در ویرایش تصویر
🔗 لینکهای مرتبط:
🌐 پروژه: ucsc-vlaa.github.io/GPT-Image-Edit
💻 کد: github.com/wyhlovecpp/GPT-Image-Edit
📦 دیتاست: huggingface.co/datasets/UCSC-VLAA/GPT-Image-Edit-1.5M
🤖 مدل: huggingface.co/UCSC-VLAA/gpt-image-edit-training
📄 مقاله: arxiv.org/abs/2507.21033
#هوش_مصنوعی #پردازش_تصویر #چندوجهی #OpenSource #GPT4V
🔥27😁19👍17👏16🎉16❤14🥰14