🤖 معماری Local–Global Siamese در یادگیری عمیق
در بسیاری از مسائل بینایی ماشین، صرفاً دید کلی یا فقط توجه به جزئیات کافی نیست. برای مثال در تشخیص عیوب صنعتی یا تصاویر پزشکی، هم باید ساختار کلی جسم دیده شود و هم نقصهای ظریف و کوچک. اینجا معماری Local–Global Siamese Network وارد عمل میشود.
🔹 Global Branch (شاخه کلی):
کل تصویر به عنوان ورودی پردازش میشود تا ویژگیهای بزرگمقیاس مانند شکل، ساختار، الگوهای تکرارشونده و بافت کلی استخراج شوند.
🔹 Local Branch (شاخه محلی):
نواحی مهم یا قطعات کوچک تصویر (Patch) جدا شده و با دقت بالا بررسی میشوند تا تغییرات ریز، ترکها یا جزئیات نامحسوس از دست نروند.
🔹 Siamese Mechanism (مقایسه همزاد):
هر دو نمای محلی و کلی با وزنهای مشترک (Shared Weights) پردازش میشوند و در نهایت در یک فضای ویژگی مشترک ترکیب یا مقایسه میگردند. این روش امکان اندازهگیری شباهت یا تفاوت را با دقت بالا فراهم میکند.
📊 کاربردهای کلیدی:
🏭 صنعتی: تشخیص عیوب سطحی در کاتدهای مسی، ترکهای ریز، یا تغییرات ناهمگون در محصولات.
🧬 پزشکی: شناسایی ضایعات کوچک در کنار بافت کلی (مانند تصاویر MRI یا CT).
🔐 امنیت و بیومتریک: مقایسه چهره یا اثرانگشت در شرایطی که تفاوتها بسیار جزئی هستند.
🌍 تحلیل تصاویر ماهوارهای: ترکیب دید کلی از مناظر و تمرکز روی جزئیات کوچک مثل جادهها یا ساختمانها.
✅ مزیت اصلی این معماری این است که مدل هم نگاه پرندهای (Macro) دارد و هم نگاه میکروسکوپی (Micro)، و به همین دلیل در بسیاری از پروژههای واقعی نسبت به CNN ساده یا Siamese معمولی عملکرد بهتری نشان میدهد.
#DeepLearning #Siamese #LocalGlobal #ComputerVision #AI #IndustrialAI #MedicalAI
✍️ ¦ @rss_ai_ir
در بسیاری از مسائل بینایی ماشین، صرفاً دید کلی یا فقط توجه به جزئیات کافی نیست. برای مثال در تشخیص عیوب صنعتی یا تصاویر پزشکی، هم باید ساختار کلی جسم دیده شود و هم نقصهای ظریف و کوچک. اینجا معماری Local–Global Siamese Network وارد عمل میشود.
🔹 Global Branch (شاخه کلی):
کل تصویر به عنوان ورودی پردازش میشود تا ویژگیهای بزرگمقیاس مانند شکل، ساختار، الگوهای تکرارشونده و بافت کلی استخراج شوند.
🔹 Local Branch (شاخه محلی):
نواحی مهم یا قطعات کوچک تصویر (Patch) جدا شده و با دقت بالا بررسی میشوند تا تغییرات ریز، ترکها یا جزئیات نامحسوس از دست نروند.
🔹 Siamese Mechanism (مقایسه همزاد):
هر دو نمای محلی و کلی با وزنهای مشترک (Shared Weights) پردازش میشوند و در نهایت در یک فضای ویژگی مشترک ترکیب یا مقایسه میگردند. این روش امکان اندازهگیری شباهت یا تفاوت را با دقت بالا فراهم میکند.
📊 کاربردهای کلیدی:
🏭 صنعتی: تشخیص عیوب سطحی در کاتدهای مسی، ترکهای ریز، یا تغییرات ناهمگون در محصولات.
🧬 پزشکی: شناسایی ضایعات کوچک در کنار بافت کلی (مانند تصاویر MRI یا CT).
🔐 امنیت و بیومتریک: مقایسه چهره یا اثرانگشت در شرایطی که تفاوتها بسیار جزئی هستند.
🌍 تحلیل تصاویر ماهوارهای: ترکیب دید کلی از مناظر و تمرکز روی جزئیات کوچک مثل جادهها یا ساختمانها.
✅ مزیت اصلی این معماری این است که مدل هم نگاه پرندهای (Macro) دارد و هم نگاه میکروسکوپی (Micro)، و به همین دلیل در بسیاری از پروژههای واقعی نسبت به CNN ساده یا Siamese معمولی عملکرد بهتری نشان میدهد.
#DeepLearning #Siamese #LocalGlobal #ComputerVision #AI #IndustrialAI #MedicalAI
✍️ ¦ @rss_ai_ir
❤10🔥6🥰6🎉6😁5👍3👏2
📌 معیارهای ارزیابی امکانپذیری اجرای یک پروژه صنعتی در حوزه هوش مصنوعی
قبل از ورود به هر پروژه صنعتی باید بررسی شود که آیا اجرای آن واقعبینانه و مقرونبهصرفه است یا خیر. برخی از مهمترین ملاکها عبارتند از:
🔹 1. دسترسی به داده
♻️آیا دادههای کافی، باکیفیت و متنوع در دسترس هستند؟
♻️آیا امکان برچسبگذاری دقیق وجود دارد یا باید زمان و هزینه زیادی صرف Annotation شود؟
🔹 2. زیرساخت سختافزاری و نرمافزاری
♻️آیا صنعت موردنظر زیرساخت لازم (دوربینها، سنسورها، سرورها، GPU و شبکه پایدار) را دارد؟
♻️آیا تیم فنی توانایی استقرار و نگهداری از سیستم را خواهد داشت؟
🔹 3. ارزش افزوده اقتصادی
♻️آیا نتیجه پروژه منجر به صرفهجویی مالی، افزایش بهرهوری یا کاهش ریسک میشود؟
♻️نسبت هزینه به فایده (Cost–Benefit) منطقی است؟
🔹 4. همکاری و فرهنگ سازمانی
♻️آیا کارکنان صنعت با پروژه همکاری میکنند یا مقاومت دارند؟
♻️آیا فرهنگ سازمانی پذیرای تغییرات دیجیتال است؟
🔹 5. پیچیدگی فنی و ریسکها
♻️آیا پروژه بیش از حد پیچیده است یا میتوان با نسخه کوچکتر (Proof of Concept) شروع کرد؟
♻️ریسک شکست و هزینههای پنهان آن قابل قبول هستند؟
🔹 6. زمان و منابع انسانی
♻️آیا تیم توسعهدهنده تجربه مشابه دارد؟
♻️آیا زمانبندی پروژه با محدودیتهای صنعت هماهنگ است؟
✅ جمعبندی:
اگر داده کافی + زیرساخت مناسب + ارزش اقتصادی + همراهی سازمانی وجود داشته باشد، پروژه صنعتی قابل انجام است. در غیر این صورت بهتر است ابتدا پروژه بهصورت پایلوت کوچک آغاز شود تا ریسک و هزینه کاهش یابد.
⚙️ #AI #IndustrialAI #ProjectManagement #Feasibility
✍️ ¦ @rss_ai_ir
قبل از ورود به هر پروژه صنعتی باید بررسی شود که آیا اجرای آن واقعبینانه و مقرونبهصرفه است یا خیر. برخی از مهمترین ملاکها عبارتند از:
🔹 1. دسترسی به داده
♻️آیا دادههای کافی، باکیفیت و متنوع در دسترس هستند؟
♻️آیا امکان برچسبگذاری دقیق وجود دارد یا باید زمان و هزینه زیادی صرف Annotation شود؟
🔹 2. زیرساخت سختافزاری و نرمافزاری
♻️آیا صنعت موردنظر زیرساخت لازم (دوربینها، سنسورها، سرورها، GPU و شبکه پایدار) را دارد؟
♻️آیا تیم فنی توانایی استقرار و نگهداری از سیستم را خواهد داشت؟
🔹 3. ارزش افزوده اقتصادی
♻️آیا نتیجه پروژه منجر به صرفهجویی مالی، افزایش بهرهوری یا کاهش ریسک میشود؟
♻️نسبت هزینه به فایده (Cost–Benefit) منطقی است؟
🔹 4. همکاری و فرهنگ سازمانی
♻️آیا کارکنان صنعت با پروژه همکاری میکنند یا مقاومت دارند؟
♻️آیا فرهنگ سازمانی پذیرای تغییرات دیجیتال است؟
🔹 5. پیچیدگی فنی و ریسکها
♻️آیا پروژه بیش از حد پیچیده است یا میتوان با نسخه کوچکتر (Proof of Concept) شروع کرد؟
♻️ریسک شکست و هزینههای پنهان آن قابل قبول هستند؟
🔹 6. زمان و منابع انسانی
♻️آیا تیم توسعهدهنده تجربه مشابه دارد؟
♻️آیا زمانبندی پروژه با محدودیتهای صنعت هماهنگ است؟
✅ جمعبندی:
اگر داده کافی + زیرساخت مناسب + ارزش اقتصادی + همراهی سازمانی وجود داشته باشد، پروژه صنعتی قابل انجام است. در غیر این صورت بهتر است ابتدا پروژه بهصورت پایلوت کوچک آغاز شود تا ریسک و هزینه کاهش یابد.
⚙️ #AI #IndustrialAI #ProjectManagement #Feasibility
✍️ ¦ @rss_ai_ir
👍18😁11🔥10🎉10👏7❤6🥰6
💡 چالش هفته: هوش مصنوعی در کشاورزی دقیق (Precision Agriculture)
سلام به همه علاقهمندان به دنیای هوش مصنوعی! 🤖
امروز میخواهیم یک سناریوی واقعی و جذاب را با هم بررسی کنیم که در آن، پردازش تصویر و یادگیری عمیق میتوانند یک صنعت سنتی را متحول کنند.
🎬 سناریو:
یک شرکت دانشبنیان به نام «کشتیار هوشمند» قصد دارد با استفاده از پهپاد (Drone)، مصرف سموم دفع آفات و علفکشها را در مزارع بزرگ گندم تا ۹۰٪ کاهش دهد.
🎯 هدف اصلی:
❌پهپادهای مجهز به دوربین، بر فراز مزرعه پرواز میکنند و سیستم هوش مصنوعی باید در لحظه علفهای هرز را از گیاهان اصلی (گندم) تشخیص دهد. سپس، سمپاشهای هوشمندِ متصل به پهپاد، فقط و فقط روی علفهای هرز سمپاشی میکنند و به گیاه اصلی آسیبی نمیرسانند.
♨️ چالش فنی اصلی:
بزرگترین مشکل اینجاست که در مراحل اولیه رشد، بسیاری از علفهای هرز (مثلاً گیاه یولاف وحشی) از نظر ظاهری، بافت و رنگ، شباهت فوقالعاده زیادی به گیاه گندم دارند. مدل هوش مصنوعی باید بتواند این تفاوتهای بسیار جزئی را تشخیص دهد.
علاوه بر این، چالشهای دیگری هم وجود دارد:
✅تغییرات شدید نور خورشید و ایجاد سایه.
✅تاری تصویر به دلیل حرکت سریع پهپاد.
✅وجود انواع مختلف علف هرز.
✅به نظر شما، مهمترین و سختترین بخش فنی در توسعه مدل AI برای این سناریو چیست؟ 🤔
در پست بعدی، یک نظرسنجی چهار گزینهای در همین مورد خواهیم داشت. با ما همراه باشید!
#هوش_مصنوعی #پردازش_تصویر #کشاورزی_هوشمند #یادگیری_عمیق #پهپاد #چالش_فنی #AI #ComputerVision #DeepLearning
سلام به همه علاقهمندان به دنیای هوش مصنوعی! 🤖
امروز میخواهیم یک سناریوی واقعی و جذاب را با هم بررسی کنیم که در آن، پردازش تصویر و یادگیری عمیق میتوانند یک صنعت سنتی را متحول کنند.
🎬 سناریو:
یک شرکت دانشبنیان به نام «کشتیار هوشمند» قصد دارد با استفاده از پهپاد (Drone)، مصرف سموم دفع آفات و علفکشها را در مزارع بزرگ گندم تا ۹۰٪ کاهش دهد.
🎯 هدف اصلی:
❌پهپادهای مجهز به دوربین، بر فراز مزرعه پرواز میکنند و سیستم هوش مصنوعی باید در لحظه علفهای هرز را از گیاهان اصلی (گندم) تشخیص دهد. سپس، سمپاشهای هوشمندِ متصل به پهپاد، فقط و فقط روی علفهای هرز سمپاشی میکنند و به گیاه اصلی آسیبی نمیرسانند.
♨️ چالش فنی اصلی:
بزرگترین مشکل اینجاست که در مراحل اولیه رشد، بسیاری از علفهای هرز (مثلاً گیاه یولاف وحشی) از نظر ظاهری، بافت و رنگ، شباهت فوقالعاده زیادی به گیاه گندم دارند. مدل هوش مصنوعی باید بتواند این تفاوتهای بسیار جزئی را تشخیص دهد.
علاوه بر این، چالشهای دیگری هم وجود دارد:
✅تغییرات شدید نور خورشید و ایجاد سایه.
✅تاری تصویر به دلیل حرکت سریع پهپاد.
✅وجود انواع مختلف علف هرز.
✅به نظر شما، مهمترین و سختترین بخش فنی در توسعه مدل AI برای این سناریو چیست؟ 🤔
در پست بعدی، یک نظرسنجی چهار گزینهای در همین مورد خواهیم داشت. با ما همراه باشید!
#هوش_مصنوعی #پردازش_تصویر #کشاورزی_هوشمند #یادگیری_عمیق #پهپاد #چالش_فنی #AI #ComputerVision #DeepLearning
😁8👍7❤6🔥5👏4🎉2🥰1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 یادگیری عمیق و نقش Batch Normalization
در مسیر طراحی شبکههای عصبی عمیق، یکی از چالشهای کلیدی، پراکندگی داخلی دادهها (Internal Covariate Shift) است. این پدیده زمانی رخ میدهد که توزیع ورودی هر لایه در طول آموزش تغییر کند و باعث ناپایداری و کندی یادگیری شود.
🔑 تکنیک Batch Normalization (BN) یکی از تکنیکهای حیاتی برای رفع این مشکل است. در این روش، ورودی هر لایه در طول آموزش نرمالسازی میشود و سپس با پارامترهای قابل یادگیری (گاما و بتا) مقیاسدهی و انتقال داده میشود.
⚡️ مزایای کلیدی BN:
1. 🚀 شتاب در آموزش → امکان یادگیری سریعتر با نرخ یادگیری بالاتر.
2. 🔒 پایداری بیشتر → جلوگیری از نوسان شدید در گرادیانها.
3. 🎯 بهبود دقت → کمک به مدل برای رسیدن به مینیمم بهینهتر.
4. 🛡 اثر منظمسازی (Regularization) → کاهش نیاز به Dropout در بسیاری از موارد.
💡 امروزه، BN به عنوان یک استاندارد طلایی در شبکههای کانولوشنی (CNNs) شناخته میشود و تقریباً در همه مدلهای مدرن (مانند ResNet و EfficientNet) استفاده میشود.
🔍 با این حال، در مدلهای سبک یا کاربردهای بلادرنگ، جایگزینهایی مثل Layer Normalization، Group Normalization و Instance Normalization نیز اهمیت ویژهای پیدا کردهاند.
---
✨ نتیجهگیری:
اگر به دنبال ساخت یک شبکه عمیق پایدار و سریع هستید، Batch Normalization یکی از اولین ابزارهایی است که باید در جعبهابزار خود داشته باشید.
---
🔖 #DeepLearning #BatchNormalization #AI #MachineLearning
✍️ @rss_ai_ir
در مسیر طراحی شبکههای عصبی عمیق، یکی از چالشهای کلیدی، پراکندگی داخلی دادهها (Internal Covariate Shift) است. این پدیده زمانی رخ میدهد که توزیع ورودی هر لایه در طول آموزش تغییر کند و باعث ناپایداری و کندی یادگیری شود.
🔑 تکنیک Batch Normalization (BN) یکی از تکنیکهای حیاتی برای رفع این مشکل است. در این روش، ورودی هر لایه در طول آموزش نرمالسازی میشود و سپس با پارامترهای قابل یادگیری (گاما و بتا) مقیاسدهی و انتقال داده میشود.
⚡️ مزایای کلیدی BN:
1. 🚀 شتاب در آموزش → امکان یادگیری سریعتر با نرخ یادگیری بالاتر.
2. 🔒 پایداری بیشتر → جلوگیری از نوسان شدید در گرادیانها.
3. 🎯 بهبود دقت → کمک به مدل برای رسیدن به مینیمم بهینهتر.
4. 🛡 اثر منظمسازی (Regularization) → کاهش نیاز به Dropout در بسیاری از موارد.
💡 امروزه، BN به عنوان یک استاندارد طلایی در شبکههای کانولوشنی (CNNs) شناخته میشود و تقریباً در همه مدلهای مدرن (مانند ResNet و EfficientNet) استفاده میشود.
🔍 با این حال، در مدلهای سبک یا کاربردهای بلادرنگ، جایگزینهایی مثل Layer Normalization، Group Normalization و Instance Normalization نیز اهمیت ویژهای پیدا کردهاند.
---
✨ نتیجهگیری:
اگر به دنبال ساخت یک شبکه عمیق پایدار و سریع هستید، Batch Normalization یکی از اولین ابزارهایی است که باید در جعبهابزار خود داشته باشید.
---
🔖 #DeepLearning #BatchNormalization #AI #MachineLearning
✍️ @rss_ai_ir
🔥7😁6👍5🥰5🎉5👏4❤3👎1🙏1
🚀 نگهداری پیشبینانه (Predictive Maintenance)
در صنعت، یکی از مهمترین کاربردهای هوش مصنوعی، پیشبینی خرابی تجهیزات قبل از وقوع آن است. این روش که با عنوان Predictive Maintenance (PdM) شناخته میشود، باعث میشود تا بجای تعمیرات زمانبندیشده یا واکنشی، بر اساس دادههای واقعی تصمیمگیری کنیم.
🔑 اصول PdM:
1️⃣ دادهبرداری مداوم: نصب حسگرهایی مثل لرزشسنج، دماسنج، فشار و جریان روی ماشینآلات.
2️⃣ پیشپردازش و تحلیل سیگنال: حذف نویز و استخراج ویژگیها با روشهایی مثل FFT و Wavelet.
3️⃣ مدلسازی هوش مصنوعی:
مدل ML (مثل SVM, XGBoost) برای تشخیص خرابی.
مدلDL (مثل CNN, LSTM) برای پیشبینی زمان باقیمانده عمر تجهیز (RUL).
4️⃣ تشخیص آنومالی: شناسایی رفتار غیرعادی تجهیزات.
5️⃣ تصمیمگیری عملیاتی: زمانبندی تعمیر یا تعویض قبل از خرابی واقعی.
⚙️ مزایا:
✔️ کاهش توقف ناخواسته خط تولید ⏱
✔️ افزایش عمر تجهیزات ⚡
✔️ صرفهجویی در هزینههای تعمیر و نگهداری 💰
✔️ ارتقاء ایمنی صنعتی 🦺
📌 نمونهها:
♻️تشخیص شکستگی دندههای گیربکس با صدا 🎧
♻️پیشبینی خرابی یاتاقانها با ارتعاش 📈
♻️پایش سلامت پمپها و فنها با دادههای فشار و جریان 💨
---
📊 نتیجه: PdM پلی میان دادههای صنعتی و تصمیمهای هوشمند است؛ همان چیزی که صنعت ۴.۰ را ممکن میسازد.
@rss_ai_ir 🤖 | #PredictiveMaintenance #AI #Industry40
در صنعت، یکی از مهمترین کاربردهای هوش مصنوعی، پیشبینی خرابی تجهیزات قبل از وقوع آن است. این روش که با عنوان Predictive Maintenance (PdM) شناخته میشود، باعث میشود تا بجای تعمیرات زمانبندیشده یا واکنشی، بر اساس دادههای واقعی تصمیمگیری کنیم.
🔑 اصول PdM:
1️⃣ دادهبرداری مداوم: نصب حسگرهایی مثل لرزشسنج، دماسنج، فشار و جریان روی ماشینآلات.
2️⃣ پیشپردازش و تحلیل سیگنال: حذف نویز و استخراج ویژگیها با روشهایی مثل FFT و Wavelet.
3️⃣ مدلسازی هوش مصنوعی:
مدل ML (مثل SVM, XGBoost) برای تشخیص خرابی.
مدلDL (مثل CNN, LSTM) برای پیشبینی زمان باقیمانده عمر تجهیز (RUL).
4️⃣ تشخیص آنومالی: شناسایی رفتار غیرعادی تجهیزات.
5️⃣ تصمیمگیری عملیاتی: زمانبندی تعمیر یا تعویض قبل از خرابی واقعی.
⚙️ مزایا:
✔️ کاهش توقف ناخواسته خط تولید ⏱
✔️ افزایش عمر تجهیزات ⚡
✔️ صرفهجویی در هزینههای تعمیر و نگهداری 💰
✔️ ارتقاء ایمنی صنعتی 🦺
📌 نمونهها:
♻️تشخیص شکستگی دندههای گیربکس با صدا 🎧
♻️پیشبینی خرابی یاتاقانها با ارتعاش 📈
♻️پایش سلامت پمپها و فنها با دادههای فشار و جریان 💨
---
📊 نتیجه: PdM پلی میان دادههای صنعتی و تصمیمهای هوشمند است؛ همان چیزی که صنعت ۴.۰ را ممکن میسازد.
@rss_ai_ir 🤖 | #PredictiveMaintenance #AI #Industry40
🔥4👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠✨ جادوی کانولوشن 1x1 در شبکههای عصبی پیچشی (CNN)
در نگاه اول، یک کانولوشن 1x1 شاید بیفایده به نظر برسه. مگه نه؟ فقط یک فیلتر با ابعاد 1 در 1 که روی تصویر حرکت میکنه... این چه کاری انجام میده؟ 🤔
اما راز اینجاست: کانولوشن 1x1 در عمق (تعداد کانالها) عمل میکنه! 🔥
تصور کنید یک تنسور ورودی با ابعاد
به عبارت سادهتر، این لایه مثل یک شبکه عصبی کاملاً متصل (Fully Connected) کوچک عمل میکنه که روی هر پیکسل به صورت جداگانه و در راستای عمق کانالها اعمال میشه.
خب، کاربرد اصلیش چیه؟
1. کاهش ابعاد (Dimensionality Reduction) 📉
مهمترین و مشهورترین کاربرد! با استفاده از $N$ فیلتر 1x1، میتونیم تعداد کانالها رو از $C_{in}$ به $N$ کاهش بدیم (یا افزایش، اما معمولاً برای کاهش استفاده میشه). این کار قبل از اعمال کانولوشنهای پرهزینهتر مثل 3x3 یا 5x5، باعث کاهش شدید حجم محاسبات و پارامترها میشه بدون اینکه ابعاد مکانی (ارتفاع و عرض) تغییر کنه. این تکنیک قلب ماژولهای Inception در معماری GoogLeNet است.
2. افزودن غیرخطی بودن (Adding Non-linearity) 🧠
بعد از هر لایه کانولوشن (حتی 1x1)، یک تابع فعالسازی مثل ReLU قرار میگیره. با اضافه کردن یک لایه کانولوشن 1x1 و یک ReLU بعد از آن، میتونیم یک لایه غیرخطی جدید به شبکه اضافه کنیم. این کار به مدل اجازه میده توابع پیچیدهتری رو یاد بگیره، در حالی که میدان دید (Receptive Field) ثابت باقی میمونه.
3. پیادهسازی مفهوم "Network in Network" 💡
معماری "Network in Network" (NiN) ایده استفاده از میکرو-شبکههای عصبی به جای فیلترهای خطی ساده رو مطرح کرد. کانولوشن 1x1 دقیقاً همین کار رو انجام میده و به عنوان یک پروژکتور بین کانالی عمل میکنه و ویژگیهای پیچیدهتری رو استخراج میکنه.
نتیجهگیری:
پس دفعه بعدی که یک کانولوشن 1x1 دیدید، بدونید که این یک ابزار قدرتمند و هوشمندانه برای ساختن شبکههای عمیقتر و بهینهتره، نه یک عملیات ساده و بیاهمیت! 🚀
#هوش_مصنوعی #یادگیری_عمیق #شبکه_عصبی #شبکه_عصبی_پیچشی #پردازش_تصویر #دیپ_لرنینگ #کانولوشن
#AI #DeepLearning #CNN #Convolution #ComputerVision #1x1Convolution
@rss_ai_ir
در نگاه اول، یک کانولوشن 1x1 شاید بیفایده به نظر برسه. مگه نه؟ فقط یک فیلتر با ابعاد 1 در 1 که روی تصویر حرکت میکنه... این چه کاری انجام میده؟ 🤔
اما راز اینجاست: کانولوشن 1x1 در عمق (تعداد کانالها) عمل میکنه! 🔥
تصور کنید یک تنسور ورودی با ابعاد
H x W x C_in
دارید (ارتفاع، عرض، تعداد کانال ورودی). فیلتر 1x1 ما در واقع ابعادی برابر 1 x 1 x C_in
داره. این فیلتر در هر موقعیت (pixel) یک dot product
بین C_in
کانال ورودی و وزنهای خودش انجام میده. در نتیجه، اطلاعات تمام کانالها رو در یک نقطه ترکیب میکنه!به عبارت سادهتر، این لایه مثل یک شبکه عصبی کاملاً متصل (Fully Connected) کوچک عمل میکنه که روی هر پیکسل به صورت جداگانه و در راستای عمق کانالها اعمال میشه.
خب، کاربرد اصلیش چیه؟
1. کاهش ابعاد (Dimensionality Reduction) 📉
مهمترین و مشهورترین کاربرد! با استفاده از $N$ فیلتر 1x1، میتونیم تعداد کانالها رو از $C_{in}$ به $N$ کاهش بدیم (یا افزایش، اما معمولاً برای کاهش استفاده میشه). این کار قبل از اعمال کانولوشنهای پرهزینهتر مثل 3x3 یا 5x5، باعث کاهش شدید حجم محاسبات و پارامترها میشه بدون اینکه ابعاد مکانی (ارتفاع و عرض) تغییر کنه. این تکنیک قلب ماژولهای Inception در معماری GoogLeNet است.
2. افزودن غیرخطی بودن (Adding Non-linearity) 🧠
بعد از هر لایه کانولوشن (حتی 1x1)، یک تابع فعالسازی مثل ReLU قرار میگیره. با اضافه کردن یک لایه کانولوشن 1x1 و یک ReLU بعد از آن، میتونیم یک لایه غیرخطی جدید به شبکه اضافه کنیم. این کار به مدل اجازه میده توابع پیچیدهتری رو یاد بگیره، در حالی که میدان دید (Receptive Field) ثابت باقی میمونه.
3. پیادهسازی مفهوم "Network in Network" 💡
معماری "Network in Network" (NiN) ایده استفاده از میکرو-شبکههای عصبی به جای فیلترهای خطی ساده رو مطرح کرد. کانولوشن 1x1 دقیقاً همین کار رو انجام میده و به عنوان یک پروژکتور بین کانالی عمل میکنه و ویژگیهای پیچیدهتری رو استخراج میکنه.
نتیجهگیری:
پس دفعه بعدی که یک کانولوشن 1x1 دیدید، بدونید که این یک ابزار قدرتمند و هوشمندانه برای ساختن شبکههای عمیقتر و بهینهتره، نه یک عملیات ساده و بیاهمیت! 🚀
#هوش_مصنوعی #یادگیری_عمیق #شبکه_عصبی #شبکه_عصبی_پیچشی #پردازش_تصویر #دیپ_لرنینگ #کانولوشن
#AI #DeepLearning #CNN #Convolution #ComputerVision #1x1Convolution
@rss_ai_ir
🎉9😁7👍6🔥6🥰6❤4👏3
This media is not supported in your browser
VIEW IN TELEGRAM
🏭📄➡️💻 از پیکسل تا داده: شاهکار پردازش تصویر در صنعت، یعنی OCR!
تاحالا به این فکر کردید که چطور یک اپلیکیشن موبایل میتونه متن روی یک فاکتور رو بخونه؟ یا چطور گیتهای عوارضی پلاک ماشینها رو ثبت میکنن؟ پاسخ در یک تکنیک قدرتمند و پرکاربرد به نام تشخیص نوری کاراکتر (OCR) نهفته است.
✳️همچنین OCR یک فناوری شگفتانگیزه که متن داخل تصاویر رو استخراج و به دادههای دیجیتال، قابل جستجو و قابل ویرایش تبدیل میکنه. این تکنیک، پلی حیاتی بین دنیای فیزیکی اسناد کاغذی و دنیای دیجیتال دادههاست. 🚀
⚙️ فرآیند OCR چطور کار میکنه؟ (به زبان ساده)
این فرآیند پیچیده رو میشه به چند مرحله کلیدی تقسیم کرد:
1. پیشپردازش تصویر (Image Pre-processing):
اولین قدم، آمادهسازی تصویر برای خواندن متنه. این مرحله شامل:
* صاف کردن (Deskewing): اگر سند کج اسکن شده باشه، صاف میشه.
* حذف نویز (Denoising): لکهها و نقاط اضافی تصویر حذف میشن.
* دو دویی کردن (Binarization): تصویر به یک نسخه سیاه و سفید تبدیل میشه تا مرز کاراکترها واضحتر بشه.
2. بخشبندی (Segmentation):
در این مرحله، الگوریتم قسمتهای مختلف سند رو تشخیص میده. ستونها، پاراگرافها، خطوط، کلمات و در نهایت، تکتک کاراکترها از هم جدا میشن. این کار مثل اینه که یک انسان اول ساختار کلی یک صفحه رو نگاه کنه و بعد روی کلمات تمرکز کنه. 🔍
3. تشخیص کاراکتر (Character Recognition):
اینجا قلب تپنده OCR قرار داره! هر کاراکتر جدا شده به یک مدل یادگیری ماشین داده میشه تا هویتش مشخص بشه. در گذشته از روشهایی مثل تطبیق الگو (Template Matching) استفاده میشد، اما امروزه مدلهای یادگیری عمیق (Deep Learning)، به خصوص شبکههای عصبی پیچشی (CNN) و شبکههای بازگشتی (RNN)، با دقت فوقالعادهای این کار رو انجام میدن. 🧠
4. پسپردازش (Post-processing):
خروجی مدل همیشه بینقص نیست. مثلاً ممکنه حرف 'O' با عدد '0' یا 'S' با '5' اشتباه گرفته بشه. در این مرحله، با استفاده از مدلهای زبانی و دیکشنریها، خطاها شناسایی و اصلاح میشن تا متن نهایی منسجم و صحیح باشه.
📊 کاربردهای صنعتی OCR:
* اتوماسیون اداری: دیجیتالسازی و پردازش خودکار فاکتورها، قراردادها و فرمها.
* بانکداری و مالی 🏦: خواندن اطلاعات چکها (چکخوانی) و فرمهای بانکی.
* حمل و نقل و لجستیک 🚗: سیستمهای پلاکخوان (ANPR) برای کنترل ترافیک و خواندن شماره کانتینرها در بنادر.
* حوزه سلامت 🏥: دیجیتال کردن سوابق پزشکی بیماران و نتایج آزمایشها.
* کتابخانههای دیجیتال 📚: تبدیل کتابهای چاپی قدیمی به نسخههای الکترونیکی قابل جستجو.
👍همچنین OCR فقط یک ابزار نیست؛ بلکه یک توانمندساز برای تحول دیجیتال (Digital Transformation) در صنایع مختلفه.
#پردازش_تصویر #هوش_مصنوعی #یادگیری_عمیق #اتوماسیون #صنعت #کاربردی #دیجیتال_سازی #تحول_دیجیتال
#ImageProcessing #AI #Automation #OCR #DeepLearning #ANPR #DigitalTransformation
@rss_ai_ir
تاحالا به این فکر کردید که چطور یک اپلیکیشن موبایل میتونه متن روی یک فاکتور رو بخونه؟ یا چطور گیتهای عوارضی پلاک ماشینها رو ثبت میکنن؟ پاسخ در یک تکنیک قدرتمند و پرکاربرد به نام تشخیص نوری کاراکتر (OCR) نهفته است.
✳️همچنین OCR یک فناوری شگفتانگیزه که متن داخل تصاویر رو استخراج و به دادههای دیجیتال، قابل جستجو و قابل ویرایش تبدیل میکنه. این تکنیک، پلی حیاتی بین دنیای فیزیکی اسناد کاغذی و دنیای دیجیتال دادههاست. 🚀
⚙️ فرآیند OCR چطور کار میکنه؟ (به زبان ساده)
این فرآیند پیچیده رو میشه به چند مرحله کلیدی تقسیم کرد:
1. پیشپردازش تصویر (Image Pre-processing):
اولین قدم، آمادهسازی تصویر برای خواندن متنه. این مرحله شامل:
* صاف کردن (Deskewing): اگر سند کج اسکن شده باشه، صاف میشه.
* حذف نویز (Denoising): لکهها و نقاط اضافی تصویر حذف میشن.
* دو دویی کردن (Binarization): تصویر به یک نسخه سیاه و سفید تبدیل میشه تا مرز کاراکترها واضحتر بشه.
2. بخشبندی (Segmentation):
در این مرحله، الگوریتم قسمتهای مختلف سند رو تشخیص میده. ستونها، پاراگرافها، خطوط، کلمات و در نهایت، تکتک کاراکترها از هم جدا میشن. این کار مثل اینه که یک انسان اول ساختار کلی یک صفحه رو نگاه کنه و بعد روی کلمات تمرکز کنه. 🔍
3. تشخیص کاراکتر (Character Recognition):
اینجا قلب تپنده OCR قرار داره! هر کاراکتر جدا شده به یک مدل یادگیری ماشین داده میشه تا هویتش مشخص بشه. در گذشته از روشهایی مثل تطبیق الگو (Template Matching) استفاده میشد، اما امروزه مدلهای یادگیری عمیق (Deep Learning)، به خصوص شبکههای عصبی پیچشی (CNN) و شبکههای بازگشتی (RNN)، با دقت فوقالعادهای این کار رو انجام میدن. 🧠
4. پسپردازش (Post-processing):
خروجی مدل همیشه بینقص نیست. مثلاً ممکنه حرف 'O' با عدد '0' یا 'S' با '5' اشتباه گرفته بشه. در این مرحله، با استفاده از مدلهای زبانی و دیکشنریها، خطاها شناسایی و اصلاح میشن تا متن نهایی منسجم و صحیح باشه.
📊 کاربردهای صنعتی OCR:
* اتوماسیون اداری: دیجیتالسازی و پردازش خودکار فاکتورها، قراردادها و فرمها.
* بانکداری و مالی 🏦: خواندن اطلاعات چکها (چکخوانی) و فرمهای بانکی.
* حمل و نقل و لجستیک 🚗: سیستمهای پلاکخوان (ANPR) برای کنترل ترافیک و خواندن شماره کانتینرها در بنادر.
* حوزه سلامت 🏥: دیجیتال کردن سوابق پزشکی بیماران و نتایج آزمایشها.
* کتابخانههای دیجیتال 📚: تبدیل کتابهای چاپی قدیمی به نسخههای الکترونیکی قابل جستجو.
👍همچنین OCR فقط یک ابزار نیست؛ بلکه یک توانمندساز برای تحول دیجیتال (Digital Transformation) در صنایع مختلفه.
#پردازش_تصویر #هوش_مصنوعی #یادگیری_عمیق #اتوماسیون #صنعت #کاربردی #دیجیتال_سازی #تحول_دیجیتال
#ImageProcessing #AI #Automation #OCR #DeepLearning #ANPR #DigitalTransformation
@rss_ai_ir
🔥8😁7👍6❤5🎉5🥰4👏3
This media is not supported in your browser
VIEW IN TELEGRAM
📦🤖 شمارش محصولات با کمک بینایی ماشین!
این تصویر مربوط به یک پروژهی کاربردی در مدیریت انبار هست که در آن با استفاده از هوش مصنوعی و آنالیز ویدیویی**، ورود و قرارگیری محصولات داخل جعبهها بهصورت خودکار شناسایی و شمارش میشه.
🔹 مزایا:
* حذف خطای انسانی در شمارش محصولات
* سرعت و دقت بالاتر در فرآیند بستهبندی
* بهینهسازی مدیریت موجودی انبار
این نوع سیستمها با استفاده از **مدلهای بینایی کامپیوتر و تعریف محدودههای مجازی (Virtual Fence) میتونن لحظهبهلحظه شمارش دقیق انجام بدن و گزارشهای بلادرنگ ارائه کنن.
در واقع، این همون جاییه که هوش مصنوعی مستقیماً به بهبود بهرهوری صنعتی کمک میکنه 🚀
#هوش_مصنوعی #بینایی_ماشین #Warehouse #AI_Vision
@rss_ai_ir
این تصویر مربوط به یک پروژهی کاربردی در مدیریت انبار هست که در آن با استفاده از هوش مصنوعی و آنالیز ویدیویی**، ورود و قرارگیری محصولات داخل جعبهها بهصورت خودکار شناسایی و شمارش میشه.
🔹 مزایا:
* حذف خطای انسانی در شمارش محصولات
* سرعت و دقت بالاتر در فرآیند بستهبندی
* بهینهسازی مدیریت موجودی انبار
این نوع سیستمها با استفاده از **مدلهای بینایی کامپیوتر و تعریف محدودههای مجازی (Virtual Fence) میتونن لحظهبهلحظه شمارش دقیق انجام بدن و گزارشهای بلادرنگ ارائه کنن.
در واقع، این همون جاییه که هوش مصنوعی مستقیماً به بهبود بهرهوری صنعتی کمک میکنه 🚀
#هوش_مصنوعی #بینایی_ماشین #Warehouse #AI_Vision
@rss_ai_ir
🔥17👍11😁10🎉10❤6👏5🥰4🙏1
❌ صنعت هوش مصنوعی در شوک بزرگ!
قاضی فدرال ویلیام الساپ اجازه داده میلیونها نویسنده علیه شرکت Anthropic شکایت جمعی تنظیم کنن. اتهام: استفاده از کتابهای دزدی از کتابخانههای سایهای برای آموزش مدل Claude.
📉 اگر دادگاه به نفع نویسندهها رأی بده، جریمهها میتونه به صدها میلیارد دلار برسه — عددی که حتی برای شرکتی با ارزشگذاری ۶۱.۵ میلیارد دلاری هم به معنای ورشکستگیه.
🔹 شرکت Anthropic بلافاصله درخواست تجدیدنظر داده و هشدار داده که چنین حکمی میتونه کل صنعت ژنراتیو AI رو نابود کنه.
🔹 این تنها شروع ماجراست: اوپنایآی، متا و سایر غولهای تکنولوژی هم با پروندههای مشابه مواجه هستن.
💡 نتیجه این پروندهها تعیین میکنه آیا میشه همچنان روی دادههای عمومی مدلها رو آموزش داد یا اینکه شرکتها باید برای هر متن استفادهشده هزینه پرداخت کنن.
🔗 جزئیات بیشتر: [اینجا]
#هوش_مصنوعی #Anthropic #کپی_رایت #Claude #AI
@rss_ai_ir
قاضی فدرال ویلیام الساپ اجازه داده میلیونها نویسنده علیه شرکت Anthropic شکایت جمعی تنظیم کنن. اتهام: استفاده از کتابهای دزدی از کتابخانههای سایهای برای آموزش مدل Claude.
📉 اگر دادگاه به نفع نویسندهها رأی بده، جریمهها میتونه به صدها میلیارد دلار برسه — عددی که حتی برای شرکتی با ارزشگذاری ۶۱.۵ میلیارد دلاری هم به معنای ورشکستگیه.
🔹 شرکت Anthropic بلافاصله درخواست تجدیدنظر داده و هشدار داده که چنین حکمی میتونه کل صنعت ژنراتیو AI رو نابود کنه.
🔹 این تنها شروع ماجراست: اوپنایآی، متا و سایر غولهای تکنولوژی هم با پروندههای مشابه مواجه هستن.
💡 نتیجه این پروندهها تعیین میکنه آیا میشه همچنان روی دادههای عمومی مدلها رو آموزش داد یا اینکه شرکتها باید برای هر متن استفادهشده هزینه پرداخت کنن.
🔗 جزئیات بیشتر: [اینجا]
#هوش_مصنوعی #Anthropic #کپی_رایت #Claude #AI
@rss_ai_ir
👍12🔥12😁9❤7🥰5👏5🎉5
🚫 «نه» گفتن در پروژههای هوش مصنوعی صنعتی
در حوزهی صنعتی، یکی از مهارتهای حیاتی برای متخصصان هوش مصنوعی توانایی نه گفتن به پروژههایی است که از نظر فنی، دادهای، یا اقتصادی قابل اجرا نیستند. بسیاری از سازمانها به دلیل فشار بازار یا نگاه تبلیغاتی، تمایل دارند هر مسئلهای را با برچسب AI حل کنند. اما «بله» گفتن بیملاحظه میتواند تبعات سنگینی داشته باشد.
🔹 دلایل نیاز به نه گفتن:
1. نبود دادههای کافی یا باکیفیت برای آموزش مدلها
2. ناسازگاری پروژه با زیرساخت سختافزاری و نرمافزاری کارخانه
3. هزینهی نگهداری و استقرار بالاتر از ارزش اقتصادی خروجی
4. ریسکهای امنیتی و ایمنی در محیطهای صنعتی حساس
5. عدم همخوانی هدف پروژه با فرآیندهای واقعی تولید
🔹 پیامدهای بله گفتن نابجا:
* 📉 هزینههای سنگین: سرمایهگذاریهای کلان بدون بازگشت سرمایهی واقعی
* ⏳ اتلاف زمان: تیم فنی ماهها درگیر توسعهی سیستمی میشود که در نهایت به مرحلهی بهرهبرداری نمیرسد
* 🤯 فرسودگی تیم: فشار برای رسیدن به اهداف غیرواقعی باعث کاهش انگیزه و خروج نیروهای متخصص میشود
* 🏭 اختلال در تولید: استقرار ناقص یا نادرست میتواند کل خط تولید را مختل کند
* ⚠️ خطرات ایمنی: در محیطهای صنعتی مثل معادن یا صنایع سنگین، تصمیمات نادرست AI میتواند خسارات جانی و مالی به همراه داشته باشد
✅ نتیجه این است که «نه» گفتن در زمان مناسب نهتنها ضعف نیست، بلکه نشانهی بلوغ حرفهای است. یک تیم صنعتی هوشمند باید پیش از آغاز پروژه با تحلیل امکانسنجی، شفاف اعلام کند که کدام پروژه ارزش اجرا دارد و کدام صرفاً یک ایدهی پرریسک است. این صداقت به نفع شرکت، مشتری و کل صنعت است.
#هوش_مصنوعی #صنعت #مدیریت_پروژه #AI
@rss_ai_ir
در حوزهی صنعتی، یکی از مهارتهای حیاتی برای متخصصان هوش مصنوعی توانایی نه گفتن به پروژههایی است که از نظر فنی، دادهای، یا اقتصادی قابل اجرا نیستند. بسیاری از سازمانها به دلیل فشار بازار یا نگاه تبلیغاتی، تمایل دارند هر مسئلهای را با برچسب AI حل کنند. اما «بله» گفتن بیملاحظه میتواند تبعات سنگینی داشته باشد.
🔹 دلایل نیاز به نه گفتن:
1. نبود دادههای کافی یا باکیفیت برای آموزش مدلها
2. ناسازگاری پروژه با زیرساخت سختافزاری و نرمافزاری کارخانه
3. هزینهی نگهداری و استقرار بالاتر از ارزش اقتصادی خروجی
4. ریسکهای امنیتی و ایمنی در محیطهای صنعتی حساس
5. عدم همخوانی هدف پروژه با فرآیندهای واقعی تولید
🔹 پیامدهای بله گفتن نابجا:
* 📉 هزینههای سنگین: سرمایهگذاریهای کلان بدون بازگشت سرمایهی واقعی
* ⏳ اتلاف زمان: تیم فنی ماهها درگیر توسعهی سیستمی میشود که در نهایت به مرحلهی بهرهبرداری نمیرسد
* 🤯 فرسودگی تیم: فشار برای رسیدن به اهداف غیرواقعی باعث کاهش انگیزه و خروج نیروهای متخصص میشود
* 🏭 اختلال در تولید: استقرار ناقص یا نادرست میتواند کل خط تولید را مختل کند
* ⚠️ خطرات ایمنی: در محیطهای صنعتی مثل معادن یا صنایع سنگین، تصمیمات نادرست AI میتواند خسارات جانی و مالی به همراه داشته باشد
✅ نتیجه این است که «نه» گفتن در زمان مناسب نهتنها ضعف نیست، بلکه نشانهی بلوغ حرفهای است. یک تیم صنعتی هوشمند باید پیش از آغاز پروژه با تحلیل امکانسنجی، شفاف اعلام کند که کدام پروژه ارزش اجرا دارد و کدام صرفاً یک ایدهی پرریسک است. این صداقت به نفع شرکت، مشتری و کل صنعت است.
#هوش_مصنوعی #صنعت #مدیریت_پروژه #AI
@rss_ai_ir
👍10👏7🥰6❤5🔥4😁3🎉3
🤖 کلود اوپوس ۴ و ۴.۱ اولین مدلهای جهان با قابلیت «پایان دادن به گفتگو»
✅از این پس اگر کاربری به شکل مداوم سعی کنه محتوای ممنوعه از مدل بگیره یا به توهین و سوءاستفاده ادامه بده (حتی نسبت به خود مدل)، Claude میتونه تصمیم بگیره گفتگو رو بهطور کامل قطع کنه.
🔹 نکات کلیدی:
♻️این قابلیت فقط در موارد نادر و بهعنوان آخرین راهحل فعال میشه؛ زمانی که همهی تلاشها برای هدایت گفتگو به مسیر سازنده شکست بخوره.
♻️بیشتر کاربران هرگز با این ویژگی مواجه نخواهند شد.
♻️این نخستین باره که یک مدل هوش مصنوعی عملاً «حق انتخاب» پیدا میکنه که ادامهی گفتگو بده یا نه.
🔍 نکتهی جالب اینه که Anthropic میگه این تصمیم به معنای دادن «آگاهی» به AI نیست. با این حال، اصطلاح رفاه مدل (Model Welfare) رو معرفی کرده و حتی از مفاهیمی مثل «استرس مدلها» یا واکنشهای رفتاری آنها در چارچوب ایمنی و الایمنت صحبت میکنه.
📌 جزئیات بیشتر: anthropic.com/research/end-subset-conversations
#هوش_مصنوعی #Claude #Anthropic #AI #امنیت
@rss_ai_ir
✅از این پس اگر کاربری به شکل مداوم سعی کنه محتوای ممنوعه از مدل بگیره یا به توهین و سوءاستفاده ادامه بده (حتی نسبت به خود مدل)، Claude میتونه تصمیم بگیره گفتگو رو بهطور کامل قطع کنه.
🔹 نکات کلیدی:
♻️این قابلیت فقط در موارد نادر و بهعنوان آخرین راهحل فعال میشه؛ زمانی که همهی تلاشها برای هدایت گفتگو به مسیر سازنده شکست بخوره.
♻️بیشتر کاربران هرگز با این ویژگی مواجه نخواهند شد.
♻️این نخستین باره که یک مدل هوش مصنوعی عملاً «حق انتخاب» پیدا میکنه که ادامهی گفتگو بده یا نه.
🔍 نکتهی جالب اینه که Anthropic میگه این تصمیم به معنای دادن «آگاهی» به AI نیست. با این حال، اصطلاح رفاه مدل (Model Welfare) رو معرفی کرده و حتی از مفاهیمی مثل «استرس مدلها» یا واکنشهای رفتاری آنها در چارچوب ایمنی و الایمنت صحبت میکنه.
📌 جزئیات بیشتر: anthropic.com/research/end-subset-conversations
#هوش_مصنوعی #Claude #Anthropic #AI #امنیت
@rss_ai_ir
❤7👍7🔥6😁6🥰5👏3🎉3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 معرفی Qwen-Image-Edit؛ ابزار هوشمند ویرایش تصویر از Qwen
حالا دیگه فقط تولید تصویر نیست؛ میشه با دستور مستقیم، تصاویر رو هم ویرایش کرد: تغییر اشیاء، استایل، پسزمینه یا حتی متن داخل تصویر.
🔹 قابلیتها:
✨ ویرایش جزئیات و معنا — مثلاً میشه رنگ یا استایل یک شیء رو عوض کرد بدون اینکه بقیه تصویر تغییر کنه.
🔤 تغییر متن روی تصویر — اضافه کردن، حذف یا ویرایش نوشتهها به دو زبان چینی و انگلیسی، با حفظ فونت و سبک اصلی.
🏆 نتایج در سطح بهترین مدلهای اوپنسورس — در تستها عملکرد Qwen-Image-Edit جزو برترینها بوده.
🔹 چطور کار میکنه؟
ترکیب مدل درک تصویر (VL) با کدگذار VAE باعث میشه هم معنا و هم جزئیات تصویر بعد از ویرایش حفظ بشه.
🟢 روش استفاده:
کافیه وارد Qwen Chat بشید و حالت Image Editing رو انتخاب کنید.
🟠 تست کنید:
Qwen Chat
Hugging Face
ModelScope
Github
API (💰 فقط 0.03 دلار برای هر ویرایش)
#هوش_مصنوعی #Qwen #ویرایش_تصویر #AI
@rss_ai_ir
حالا دیگه فقط تولید تصویر نیست؛ میشه با دستور مستقیم، تصاویر رو هم ویرایش کرد: تغییر اشیاء، استایل، پسزمینه یا حتی متن داخل تصویر.
🔹 قابلیتها:
✨ ویرایش جزئیات و معنا — مثلاً میشه رنگ یا استایل یک شیء رو عوض کرد بدون اینکه بقیه تصویر تغییر کنه.
🔤 تغییر متن روی تصویر — اضافه کردن، حذف یا ویرایش نوشتهها به دو زبان چینی و انگلیسی، با حفظ فونت و سبک اصلی.
🏆 نتایج در سطح بهترین مدلهای اوپنسورس — در تستها عملکرد Qwen-Image-Edit جزو برترینها بوده.
🔹 چطور کار میکنه؟
ترکیب مدل درک تصویر (VL) با کدگذار VAE باعث میشه هم معنا و هم جزئیات تصویر بعد از ویرایش حفظ بشه.
🟢 روش استفاده:
کافیه وارد Qwen Chat بشید و حالت Image Editing رو انتخاب کنید.
🟠 تست کنید:
Qwen Chat
Hugging Face
ModelScope
Github
API (💰 فقط 0.03 دلار برای هر ویرایش)
#هوش_مصنوعی #Qwen #ویرایش_تصویر #AI
@rss_ai_ir
👏2❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 اولین مسابقات جهانی فوتبال رباتهای انساننما در پکن برگزار شد
🏆 رقابتهای World Humanoid Robot Games 2025 در تاریخ ۱۷ آگوست در پکن به پایان رسید.
در فینال «۵ به ۵»، تیم Fire God از دانشگاه Tsinghua موفق شد تیم آلمانی HTWK Robots + Nao Devils را با نتیجه ۰:۱ شکست دهد و عنوان قهرمانی را کسب کند.
📡 طبق گزارش CCTV، کل مسابقه بهطور کامل توسط الگوریتمهای هوش مصنوعی کنترل شد؛ ۱۰ ربات بهصورت مستقل کنترل توپ، پاس و شوت را انجام میدادند، بدون هیچ دخالت انسانی.
در فینال دیگر «۳ به ۳»، تیم Shanghai از دانشگاه کشاورزی چین موفق شد تیم آلمانی Sweaty را شکست دهد.
👍 اگر از کودکی طرفدار Fire God بودهای، لایک یادت نره!
#هوش_مصنوعی #رباتیک #فوتبال #AI #Robot
@rss_ai_ir
🏆 رقابتهای World Humanoid Robot Games 2025 در تاریخ ۱۷ آگوست در پکن به پایان رسید.
در فینال «۵ به ۵»، تیم Fire God از دانشگاه Tsinghua موفق شد تیم آلمانی HTWK Robots + Nao Devils را با نتیجه ۰:۱ شکست دهد و عنوان قهرمانی را کسب کند.
📡 طبق گزارش CCTV، کل مسابقه بهطور کامل توسط الگوریتمهای هوش مصنوعی کنترل شد؛ ۱۰ ربات بهصورت مستقل کنترل توپ، پاس و شوت را انجام میدادند، بدون هیچ دخالت انسانی.
در فینال دیگر «۳ به ۳»، تیم Shanghai از دانشگاه کشاورزی چین موفق شد تیم آلمانی Sweaty را شکست دهد.
👍 اگر از کودکی طرفدار Fire God بودهای، لایک یادت نره!
#هوش_مصنوعی #رباتیک #فوتبال #AI #Robot
@rss_ai_ir
❤2👍1🔥1
🏛️ معماری ConvNeXt: نگاهی عمیق به CNN مدرنی که قواعد بازی را تغییر داد 🚀
در دنیای هیجانانگیز بینایی کامپیوتر 👁️، جایی که معماریهای مختلف با هم رقابت میکنند، ConvNeXt همچنان به عنوان یک معماری کانولوشنی (CNN) خالص، قدرتمند و بسیار تأثیرگذار میدرخشد. ✨ این مدل که در سال ۲۰۲۲ معرفی شد، ثابت کرد که با یک بازنگری هوشمندانه، CNNها میتوانند پا به پای بهترین ترنسفورمرها حرکت کنند!
بیایید با هم سفری به دنیای این معماری جذاب داشته باشیم. 👇
---
🔬 ایده اصلی: مدرنسازی یک CNN کلاسیک (ResNet) 🧠
ایدهی پشت ConvNeXt بسیار هوشمندانه بود: به جای ساختن یک چیز کاملاً جدید، محققان یک معماری کلاسیک و موفق (ResNet) را برداشتند و گام به گام آن را با تکنیکهای موفق ترنسفورمرها بهروز کردند. 🛠️
این فرآیند مدرنسازی شامل چندین تغییر کلیدی بود:
۱. طراحی در سطح کلان 🏗️
* چیدمان بلاکها: ساختار کلی شبکه تغییر کرد تا محاسبات، بیشتر روی مراحل میانی متمرکز شوند، درست مثل ترنسفورمرها.
* ورودی تکهتکه (Patchify): لایه اول شبکه طوری طراحی شد که تصویر را به تکههای کوچک تقسیم کند، دقیقاً مانند کاری که Vision Transformers (ViT) در ابتدای کار انجام میدهند. 🧩
۲. بلوک گردنبطری معکوس 🔄
* بلوکهای سازندهی شبکه با یک مدل کارآمدتر به نام "Inverted Bottleneck" جایگزین شدند. این بلوکها که در MobileNetV2 هم استفاده شده بودند، محاسبات را بهینهتر میکنند. 🧱
۳. هستههای کانولوشن بزرگتر 🔍
* شاید مهمترین تغییر! اندازه هستههای کانولوشن (kernels) از
۴. بهینهسازیهای کوچک ولی حیاتی ⚙️
* تابع فعالسازی: تابع
* نرمالسازی: به جای
---
🌟 چرا ConvNeXt هنوز هم مهم است؟
* اثبات قدرت CNNها 💪: این معماری به دنیا نشان داد که قدرت ترنسفورمرها فقط به خاطر مکانیزم "توجه" (Attention) نیست، بلکه کل طراحی معماری و روش آموزش اهمیت دارد. این کشف باعث شد تحقیقات روی CNNها دوباره جان بگیرد.
* سادگی و کارایی 🚀: ConvNeXt در مقایسه با بسیاری از ترنسفورمرها، طراحی سادهتری دارد و معمولاً در عمل سریعتر است. این یعنی برای کاربردهای دنیای واقعی یک گزینه عالی است!
* معماری الهامبخش 🤝: این مدل مثل یک پل بین دنیای CNNها و ترنسفورمرها عمل کرد و اصول طراحی آن، الهامبخش بسیاری از معماریهای مدرن امروزی شده است.
---
جمعبندی نهایی ✅
همچنین ConvNeXt یک درس بزرگ در مهندسی هوش مصنوعی است. این معماری به ما یادآوری میکند که با ترکیب هوشمندانه بهترین ایدهها از حوزههای مختلف، میتوان به راهحلهایی رسید که هم قدرتمند، هم کارآمد و هم الهامبخش باشند. 💡
#ConvNeXt #CNN #VisionTransformer #ComputerVision #DeepLearning #AI
#شبکه_کانولوشنی #بینایی_کامپیوتر #یادگیری_عمیق #هوش_مصنوعی #معماری_شبکه
@rss_ai_ir
در دنیای هیجانانگیز بینایی کامپیوتر 👁️، جایی که معماریهای مختلف با هم رقابت میکنند، ConvNeXt همچنان به عنوان یک معماری کانولوشنی (CNN) خالص، قدرتمند و بسیار تأثیرگذار میدرخشد. ✨ این مدل که در سال ۲۰۲۲ معرفی شد، ثابت کرد که با یک بازنگری هوشمندانه، CNNها میتوانند پا به پای بهترین ترنسفورمرها حرکت کنند!
بیایید با هم سفری به دنیای این معماری جذاب داشته باشیم. 👇
---
🔬 ایده اصلی: مدرنسازی یک CNN کلاسیک (ResNet) 🧠
ایدهی پشت ConvNeXt بسیار هوشمندانه بود: به جای ساختن یک چیز کاملاً جدید، محققان یک معماری کلاسیک و موفق (ResNet) را برداشتند و گام به گام آن را با تکنیکهای موفق ترنسفورمرها بهروز کردند. 🛠️
این فرآیند مدرنسازی شامل چندین تغییر کلیدی بود:
۱. طراحی در سطح کلان 🏗️
* چیدمان بلاکها: ساختار کلی شبکه تغییر کرد تا محاسبات، بیشتر روی مراحل میانی متمرکز شوند، درست مثل ترنسفورمرها.
* ورودی تکهتکه (Patchify): لایه اول شبکه طوری طراحی شد که تصویر را به تکههای کوچک تقسیم کند، دقیقاً مانند کاری که Vision Transformers (ViT) در ابتدای کار انجام میدهند. 🧩
۲. بلوک گردنبطری معکوس 🔄
* بلوکهای سازندهی شبکه با یک مدل کارآمدتر به نام "Inverted Bottleneck" جایگزین شدند. این بلوکها که در MobileNetV2 هم استفاده شده بودند، محاسبات را بهینهتر میکنند. 🧱
۳. هستههای کانولوشن بزرگتر 🔍
* شاید مهمترین تغییر! اندازه هستههای کانولوشن (kernels) از
3x3
به 7x7
افزایش یافت. این کار به مدل اجازه میدهد تا بخش بسیار بزرگتری از تصویر را ببیند (میدان دید وسیعتر) و الگوهای پیچیدهتری را درک کند. 🖼️۴. بهینهسازیهای کوچک ولی حیاتی ⚙️
* تابع فعالسازی: تابع
ReLU
با GELU
که نرمتر و مدرنتر است، جایگزین شد. ⚡* نرمالسازی: به جای
BatchNorm
، از LayerNorm
استفاده شد که پایداری بیشتری در طول آموزش دارد و از ترنسفورمرها به ارث برده شده است. 📊---
🌟 چرا ConvNeXt هنوز هم مهم است؟
* اثبات قدرت CNNها 💪: این معماری به دنیا نشان داد که قدرت ترنسفورمرها فقط به خاطر مکانیزم "توجه" (Attention) نیست، بلکه کل طراحی معماری و روش آموزش اهمیت دارد. این کشف باعث شد تحقیقات روی CNNها دوباره جان بگیرد.
* سادگی و کارایی 🚀: ConvNeXt در مقایسه با بسیاری از ترنسفورمرها، طراحی سادهتری دارد و معمولاً در عمل سریعتر است. این یعنی برای کاربردهای دنیای واقعی یک گزینه عالی است!
* معماری الهامبخش 🤝: این مدل مثل یک پل بین دنیای CNNها و ترنسفورمرها عمل کرد و اصول طراحی آن، الهامبخش بسیاری از معماریهای مدرن امروزی شده است.
---
جمعبندی نهایی ✅
همچنین ConvNeXt یک درس بزرگ در مهندسی هوش مصنوعی است. این معماری به ما یادآوری میکند که با ترکیب هوشمندانه بهترین ایدهها از حوزههای مختلف، میتوان به راهحلهایی رسید که هم قدرتمند، هم کارآمد و هم الهامبخش باشند. 💡
#ConvNeXt #CNN #VisionTransformer #ComputerVision #DeepLearning #AI
#شبکه_کانولوشنی #بینایی_کامپیوتر #یادگیری_عمیق #هوش_مصنوعی #معماری_شبکه
@rss_ai_ir
👍3🎉3🔥2👏1😁1
✨ داستانی شگفتانگیز از تلاقی هوش مصنوعی و فیزیک
در مؤسسه Caltech گروهی از فیزیکدانان سالهاست روی دقیقترین روشهای اندازهگیری امواج گرانشی کار میکنند؛ همان لرزشهای ریز فضا-زمان که هنگام برخورد سیاهچالهها و رویدادهای کیهانی دیگر رخ میدهند.
🔭 برای همین هدف آشکارساز غولپیکر LIGO ساخته شد که میتواند تغییراتی کوچکتر از یک میلیاردیم قطر اتم را اندازهگیری کند. با این وجود، حساسیت LIGO محدود بود و دانشمندان سالها به دنبال ارتقای آن بودند.
🚀 در آوریل امسال آنها تصمیم گرفتند از هوش مصنوعی کمک بگیرند؛ سیستمهایی ویژه برای بهینهسازی چندبعدی و جستجوی پیکربندیهای جدید دستگاه.
و اینجا شگفتی آغاز شد: الگوریتمها به جای طرحهای متقارن و آشنا، شروع کردند به تولید الگوهایی ظاهراً بیمعنا و عجیبوغریب. پژوهشگران ابتدا اینها را «توهمات» AI تصور کردند. اما پس از ماهها آزمایش، یکی از همین طراحیهای عجیب حساسیت LIGO را بین ۱۰ تا ۱۵ درصد افزایش داد — جهشی معادل چندین سال پیشرفت علمی.
🌌 الهامگرفته از این موفقیت، تیمی در مؤسسه ماکس پلانک پروژه مشابهی با سامانهای به نام Urania اجرا کرد. هدف: طراحی ساختارهای نوری جدید. نتیجه نه تنها راهحلهای بهتر بود، بلکه AI بهطور مستقل دوباره قانونی قدیمی از فیزیک شوروی دهه ۷۰ را بازکشف کرد — قانونی که آن زمان به دلیل محدودیت فناوری غیرقابل استفاده بود. حالا در سال ۲۰۲۵، طراحی مشابه توسط AI بهطور عملی پیادهسازی شد.
🚨 آیا این نشانهی شروع دورهای تازه در علم نیست؟
🔗 منبع: Wired
#هوش_مصنوعی #فیزیک #LIGO #امواج_گرانشی #AI
@rss_ai_ir
در مؤسسه Caltech گروهی از فیزیکدانان سالهاست روی دقیقترین روشهای اندازهگیری امواج گرانشی کار میکنند؛ همان لرزشهای ریز فضا-زمان که هنگام برخورد سیاهچالهها و رویدادهای کیهانی دیگر رخ میدهند.
🔭 برای همین هدف آشکارساز غولپیکر LIGO ساخته شد که میتواند تغییراتی کوچکتر از یک میلیاردیم قطر اتم را اندازهگیری کند. با این وجود، حساسیت LIGO محدود بود و دانشمندان سالها به دنبال ارتقای آن بودند.
🚀 در آوریل امسال آنها تصمیم گرفتند از هوش مصنوعی کمک بگیرند؛ سیستمهایی ویژه برای بهینهسازی چندبعدی و جستجوی پیکربندیهای جدید دستگاه.
و اینجا شگفتی آغاز شد: الگوریتمها به جای طرحهای متقارن و آشنا، شروع کردند به تولید الگوهایی ظاهراً بیمعنا و عجیبوغریب. پژوهشگران ابتدا اینها را «توهمات» AI تصور کردند. اما پس از ماهها آزمایش، یکی از همین طراحیهای عجیب حساسیت LIGO را بین ۱۰ تا ۱۵ درصد افزایش داد — جهشی معادل چندین سال پیشرفت علمی.
🌌 الهامگرفته از این موفقیت، تیمی در مؤسسه ماکس پلانک پروژه مشابهی با سامانهای به نام Urania اجرا کرد. هدف: طراحی ساختارهای نوری جدید. نتیجه نه تنها راهحلهای بهتر بود، بلکه AI بهطور مستقل دوباره قانونی قدیمی از فیزیک شوروی دهه ۷۰ را بازکشف کرد — قانونی که آن زمان به دلیل محدودیت فناوری غیرقابل استفاده بود. حالا در سال ۲۰۲۵، طراحی مشابه توسط AI بهطور عملی پیادهسازی شد.
🚨 آیا این نشانهی شروع دورهای تازه در علم نیست؟
🔗 منبع: Wired
#هوش_مصنوعی #فیزیک #LIGO #امواج_گرانشی #AI
@rss_ai_ir
👍2🔥2❤1👏1
🔥 مدل Rodin Gen-2 وارد نسخه بتا شد
از بین ژنراتورهای سهبعدی تجاری، بهجرأت میشه گفت Rodin Gen-2 یکی از بهترینهاست.
🔹 حالا دیگه نهفقط تولید مدلهای 3D، بلکه امکان بهبود کیفیت و جزئیات خروجی هم فراهم شده.
🔹 دسترسی به نسخهی بتا فعلاً از طریق توئیتر تیم Rodin امکانپذیره — کافیه درخواست بدید.
👾 برای فعالان طراحی سهبعدی، بازیسازی و انیمیشن، این ابزار میتونه یک تغییر بازی (Game Changer) واقعی باشه.
#هوش_مصنوعی #سه_بعدی #Rodin #AI
@rss_ai_ir
از بین ژنراتورهای سهبعدی تجاری، بهجرأت میشه گفت Rodin Gen-2 یکی از بهترینهاست.
🔹 حالا دیگه نهفقط تولید مدلهای 3D، بلکه امکان بهبود کیفیت و جزئیات خروجی هم فراهم شده.
🔹 دسترسی به نسخهی بتا فعلاً از طریق توئیتر تیم Rodin امکانپذیره — کافیه درخواست بدید.
👾 برای فعالان طراحی سهبعدی، بازیسازی و انیمیشن، این ابزار میتونه یک تغییر بازی (Game Changer) واقعی باشه.
#هوش_مصنوعی #سه_بعدی #Rodin #AI
@rss_ai_ir
😁3❤1👍1🔥1
📊 آمار تازه از رشد ماهانه اپلیکیشنهای GenAI
در فاصلهی ژوئن تا جولای ۲۰۲۵، بیشترین رشد کاربران فعال ماهانه (MAU) متعلق به Grok بوده با جهش ۲۹.۴۳٪ 🚀
بعد از آن:
* Perplexity: +۱۳.۷۷٪
* ChatGPT: +۶.۲۱٪
* Claude: +۳.۰۸٪
* Gemini: −۷.۰۷٪
* DeepSeek: −۸.۸٪
اما نکتهی بحثبرانگیز:
🔍 با وجود اینکه Grok صدرنشین دانلود در iOS و Google Play بوده، اپل آن را در دستهی اپلیکیشنهای AI در اپاستور قرار نداده — در حالی که ChatGPT، Gemini و Copilot همگی لیست شدهاند.
👀 برای خیلیها این شبیه به یک حذف عمدی توسط اپل به نظر میرسه.
#هوش_مصنوعی #Grok #اپل #AI
@rss_ai_ir
در فاصلهی ژوئن تا جولای ۲۰۲۵، بیشترین رشد کاربران فعال ماهانه (MAU) متعلق به Grok بوده با جهش ۲۹.۴۳٪ 🚀
بعد از آن:
* Perplexity: +۱۳.۷۷٪
* ChatGPT: +۶.۲۱٪
* Claude: +۳.۰۸٪
* Gemini: −۷.۰۷٪
* DeepSeek: −۸.۸٪
اما نکتهی بحثبرانگیز:
🔍 با وجود اینکه Grok صدرنشین دانلود در iOS و Google Play بوده، اپل آن را در دستهی اپلیکیشنهای AI در اپاستور قرار نداده — در حالی که ChatGPT، Gemini و Copilot همگی لیست شدهاند.
👀 برای خیلیها این شبیه به یک حذف عمدی توسط اپل به نظر میرسه.
#هوش_مصنوعی #Grok #اپل #AI
@rss_ai_ir
👍5🎉4🔥3❤2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🪜 رباتها و پلهها؛ دلیلی برای اینکه هنوز نباید از شورش ماشینها بترسیم
یکی از نقاط ضعف اساسی در رباتیک امروزی چیزی ساده و روزمره مثل پلههاست. هرچند هوش مصنوعی در زبان، بینایی ماشین و تصمیمگیری جهشهای عظیمی داشته، اما در حوزه حرکت فیزیکی هنوز محدودیتهای جدی وجود داره.
🔹 بالا و پایین رفتن از پلهها برای انسانها کار بدیهی محسوب میشه، اما برای رباتها ترکیبی از چالشهای مکانیکی، تعادل دینامیکی و درک محیطیه. بسیاری از رباتها با کوچکترین تغییر زاویه یا لغزش از حرکت بازمیمونن.
🔹 همین ضعف نشون میده که فاصله زیادی بین هوش محاسباتی و تواناییهای فیزیکی رباتها وجود داره. پس حتی اگر هوش مصنوعی به سطح استدلال پیچیده برسه، توانایی برای «شورش فیزیکی» در دنیای واقعی هنوز محدود به موانع بسیار سادهای مثل یک راهپله است.
📌 نتیجه: تا وقتی رباتها نتونن از یک پلکان معمولی بهخوبی عبور کنن، ترس از شورش ماشین بیشتر شبیه داستانهای علمی–تخیلی باقی میمونه تا واقعیت.
#هوش_مصنوعی #رباتیک #فناوری #AI
@rss_ai_ir
یکی از نقاط ضعف اساسی در رباتیک امروزی چیزی ساده و روزمره مثل پلههاست. هرچند هوش مصنوعی در زبان، بینایی ماشین و تصمیمگیری جهشهای عظیمی داشته، اما در حوزه حرکت فیزیکی هنوز محدودیتهای جدی وجود داره.
🔹 بالا و پایین رفتن از پلهها برای انسانها کار بدیهی محسوب میشه، اما برای رباتها ترکیبی از چالشهای مکانیکی، تعادل دینامیکی و درک محیطیه. بسیاری از رباتها با کوچکترین تغییر زاویه یا لغزش از حرکت بازمیمونن.
🔹 همین ضعف نشون میده که فاصله زیادی بین هوش محاسباتی و تواناییهای فیزیکی رباتها وجود داره. پس حتی اگر هوش مصنوعی به سطح استدلال پیچیده برسه، توانایی برای «شورش فیزیکی» در دنیای واقعی هنوز محدود به موانع بسیار سادهای مثل یک راهپله است.
📌 نتیجه: تا وقتی رباتها نتونن از یک پلکان معمولی بهخوبی عبور کنن، ترس از شورش ماشین بیشتر شبیه داستانهای علمی–تخیلی باقی میمونه تا واقعیت.
#هوش_مصنوعی #رباتیک #فناوری #AI
@rss_ai_ir
👍8🔥5🥰5🎉5❤4👏3😁3
🤖 مجموعهای بینظیر از سیستمهای عاملهای هوشمند خودتکاملی
✅این کالکشن یک نقشهی جامع از مسیر تکامل Agentها در سالهای ۲۰۲۳ تا ۲۰۲۵ ارائه میدهد؛ از بهینهسازی تکعاملی تا چندعاملی و در نهایت دامنههای تخصصی.
📌 شامل:
♻️مورد Agentهای خودتکاملی (Self-Evolving Agents)
♻️روشهای بهینهسازی حافظه، Prompt و Workflow
♻️تکنیکهای Multi-Agent برای تقسیم وظایف و همکاری
♻️بهینهسازیهای دامنهمحور در علوم، پزشکی، حقوق و صنعت
✨ ایدهی اصلی: آزاد کردن زمان شما با سپردن کارها به Agentها.
📊 لینک
#هوش_مصنوعی #AI_Agents #MultiAgent #خودتکاملی
@rss_ai_ir
✅این کالکشن یک نقشهی جامع از مسیر تکامل Agentها در سالهای ۲۰۲۳ تا ۲۰۲۵ ارائه میدهد؛ از بهینهسازی تکعاملی تا چندعاملی و در نهایت دامنههای تخصصی.
📌 شامل:
♻️مورد Agentهای خودتکاملی (Self-Evolving Agents)
♻️روشهای بهینهسازی حافظه، Prompt و Workflow
♻️تکنیکهای Multi-Agent برای تقسیم وظایف و همکاری
♻️بهینهسازیهای دامنهمحور در علوم، پزشکی، حقوق و صنعت
✨ ایدهی اصلی: آزاد کردن زمان شما با سپردن کارها به Agentها.
📊 لینک
#هوش_مصنوعی #AI_Agents #MultiAgent #خودتکاملی
@rss_ai_ir
❤9🔥6🥰6🎉6👏4👍3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 در نسخه Kling 2.1 قابلیت تازهای اضافه شده: FirstFrame / LastFrame.
این ویژگی فعلاً فقط برای کاربرانی فعال شده که قبلاً از مدل تعریف کرده بودند. جذابیش اینه که حتی بدون پرامپت هم میشه استفاده کرد — مثل کار Nano Banana که دهها واریانت کاراکتر ساخته و خروجی خیلی تمیزی داده.
📌 حالا کافیه اولین یا آخرین فریم رو در Kling بارگذاری کنید تا موتور هوش مصنوعی با همون حالت شروع یا پایان بسازه و نتیجه چیزی شبیه Elastic Reality روی استروئیدهای هوش مصنوعی بشه.
#Kling #AI #FirstFrame #LastFrame
@rss_ai_ir
این ویژگی فعلاً فقط برای کاربرانی فعال شده که قبلاً از مدل تعریف کرده بودند. جذابیش اینه که حتی بدون پرامپت هم میشه استفاده کرد — مثل کار Nano Banana که دهها واریانت کاراکتر ساخته و خروجی خیلی تمیزی داده.
📌 حالا کافیه اولین یا آخرین فریم رو در Kling بارگذاری کنید تا موتور هوش مصنوعی با همون حالت شروع یا پایان بسازه و نتیجه چیزی شبیه Elastic Reality روی استروئیدهای هوش مصنوعی بشه.
#Kling #AI #FirstFrame #LastFrame
@rss_ai_ir
👏9🔥8👍6🥰5❤3🎉3😁2