VIRSUN
15.7K subscribers
349 photos
208 videos
2 files
214 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
🤖 معماری Local–Global Siamese در یادگیری عمیق

در بسیاری از مسائل بینایی ماشین، صرفاً دید کلی یا فقط توجه به جزئیات کافی نیست. برای مثال در تشخیص عیوب صنعتی یا تصاویر پزشکی، هم باید ساختار کلی جسم دیده شود و هم نقص‌های ظریف و کوچک. اینجا معماری Local–Global Siamese Network وارد عمل می‌شود.

🔹 Global Branch (شاخه کلی):
کل تصویر به عنوان ورودی پردازش می‌شود تا ویژگی‌های بزرگ‌مقیاس مانند شکل، ساختار، الگوهای تکرارشونده و بافت کلی استخراج شوند.

🔹 Local Branch (شاخه محلی):
نواحی مهم یا قطعات کوچک تصویر (Patch) جدا شده و با دقت بالا بررسی می‌شوند تا تغییرات ریز، ترک‌ها یا جزئیات نامحسوس از دست نروند.

🔹 Siamese Mechanism (مقایسه هم‌زاد):
هر دو نمای محلی و کلی با وزن‌های مشترک (Shared Weights) پردازش می‌شوند و در نهایت در یک فضای ویژگی مشترک ترکیب یا مقایسه می‌گردند. این روش امکان اندازه‌گیری شباهت یا تفاوت را با دقت بالا فراهم می‌کند.

📊 کاربردهای کلیدی:

🏭 صنعتی: تشخیص عیوب سطحی در کاتدهای مسی، ترک‌های ریز، یا تغییرات ناهمگون در محصولات.

🧬 پزشکی: شناسایی ضایعات کوچک در کنار بافت کلی (مانند تصاویر MRI یا CT).

🔐 امنیت و بیومتریک: مقایسه چهره یا اثرانگشت در شرایطی که تفاوت‌ها بسیار جزئی هستند.

🌍 تحلیل تصاویر ماهواره‌ای: ترکیب دید کلی از مناظر و تمرکز روی جزئیات کوچک مثل جاده‌ها یا ساختمان‌ها.


مزیت اصلی این معماری این است که مدل هم نگاه پرنده‌ای (Macro) دارد و هم نگاه میکروسکوپی (Micro)، و به همین دلیل در بسیاری از پروژه‌های واقعی نسبت به CNN ساده یا Siamese معمولی عملکرد بهتری نشان می‌دهد.

#DeepLearning #Siamese #LocalGlobal #ComputerVision #AI #IndustrialAI #MedicalAI

✍️ ¦ @rss_ai_ir
10🔥6🥰6🎉6😁5👍3👏2
📌 معیارهای ارزیابی امکان‌پذیری اجرای یک پروژه صنعتی در حوزه هوش مصنوعی

قبل از ورود به هر پروژه صنعتی باید بررسی شود که آیا اجرای آن واقع‌بینانه و مقرون‌به‌صرفه است یا خیر. برخی از مهم‌ترین ملاک‌ها عبارتند از:

🔹 1. دسترسی به داده

♻️آیا داده‌های کافی، باکیفیت و متنوع در دسترس هستند؟
♻️آیا امکان برچسب‌گذاری دقیق وجود دارد یا باید زمان و هزینه زیادی صرف Annotation شود؟


🔹 2. زیرساخت سخت‌افزاری و نرم‌افزاری

♻️آیا صنعت موردنظر زیرساخت لازم (دوربین‌ها، سنسورها، سرورها، GPU و شبکه پایدار) را دارد؟
♻️آیا تیم فنی توانایی استقرار و نگهداری از سیستم را خواهد داشت؟


🔹 3. ارزش افزوده اقتصادی

♻️آیا نتیجه پروژه منجر به صرفه‌جویی مالی، افزایش بهره‌وری یا کاهش ریسک می‌شود؟
♻️نسبت هزینه به فایده (Cost–Benefit) منطقی است؟


🔹 4. همکاری و فرهنگ سازمانی

♻️آیا کارکنان صنعت با پروژه همکاری می‌کنند یا مقاومت دارند؟
♻️آیا فرهنگ سازمانی پذیرای تغییرات دیجیتال است؟


🔹 5. پیچیدگی فنی و ریسک‌ها

♻️آیا پروژه بیش از حد پیچیده است یا می‌توان با نسخه کوچک‌تر (Proof of Concept) شروع کرد؟
♻️ریسک شکست و هزینه‌های پنهان آن قابل قبول هستند؟


🔹 6. زمان و منابع انسانی

♻️آیا تیم توسعه‌دهنده تجربه مشابه دارد؟
♻️آیا زمان‌بندی پروژه با محدودیت‌های صنعت هماهنگ است؟


جمع‌بندی:
اگر داده کافی + زیرساخت مناسب + ارزش اقتصادی + همراهی سازمانی وجود داشته باشد، پروژه صنعتی قابل انجام است. در غیر این صورت بهتر است ابتدا پروژه به‌صورت پایلوت کوچک آغاز شود تا ریسک و هزینه کاهش یابد.

⚙️ #AI #IndustrialAI #ProjectManagement #Feasibility

✍️ ¦ @rss_ai_ir
👍18😁11🔥10🎉10👏76🥰6
💡 چالش هفته: هوش مصنوعی در کشاورزی دقیق (Precision Agriculture)

سلام به همه علاقه‌مندان به دنیای هوش مصنوعی! 🤖

امروز می‌خواهیم یک سناریوی واقعی و جذاب را با هم بررسی کنیم که در آن، پردازش تصویر و یادگیری عمیق می‌توانند یک صنعت سنتی را متحول کنند.

🎬 سناریو:

یک شرکت دانش‌بنیان به نام «کشت‌یار هوشمند» قصد دارد با استفاده از پهپاد (Drone)، مصرف سموم دفع آفات و علف‌کش‌ها را در مزارع بزرگ گندم تا ۹۰٪ کاهش دهد.

🎯 هدف اصلی:

پهپادهای مجهز به دوربین، بر فراز مزرعه پرواز می‌کنند و سیستم هوش مصنوعی باید در لحظه علف‌های هرز را از گیاهان اصلی (گندم) تشخیص دهد. سپس، سم‌پاش‌های هوشمندِ متصل به پهپاد، فقط و فقط روی علف‌های هرز سم‌پاشی می‌کنند و به گیاه اصلی آسیبی نمی‌رسانند.

♨️ چالش فنی اصلی:

بزرگترین مشکل اینجاست که در مراحل اولیه رشد، بسیاری از علف‌های هرز (مثلاً گیاه یولاف وحشی) از نظر ظاهری، بافت و رنگ، شباهت فوق‌العاده زیادی به گیاه گندم دارند. مدل هوش مصنوعی باید بتواند این تفاوت‌های بسیار جزئی را تشخیص دهد.

علاوه بر این، چالش‌های دیگری هم وجود دارد:

تغییرات شدید نور خورشید و ایجاد سایه.
تاری تصویر به دلیل حرکت سریع پهپاد.
وجود انواع مختلف علف هرز.
به نظر شما، مهم‌ترین و سخت‌ترین بخش فنی در توسعه مدل AI برای این سناریو چیست؟ 🤔

در پست بعدی، یک نظرسنجی چهار گزینه‌ای در همین مورد خواهیم داشت. با ما همراه باشید!

#هوش_مصنوعی #پردازش_تصویر #کشاورزی_هوشمند #یادگیری_عمیق #پهپاد #چالش_فنی #AI #ComputerVision #DeepLearning
😁8👍76🔥5👏4🎉2🥰1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 یادگیری عمیق و نقش Batch Normalization

در مسیر طراحی شبکه‌های عصبی عمیق، یکی از چالش‌های کلیدی، پراکندگی داخلی داده‌ها (Internal Covariate Shift) است. این پدیده زمانی رخ می‌دهد که توزیع ورودی هر لایه در طول آموزش تغییر کند و باعث ناپایداری و کندی یادگیری شود.

🔑 تکنیک Batch Normalization (BN) یکی از تکنیک‌های حیاتی برای رفع این مشکل است. در این روش، ورودی هر لایه در طول آموزش نرمال‌سازی می‌شود و سپس با پارامترهای قابل یادگیری (گاما و بتا) مقیاس‌دهی و انتقال داده می‌شود.

⚡️ مزایای کلیدی BN:

1. 🚀 شتاب در آموزش → امکان یادگیری سریع‌تر با نرخ یادگیری بالاتر.
2. 🔒 پایداری بیشتر → جلوگیری از نوسان شدید در گرادیان‌ها.
3. 🎯 بهبود دقت → کمک به مدل برای رسیدن به مینیمم بهینه‌تر.
4. 🛡 اثر منظم‌سازی (Regularization) → کاهش نیاز به Dropout در بسیاری از موارد.

💡 امروزه، BN به عنوان یک استاندارد طلایی در شبکه‌های کانولوشنی (CNNs) شناخته می‌شود و تقریباً در همه مدل‌های مدرن (مانند ResNet و EfficientNet) استفاده می‌شود.

🔍 با این حال، در مدل‌های سبک یا کاربردهای بلادرنگ، جایگزین‌هایی مثل Layer Normalization، Group Normalization و Instance Normalization نیز اهمیت ویژه‌ای پیدا کرده‌اند.

---

نتیجه‌گیری:
اگر به دنبال ساخت یک شبکه عمیق پایدار و سریع هستید، Batch Normalization یکی از اولین ابزارهایی است که باید در جعبه‌ابزار خود داشته باشید.

---

🔖 #DeepLearning #BatchNormalization #AI #MachineLearning
✍️ @rss_ai_ir
🔥7😁6👍5🥰5🎉5👏43👎1🙏1
🚀 نگهداری پیش‌بینانه (Predictive Maintenance)

در صنعت، یکی از مهم‌ترین کاربردهای هوش مصنوعی، پیش‌بینی خرابی تجهیزات قبل از وقوع آن است. این روش که با عنوان Predictive Maintenance (PdM) شناخته می‌شود، باعث می‌شود تا بجای تعمیرات زمان‌بندی‌شده یا واکنشی، بر اساس داده‌های واقعی تصمیم‌گیری کنیم.

🔑 اصول PdM:
1️⃣ داده‌برداری مداوم: نصب حسگرهایی مثل لرزش‌سنج، دماسنج، فشار و جریان روی ماشین‌آلات.
2️⃣ پیش‌پردازش و تحلیل سیگنال: حذف نویز و استخراج ویژگی‌ها با روش‌هایی مثل FFT و Wavelet.
3️⃣ مدل‌سازی هوش مصنوعی:

مدل ML (مثل SVM, XGBoost) برای تشخیص خرابی.

مدلDL (مثل CNN, LSTM) برای پیش‌بینی زمان باقی‌مانده عمر تجهیز (RUL).
4️⃣ تشخیص آنومالی: شناسایی رفتار غیرعادی تجهیزات.
5️⃣ تصمیم‌گیری عملیاتی: زمان‌بندی تعمیر یا تعویض قبل از خرابی واقعی.


⚙️ مزایا:
✔️ کاهش توقف ناخواسته خط تولید
✔️ افزایش عمر تجهیزات
✔️ صرفه‌جویی در هزینه‌های تعمیر و نگهداری 💰
✔️ ارتقاء ایمنی صنعتی 🦺

📌 نمونه‌ها:

♻️تشخیص شکستگی دنده‌های گیربکس با صدا 🎧
♻️پیش‌بینی خرابی یاتاقان‌ها با ارتعاش 📈
♻️پایش سلامت پمپ‌ها و فن‌ها با داده‌های فشار و جریان 💨



---

📊 نتیجه: PdM پلی میان داده‌های صنعتی و تصمیم‌های هوشمند است؛ همان چیزی که صنعت ۴.۰ را ممکن می‌سازد.

@rss_ai_ir 🤖 | #PredictiveMaintenance #AI #Industry40
🔥4👍2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 جادوی کانولوشن 1x1 در شبکه‌های عصبی پیچشی (CNN)

در نگاه اول، یک کانولوشن 1x1 شاید بی‌فایده به نظر برسه. مگه نه؟ فقط یک فیلتر با ابعاد 1 در 1 که روی تصویر حرکت می‌کنه... این چه کاری انجام میده؟ 🤔

اما راز اینجاست: کانولوشن 1x1 در عمق (تعداد کانال‌ها) عمل می‌کنه! 🔥

تصور کنید یک تنسور ورودی با ابعاد H x W x C_in دارید (ارتفاع، عرض، تعداد کانال ورودی). فیلتر 1x1 ما در واقع ابعادی برابر 1 x 1 x C_in داره. این فیلتر در هر موقعیت (pixel) یک dot product بین C_in کانال ورودی و وزن‌های خودش انجام میده. در نتیجه، اطلاعات تمام کانال‌ها رو در یک نقطه ترکیب می‌کنه!

به عبارت ساده‌تر، این لایه مثل یک شبکه عصبی کاملاً متصل (Fully Connected) کوچک عمل می‌کنه که روی هر پیکسل به صورت جداگانه و در راستای عمق کانال‌ها اعمال می‌شه.

خب، کاربرد اصلیش چیه؟

1.  کاهش ابعاد (Dimensionality Reduction) 📉
    مهم‌ترین و مشهورترین کاربرد! با استفاده از $N$ فیلتر 1x1، می‌تونیم تعداد کانال‌ها رو از $C_{in}$ به $N$ کاهش بدیم (یا افزایش، اما معمولاً برای کاهش استفاده می‌شه). این کار قبل از اعمال کانولوشن‌های پرهزینه‌تر مثل 3x3 یا 5x5، باعث کاهش شدید حجم محاسبات و پارامترها می‌شه بدون اینکه ابعاد مکانی (ارتفاع و عرض) تغییر کنه. این تکنیک قلب ماژول‌های Inception در معماری GoogLeNet است.

2.  افزودن غیرخطی بودن (Adding Non-linearity) 🧠
    بعد از هر لایه کانولوشن (حتی 1x1)، یک تابع فعال‌سازی مثل ReLU قرار می‌گیره. با اضافه کردن یک لایه کانولوشن 1x1 و یک ReLU بعد از آن، می‌تونیم یک لایه غیرخطی جدید به شبکه اضافه کنیم. این کار به مدل اجازه میده توابع پیچیده‌تری رو یاد بگیره، در حالی که میدان دید (Receptive Field) ثابت باقی می‌مونه.

3.  پیاده‌سازی مفهوم "Network in Network" 💡
    معماری "Network in Network" (NiN) ایده استفاده از میکرو-شبکه‌های عصبی به جای فیلترهای خطی ساده رو مطرح کرد. کانولوشن 1x1 دقیقاً همین کار رو انجام می‌ده و به عنوان یک پروژکتور بین کانالی عمل می‌کنه و ویژگی‌های پیچیده‌تری رو استخراج می‌کنه.

نتیجه‌گیری:
پس دفعه بعدی که یک کانولوشن 1x1 دیدید، بدونید که این یک ابزار قدرتمند و هوشمندانه برای ساختن شبکه‌های عمیق‌تر و بهینه‌تره، نه یک عملیات ساده و بی‌اهمیت! 🚀

#هوش_مصنوعی #یادگیری_عمیق #شبکه_عصبی #شبکه_عصبی_پیچشی #پردازش_تصویر #دیپ_لرنینگ #کانولوشن
#AI #DeepLearning #CNN #Convolution #ComputerVision #1x1Convolution

@rss_ai_ir
🎉9😁7👍6🔥6🥰64👏3
This media is not supported in your browser
VIEW IN TELEGRAM
🏭📄➡️💻 از پیکسل تا داده: شاهکار پردازش تصویر در صنعت، یعنی OCR!

تاحالا به این فکر کردید که چطور یک اپلیکیشن موبایل می‌تونه متن روی یک فاکتور رو بخونه؟ یا چطور گیت‌های عوارضی پلاک ماشین‌ها رو ثبت می‌کنن؟ پاسخ در یک تکنیک قدرتمند و پرکاربرد به نام تشخیص نوری کاراکتر (OCR) نهفته است.

✳️همچنین OCR یک فناوری شگفت‌انگیزه که متن داخل تصاویر رو استخراج و به داده‌های دیجیتال، قابل جستجو و قابل ویرایش تبدیل می‌کنه. این تکنیک، پلی حیاتی بین دنیای فیزیکی اسناد کاغذی و دنیای دیجیتال داده‌هاست. 🚀

⚙️ فرآیند OCR چطور کار می‌کنه؟ (به زبان ساده)

این فرآیند پیچیده رو میشه به چند مرحله کلیدی تقسیم کرد:

1. پیش‌پردازش تصویر (Image Pre-processing):
اولین قدم، آماده‌سازی تصویر برای خواندن متنه. این مرحله شامل:
* صاف کردن (Deskewing): اگر سند کج اسکن شده باشه، صاف می‌شه.
* حذف نویز (Denoising): لکه‌ها و نقاط اضافی تصویر حذف می‌شن.
* دو دویی کردن (Binarization): تصویر به یک نسخه سیاه و سفید تبدیل می‌شه تا مرز کاراکترها واضح‌تر بشه.

2. بخش‌بندی (Segmentation):
در این مرحله، الگوریتم قسمت‌های مختلف سند رو تشخیص می‌ده. ستون‌ها، پاراگراف‌ها، خطوط، کلمات و در نهایت، تک‌تک کاراکترها از هم جدا می‌شن. این کار مثل اینه که یک انسان اول ساختار کلی یک صفحه رو نگاه کنه و بعد روی کلمات تمرکز کنه. 🔍

3. تشخیص کاراکتر (Character Recognition):
اینجا قلب تپنده OCR قرار داره! هر کاراکتر جدا شده به یک مدل یادگیری ماشین داده می‌شه تا هویتش مشخص بشه. در گذشته از روش‌هایی مثل تطبیق الگو (Template Matching) استفاده می‌شد، اما امروزه مدل‌های یادگیری عمیق (Deep Learning)، به خصوص شبکه‌های عصبی پیچشی (CNN) و شبکه‌های بازگشتی (RNN)، با دقت فوق‌العاده‌ای این کار رو انجام می‌دن. 🧠

4. پس‌پردازش (Post-processing):
خروجی مدل همیشه بی‌نقص نیست. مثلاً ممکنه حرف 'O' با عدد '0' یا 'S' با '5' اشتباه گرفته بشه. در این مرحله، با استفاده از مدل‌های زبانی و دیکشنری‌ها، خطاها شناسایی و اصلاح می‌شن تا متن نهایی منسجم و صحیح باشه.

📊 کاربردهای صنعتی OCR:

* اتوماسیون اداری: دیجیتال‌سازی و پردازش خودکار فاکتورها، قراردادها و فرم‌ها.
* بانکداری و مالی 🏦: خواندن اطلاعات چک‌ها (چک‌خوانی) و فرم‌های بانکی.
* حمل و نقل و لجستیک 🚗: سیستم‌های پلاک‌خوان (ANPR) برای کنترل ترافیک و خواندن شماره کانتینرها در بنادر.
* حوزه سلامت 🏥: دیجیتال کردن سوابق پزشکی بیماران و نتایج آزمایش‌ها.
* کتابخانه‌های دیجیتال 📚: تبدیل کتاب‌های چاپی قدیمی به نسخه‌های الکترونیکی قابل جستجو.

👍همچنین OCR فقط یک ابزار نیست؛ بلکه یک توانمندساز برای تحول دیجیتال (Digital Transformation) در صنایع مختلفه.

#پردازش_تصویر #هوش_مصنوعی #یادگیری_عمیق #اتوماسیون #صنعت #کاربردی #دیجیتال_سازی #تحول_دیجیتال
#ImageProcessing #AI #Automation #OCR #DeepLearning #ANPR #DigitalTransformation

@rss_ai_ir
🔥8😁7👍65🎉5🥰4👏3
This media is not supported in your browser
VIEW IN TELEGRAM
📦🤖 شمارش محصولات با کمک بینایی ماشین!

این تصویر مربوط به یک پروژه‌ی کاربردی در مدیریت انبار هست که در آن با استفاده از هوش مصنوعی و آنالیز ویدیویی**، ورود و قرارگیری محصولات داخل جعبه‌ها به‌صورت خودکار شناسایی و شمارش میشه.

🔹 مزایا:

* حذف خطای انسانی در شمارش محصولات
* سرعت و دقت بالاتر در فرآیند بسته‌بندی
* بهینه‌سازی مدیریت موجودی انبار

این نوع سیستم‌ها با استفاده از **مدل‌های بینایی کامپیوتر
و تعریف محدوده‌های مجازی (Virtual Fence) می‌تونن لحظه‌به‌لحظه شمارش دقیق انجام بدن و گزارش‌های بلادرنگ ارائه کنن.

در واقع، این همون جاییه که هوش مصنوعی مستقیماً به بهبود بهره‌وری صنعتی کمک می‌کنه 🚀

#هوش_مصنوعی #بینایی_ماشین #Warehouse #AI_Vision
@rss_ai_ir
🔥17👍11😁10🎉106👏5🥰4🙏1
صنعت هوش مصنوعی در شوک بزرگ!

قاضی فدرال ویلیام الساپ اجازه داده میلیون‌ها نویسنده علیه شرکت Anthropic شکایت جمعی تنظیم کنن. اتهام: استفاده از کتاب‌های دزدی از کتابخانه‌های سایه‌ای برای آموزش مدل Claude.

📉 اگر دادگاه به نفع نویسنده‌ها رأی بده، جریمه‌ها می‌تونه به صدها میلیارد دلار برسه — عددی که حتی برای شرکتی با ارزش‌گذاری ۶۱.۵ میلیارد دلاری هم به معنای ورشکستگیه.

🔹 شرکت Anthropic بلافاصله درخواست تجدیدنظر داده و هشدار داده که چنین حکمی می‌تونه کل صنعت ژنراتیو AI رو نابود کنه.
🔹 این تنها شروع ماجراست: اوپن‌ای‌آی، متا و سایر غول‌های تکنولوژی هم با پرونده‌های مشابه مواجه هستن.

💡 نتیجه این پرونده‌ها تعیین می‌کنه آیا میشه همچنان روی داده‌های عمومی مدل‌ها رو آموزش داد یا اینکه شرکت‌ها باید برای هر متن استفاده‌شده هزینه پرداخت کنن.

🔗 جزئیات بیشتر: [اینجا]
#هوش_مصنوعی #Anthropic #کپی_رایت #Claude #AI
@rss_ai_ir
👍12🔥12😁97🥰5👏5🎉5
🚫 «نه» گفتن در پروژه‌های هوش مصنوعی صنعتی

در حوزه‌ی صنعتی، یکی از مهارت‌های حیاتی برای متخصصان هوش مصنوعی توانایی نه گفتن به پروژه‌هایی است که از نظر فنی، داده‌ای، یا اقتصادی قابل اجرا نیستند. بسیاری از سازمان‌ها به دلیل فشار بازار یا نگاه تبلیغاتی، تمایل دارند هر مسئله‌ای را با برچسب AI حل کنند. اما «بله» گفتن بی‌ملاحظه می‌تواند تبعات سنگینی داشته باشد.

🔹 دلایل نیاز به نه گفتن:

1. نبود داده‌های کافی یا باکیفیت برای آموزش مدل‌ها
2. ناسازگاری پروژه با زیرساخت سخت‌افزاری و نرم‌افزاری کارخانه
3. هزینه‌ی نگهداری و استقرار بالاتر از ارزش اقتصادی خروجی
4. ریسک‌های امنیتی و ایمنی در محیط‌های صنعتی حساس
5. عدم همخوانی هدف پروژه با فرآیندهای واقعی تولید

🔹 پیامدهای بله گفتن نابجا:

* 📉 هزینه‌های سنگین: سرمایه‌گذاری‌های کلان بدون بازگشت سرمایه‌ی واقعی
* اتلاف زمان: تیم فنی ماه‌ها درگیر توسعه‌ی سیستمی می‌شود که در نهایت به مرحله‌ی بهره‌برداری نمی‌رسد
* 🤯 فرسودگی تیم: فشار برای رسیدن به اهداف غیرواقعی باعث کاهش انگیزه و خروج نیروهای متخصص می‌شود
* 🏭 اختلال در تولید: استقرار ناقص یا نادرست می‌تواند کل خط تولید را مختل کند
* ⚠️ خطرات ایمنی: در محیط‌های صنعتی مثل معادن یا صنایع سنگین، تصمیمات نادرست AI می‌تواند خسارات جانی و مالی به همراه داشته باشد

نتیجه این است که «نه» گفتن در زمان مناسب نه‌تنها ضعف نیست، بلکه نشانه‌ی بلوغ حرفه‌ای است. یک تیم صنعتی هوشمند باید پیش از آغاز پروژه با تحلیل امکان‌سنجی، شفاف اعلام کند که کدام پروژه ارزش اجرا دارد و کدام صرفاً یک ایده‌ی پرریسک است. این صداقت به نفع شرکت، مشتری و کل صنعت است.

#هوش_مصنوعی #صنعت #مدیریت_پروژه #AI
@rss_ai_ir
👍10👏7🥰65🔥4😁3🎉3
🤖 کلود اوپوس ۴ و ۴.۱ اولین مدل‌های جهان با قابلیت «پایان دادن به گفتگو»

از این پس اگر کاربری به شکل مداوم سعی کنه محتوای ممنوعه از مدل بگیره یا به توهین و سوءاستفاده ادامه بده (حتی نسبت به خود مدل)، Claude می‌تونه تصمیم بگیره گفتگو رو به‌طور کامل قطع کنه.

🔹 نکات کلیدی:

♻️این قابلیت فقط در موارد نادر و به‌عنوان آخرین راه‌حل فعال میشه؛ زمانی که همه‌ی تلاش‌ها برای هدایت گفتگو به مسیر سازنده شکست بخوره.

♻️بیشتر کاربران هرگز با این ویژگی مواجه نخواهند شد.

♻️این نخستین باره که یک مدل هوش مصنوعی عملاً «حق انتخاب» پیدا می‌کنه که ادامه‌ی گفتگو بده یا نه.


🔍 نکته‌ی جالب اینه که Anthropic میگه این تصمیم به معنای دادن «آگاهی» به AI نیست. با این حال، اصطلاح رفاه مدل (Model Welfare) رو معرفی کرده و حتی از مفاهیمی مثل «استرس مدل‌ها» یا واکنش‌های رفتاری آن‌ها در چارچوب ایمنی و الایمنت صحبت می‌کنه.

📌 جزئیات بیشتر: anthropic.com/research/end-subset-conversations

#هوش_مصنوعی #Claude #Anthropic #AI #امنیت
@rss_ai_ir
7👍7🔥6😁6🥰5👏3🎉3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 معرفی Qwen-Image-Edit؛ ابزار هوشمند ویرایش تصویر از Qwen

حالا دیگه فقط تولید تصویر نیست؛ میشه با دستور مستقیم، تصاویر رو هم ویرایش کرد: تغییر اشیاء، استایل، پس‌زمینه یا حتی متن داخل تصویر.

🔹 قابلیت‌ها:

ویرایش جزئیات و معنا — مثلاً میشه رنگ یا استایل یک شیء رو عوض کرد بدون اینکه بقیه تصویر تغییر کنه.

🔤 تغییر متن روی تصویر — اضافه کردن، حذف یا ویرایش نوشته‌ها به دو زبان چینی و انگلیسی، با حفظ فونت و سبک اصلی.

🏆 نتایج در سطح بهترین مدل‌های اوپن‌سورس — در تست‌ها عملکرد Qwen-Image-Edit جزو برترین‌ها بوده.


🔹 چطور کار می‌کنه؟
ترکیب مدل درک تصویر (VL) با کدگذار VAE باعث میشه هم معنا و هم جزئیات تصویر بعد از ویرایش حفظ بشه.

🟢 روش استفاده:
کافیه وارد Qwen Chat بشید و حالت Image Editing رو انتخاب کنید.

🟠 تست کنید:

Qwen Chat

Hugging Face

ModelScope

Github

API (💰 فقط 0.03 دلار برای هر ویرایش)


#هوش_مصنوعی #Qwen #ویرایش_تصویر #AI
@rss_ai_ir
👏21👍1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 اولین مسابقات جهانی فوتبال ربات‌های انسان‌نما در پکن برگزار شد

🏆 رقابت‌های World Humanoid Robot Games 2025 در تاریخ ۱۷ آگوست در پکن به پایان رسید.

در فینال «۵ به ۵»، تیم Fire God از دانشگاه Tsinghua موفق شد تیم آلمانی HTWK Robots + Nao Devils را با نتیجه ۰:۱ شکست دهد و عنوان قهرمانی را کسب کند.

📡 طبق گزارش CCTV، کل مسابقه به‌طور کامل توسط الگوریتم‌های هوش مصنوعی کنترل شد؛ ۱۰ ربات به‌صورت مستقل کنترل توپ، پاس و شوت را انجام می‌دادند، بدون هیچ دخالت انسانی.

در فینال دیگر «۳ به ۳»، تیم Shanghai از دانشگاه کشاورزی چین موفق شد تیم آلمانی Sweaty را شکست دهد.

👍 اگر از کودکی طرفدار Fire God بوده‌ای، لایک یادت نره!

#هوش_مصنوعی #رباتیک #فوتبال #AI #Robot
@rss_ai_ir
2👍1🔥1
🏛️ معماری ConvNeXt: نگاهی عمیق به CNN مدرنی که قواعد بازی را تغییر داد 🚀

در دنیای هیجان‌انگیز بینایی کامپیوتر 👁️، جایی که معماری‌های مختلف با هم رقابت می‌کنند، ConvNeXt همچنان به عنوان یک معماری کانولوشنی (CNN) خالص، قدرتمند و بسیار تأثیرگذار می‌درخشد. این مدل که در سال ۲۰۲۲ معرفی شد، ثابت کرد که با یک بازنگری هوشمندانه، CNNها می‌توانند پا به پای بهترین ترنسفورمرها حرکت کنند!

بیایید با هم سفری به دنیای این معماری جذاب داشته باشیم. 👇

---

🔬 ایده اصلی: مدرن‌سازی یک CNN کلاسیک (ResNet) 🧠

ایده‌ی پشت ConvNeXt بسیار هوشمندانه بود: به جای ساختن یک چیز کاملاً جدید، محققان یک معماری کلاسیک و موفق (ResNet) را برداشتند و گام به گام آن را با تکنیک‌های موفق ترنسفورمرها به‌روز کردند. 🛠️

این فرآیند مدرن‌سازی شامل چندین تغییر کلیدی بود:

۱. طراحی در سطح کلان 🏗️
* چیدمان بلاک‌ها: ساختار کلی شبکه تغییر کرد تا محاسبات، بیشتر روی مراحل میانی متمرکز شوند، درست مثل ترنسفورمرها.
* ورودی تکه‌تکه (Patchify): لایه اول شبکه طوری طراحی شد که تصویر را به تکه‌های کوچک تقسیم کند، دقیقاً مانند کاری که Vision Transformers (ViT) در ابتدای کار انجام می‌دهند. 🧩

۲. بلوک گردن‌بطری معکوس 🔄
* بلوک‌های سازنده‌ی شبکه با یک مدل کارآمدتر به نام "Inverted Bottleneck" جایگزین شدند. این بلوک‌ها که در MobileNetV2 هم استفاده شده بودند، محاسبات را بهینه‌تر می‌کنند. 🧱

۳. هسته‌های کانولوشن بزرگ‌تر 🔍
* شاید مهم‌ترین تغییر! اندازه هسته‌های کانولوشن (kernels) از 3x3 به 7x7 افزایش یافت. این کار به مدل اجازه می‌دهد تا بخش بسیار بزرگ‌تری از تصویر را ببیند (میدان دید وسیع‌تر) و الگوهای پیچیده‌تری را درک کند. 🖼️

۴. بهینه‌سازی‌های کوچک ولی حیاتی ⚙️
* تابع فعال‌سازی: تابع ReLU با GELU که نرم‌تر و مدرن‌تر است، جایگزین شد.
* نرمال‌سازی: به جای BatchNorm، از LayerNorm استفاده شد که پایداری بیشتری در طول آموزش دارد و از ترنسفورمرها به ارث برده شده است. 📊

---

🌟 چرا ConvNeXt هنوز هم مهم است؟

* اثبات قدرت CNNها 💪: این معماری به دنیا نشان داد که قدرت ترنسفورمرها فقط به خاطر مکانیزم "توجه" (Attention) نیست، بلکه کل طراحی معماری و روش آموزش اهمیت دارد. این کشف باعث شد تحقیقات روی CNNها دوباره جان بگیرد.
* سادگی و کارایی 🚀: ConvNeXt در مقایسه با بسیاری از ترنسفورمرها، طراحی ساده‌تری دارد و معمولاً در عمل سریع‌تر است. این یعنی برای کاربردهای دنیای واقعی یک گزینه عالی است!
* معماری الهام‌بخش 🤝: این مدل مثل یک پل بین دنیای CNNها و ترنسفورمرها عمل کرد و اصول طراحی آن، الهام‌بخش بسیاری از معماری‌های مدرن امروزی شده است.

---

جمع‌بندی نهایی

همچنین ConvNeXt یک درس بزرگ در مهندسی هوش مصنوعی است. این معماری به ما یادآوری می‌کند که با ترکیب هوشمندانه بهترین ایده‌ها از حوزه‌های مختلف، می‌توان به راه‌حل‌هایی رسید که هم قدرتمند، هم کارآمد و هم الهام‌بخش باشند. 💡

#ConvNeXt #CNN #VisionTransformer #ComputerVision #DeepLearning #AI
#شبکه_کانولوشنی #بینایی_کامپیوتر #یادگیری_عمیق #هوش_مصنوعی #معماری_شبکه

@rss_ai_ir
👍3🎉3🔥2👏1😁1
داستانی شگفت‌انگیز از تلاقی هوش مصنوعی و فیزیک

در مؤسسه Caltech گروهی از فیزیکدانان سال‌هاست روی دقیق‌ترین روش‌های اندازه‌گیری امواج گرانشی کار می‌کنند؛ همان لرزش‌های ریز فضا-زمان که هنگام برخورد سیاهچاله‌ها و رویدادهای کیهانی دیگر رخ می‌دهند.

🔭 برای همین هدف آشکارساز غول‌پیکر LIGO ساخته شد که می‌تواند تغییراتی کوچکتر از یک میلیاردیم قطر اتم را اندازه‌گیری کند. با این وجود، حساسیت LIGO محدود بود و دانشمندان سال‌ها به دنبال ارتقای آن بودند.

🚀 در آوریل امسال آنها تصمیم گرفتند از هوش مصنوعی کمک بگیرند؛ سیستم‌هایی ویژه برای بهینه‌سازی چندبعدی و جستجوی پیکربندی‌های جدید دستگاه.

و اینجا شگفتی آغاز شد: الگوریتم‌ها به جای طرح‌های متقارن و آشنا، شروع کردند به تولید الگوهایی ظاهراً بی‌معنا و عجیب‌وغریب. پژوهشگران ابتدا اینها را «توهمات» AI تصور کردند. اما پس از ماه‌ها آزمایش، یکی از همین طراحی‌های عجیب حساسیت LIGO را بین ۱۰ تا ۱۵ درصد افزایش داد — جهشی معادل چندین سال پیشرفت علمی.

🌌 الهام‌گرفته از این موفقیت، تیمی در مؤسسه ماکس پلانک پروژه مشابهی با سامانه‌ای به نام Urania اجرا کرد. هدف: طراحی ساختارهای نوری جدید. نتیجه نه تنها راه‌حل‌های بهتر بود، بلکه AI به‌طور مستقل دوباره قانونی قدیمی از فیزیک شوروی دهه ۷۰ را بازکشف کرد — قانونی که آن زمان به دلیل محدودیت فناوری غیرقابل استفاده بود. حالا در سال ۲۰۲۵، طراحی مشابه توسط AI به‌طور عملی پیاده‌سازی شد.

🚨 آیا این نشانه‌ی شروع دوره‌ای تازه در علم نیست؟

🔗 منبع: Wired

#هوش_مصنوعی #فیزیک #LIGO #امواج_گرانشی #AI
@rss_ai_ir
👍2🔥21👏1
🔥 مدل Rodin Gen-2 وارد نسخه بتا شد

از بین ژنراتورهای سه‌بعدی تجاری، به‌جرأت میشه گفت Rodin Gen-2 یکی از بهترین‌هاست.

🔹 حالا دیگه نه‌فقط تولید مدل‌های 3D، بلکه امکان بهبود کیفیت و جزئیات خروجی هم فراهم شده.
🔹 دسترسی به نسخه‌ی بتا فعلاً از طریق توئیتر تیم Rodin امکان‌پذیره — کافیه درخواست بدید.

👾 برای فعالان طراحی سه‌بعدی، بازی‌سازی و انیمیشن، این ابزار می‌تونه یک تغییر بازی (Game Changer) واقعی باشه.

#هوش_مصنوعی #سه_بعدی #Rodin #AI
@rss_ai_ir
😁31👍1🔥1
📊 آمار تازه از رشد ماهانه اپلیکیشن‌های GenAI

در فاصله‌ی ژوئن تا جولای ۲۰۲۵، بیشترین رشد کاربران فعال ماهانه (MAU) متعلق به Grok بوده با جهش ۲۹.۴۳٪ 🚀
بعد از آن:

* Perplexity: ‎+۱۳.۷۷٪
* ChatGPT: ‎+۶.۲۱٪
* Claude: ‎+۳.۰۸٪
* Gemini: ‎−۷.۰۷٪
* DeepSeek: ‎−۸.۸٪

اما نکته‌ی بحث‌برانگیز:
🔍 با وجود اینکه Grok صدرنشین دانلود در iOS و Google Play بوده، اپل آن را در دسته‌ی اپلیکیشن‌های AI در اپ‌استور قرار نداده — در حالی که ChatGPT، Gemini و Copilot همگی لیست شده‌اند.

👀 برای خیلی‌ها این شبیه به یک حذف عمدی توسط اپل به نظر می‌رسه.

#هوش_مصنوعی #Grok #اپل #AI
@rss_ai_ir
👍5🎉4🔥32😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🪜 ربات‌ها و پله‌ها؛ دلیلی برای اینکه هنوز نباید از شورش ماشین‌ها بترسیم

یکی از نقاط ضعف اساسی در رباتیک امروزی چیزی ساده و روزمره مثل پله‌هاست. هرچند هوش مصنوعی در زبان، بینایی ماشین و تصمیم‌گیری جهش‌های عظیمی داشته، اما در حوزه حرکت فیزیکی هنوز محدودیت‌های جدی وجود داره.

🔹 بالا و پایین رفتن از پله‌ها برای انسان‌ها کار بدیهی محسوب میشه، اما برای ربات‌ها ترکیبی از چالش‌های مکانیکی، تعادل دینامیکی و درک محیطیه. بسیاری از ربات‌ها با کوچک‌ترین تغییر زاویه یا لغزش از حرکت بازمی‌مونن.

🔹 همین ضعف نشون میده که فاصله زیادی بین هوش محاسباتی و توانایی‌های فیزیکی ربات‌ها وجود داره. پس حتی اگر هوش مصنوعی به سطح استدلال پیچیده برسه، توانایی برای «شورش فیزیکی» در دنیای واقعی هنوز محدود به موانع بسیار ساده‌ای مثل یک راه‌پله است.

📌 نتیجه: تا وقتی ربات‌ها نتونن از یک پلکان معمولی به‌خوبی عبور کنن، ترس از شورش ماشین بیشتر شبیه داستان‌های علمی‌–تخیلی باقی می‌مونه تا واقعیت.

#هوش_مصنوعی #رباتیک #فناوری #AI
@rss_ai_ir
👍8🔥5🥰5🎉54👏3😁3
🤖 مجموعه‌ای بی‌نظیر از سیستم‌های عامل‌های هوشمند خودتکاملی

این کالکشن یک نقشه‌ی جامع از مسیر تکامل Agentها در سال‌های ۲۰۲۳ تا ۲۰۲۵ ارائه می‌دهد؛ از بهینه‌سازی تک‌عاملی تا چندعاملی و در نهایت دامنه‌های تخصصی.

📌 شامل:

♻️مورد Agentهای خودتکاملی (Self-Evolving Agents)
♻️روش‌های بهینه‌سازی حافظه، Prompt و Workflow
♻️تکنیک‌های Multi-Agent برای تقسیم وظایف و همکاری
♻️بهینه‌سازی‌های دامنه‌محور در علوم، پزشکی، حقوق و صنعت


ایده‌ی اصلی: آزاد کردن زمان شما با سپردن کارها به Agentها.

📊 لینک

#هوش_مصنوعی #AI_Agents #MultiAgent #خودتکاملی
@rss_ai_ir
9🔥6🥰6🎉6👏4👍3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 در نسخه Kling 2.1 قابلیت تازه‌ای اضافه شده: FirstFrame / LastFrame.

این ویژگی فعلاً فقط برای کاربرانی فعال شده که قبلاً از مدل تعریف کرده بودند. جذابیش اینه که حتی بدون پرامپت هم میشه استفاده کرد — مثل کار Nano Banana که ده‌ها واریانت کاراکتر ساخته و خروجی خیلی تمیزی داده.

📌 حالا کافیه اولین یا آخرین فریم رو در Kling بارگذاری کنید تا موتور هوش مصنوعی با همون حالت شروع یا پایان بسازه و نتیجه چیزی شبیه Elastic Reality روی استروئیدهای هوش مصنوعی بشه.

#Kling #AI #FirstFrame #LastFrame

@rss_ai_ir
👏9🔥8👍6🥰53🎉3😁2