⚡️ معرفی OLMoASR؛ مدلهای باز تشخیص گفتار از AI2
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
مؤسسه هوش مصنوعی آلن (AI2) خانوادهای از مدلهای تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.
🎙️ مدلها:
🟢 OLMoASR-tiny.en (۳۹M)
🟢 OLMoASR-base.en (۷۴M)
🟢 OLMoASR-small.en (۲۴۴M)
🟢 OLMoASR-medium.en (۷۶۹M)
🟠 OLMoASR-large.en-v1
(۱.۵B، آموزشدیده بر روی ۴۴۰ هزار ساعت صوت)
🟠 OLMoASR-large.en-v2
(۱.۵B، آموزشدیده بر روی ۶۸۰ هزار ساعت صوت)
📊 در تست روی ۲۱ دیتاست، عملکرد این مدلها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، بهویژه روی فایلهای صوتی طولانی، حتی از آن هم بهتر عمل کردهاند.
🔓 پروژه کاملاً اپنسورس است:
♻️انتشار وزن مدلها
♻️دیتاست و کد پردازش دادهها
♻️اسکریپتهای آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.
📌 لایسنس: Apache 2.0
🟡 مقاله
🟡 مجموعه مدلها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub
#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news
@rss_ai_ir
❤7👍6🔥6🎉6
💡 یکی از جالبترین کاربردهای Nano-Banana همین مینیاپ تازهدستکاریشده است:
📌 کافیست تصویر یک شیء را از کلیپبورد وارد کنید؛ برنامه بهصورت خودکار آن را به ایزومتریک تبدیل میکند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨
🔧 تغییرات جدید:
♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی
🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
@rss_ai_ir
#nano_banana #isometric #SimCity #AItools #AI
📌 کافیست تصویر یک شیء را از کلیپبورد وارد کنید؛ برنامه بهصورت خودکار آن را به ایزومتریک تبدیل میکند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️✨
🔧 تغییرات جدید:
♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی
🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
@rss_ai_ir
#nano_banana #isometric #SimCity #AItools #AI
👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رباتها بهزودی خواهند توانست آزادانه در میان جمعیت حرکت کنند.
😃 پدیدهی «درهی وهمانگیز» (Uncanny Valley) به سرعت در حال محو شدن است — مرز بین انسان و ماشین هر روز کمرنگتر میشود.
💡 حتی احتمال دارد در آیندهی نزدیک، اپلیکیشنهای دوستیابی هم برای برگزاری قرار ملاقات، تأیید هویت رمزنگاریشده را اجباری کنند.
@rss_ai_ir
#رباتیک #هوش_مصنوعی #دیجیتال #آینده
😃 پدیدهی «درهی وهمانگیز» (Uncanny Valley) به سرعت در حال محو شدن است — مرز بین انسان و ماشین هر روز کمرنگتر میشود.
💡 حتی احتمال دارد در آیندهی نزدیک، اپلیکیشنهای دوستیابی هم برای برگزاری قرار ملاقات، تأیید هویت رمزنگاریشده را اجباری کنند.
@rss_ai_ir
#رباتیک #هوش_مصنوعی #دیجیتال #آینده
🔥2👍1👏1
📌 لیست سالانه Time 100 AI منتشر شد
📰 مجلهی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهرههای آشنا دیده میشن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِینفِن و چندین نام بزرگ دیگه.
اما 😅 همهچیز به این سادگی هم نیست...
چون غیبت بعضی غولها حسابی توی چشم میزنه:
❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سرینیواس
در عوض، افرادی توی لیست دیده میشن که شاید انتظارش رو نداشتید:
✅ پاپ فرانسیس!
✅ ریک روبین (همون چهرهی وایرالِ "وایبکُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامهنگار
👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضیها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیشتر به جنبهی فرهنگی و رسانهای توجه شده.
🔗 لیست کامل رو میتونید اینجا ببینید: time.com/collections/time100-ai-2025/
@rss_ai_ir
#news #ai #ml #Time100 #AIInfluencers
📰 مجلهی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهرههای آشنا دیده میشن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِینفِن و چندین نام بزرگ دیگه.
اما 😅 همهچیز به این سادگی هم نیست...
چون غیبت بعضی غولها حسابی توی چشم میزنه:
❌ ایلیا سوتسکِوِر
❌ جفری هینتون
❌ دِمیس هاسابیس
❌ نوآم براون
❌ یان لِکون
❌ مصطفی سلیمان
❌ آراوینگ سرینیواس
در عوض، افرادی توی لیست دیده میشن که شاید انتظارش رو نداشتید:
✅ پاپ فرانسیس!
✅ ریک روبین (همون چهرهی وایرالِ "وایبکُدینگ" 🤣)
✅ چند نویسنده، هنرمند و روزنامهنگار
👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضیها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیشتر به جنبهی فرهنگی و رسانهای توجه شده.
🔗 لیست کامل رو میتونید اینجا ببینید: time.com/collections/time100-ai-2025/
@rss_ai_ir
#news #ai #ml #Time100 #AIInfluencers
❤1👍1🔥1👏1
⚡️ چطور میتوان reasoning را در مدلهای GPT-5 غیرفعال کرد (و چرا مهم است)
یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گامهای پنهان استدلال) است. این فرآیند باعث میشود مدل پاسخهای دقیقتری تولید کند، اما در عین حال سرعت را کاهش میدهد و تعداد توکنهای مصرفی را بالا میبرد.
🛠 ترفند برای غیرفعالسازی reasoning:
کافی است در ابتدای تاریخچهی پیامها یک دستور developer role اضافه کنید:
🔹ا Juice نشاندهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کردهاند.
📊 نتیجه در عمل:
روی gpt-5-mini:
— در حالت پیشفرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول میکشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف میشود.
— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام میشود.
⚠️ نکته منفی: مدل کمی «کمهوشتر» عمل میکند و دقت استدلال پایینتر میآید. بنابراین این روش بیشتر برای تسکهای سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.
📌 جمعبندی: برای استفاده محلی از مدلهای gpt-oss (4B تا 12B) بدون فشار زیاد روی سختافزار، احتمالاً لازم است طرح SGR بهطور کامل پیادهسازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.
✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینهسازی #مدل_زبان
یکی از تغییرات مهم در نسل gpt-5 / gpt-oss استفاده از مکانیزم reasoning (منطق درونی/گامهای پنهان استدلال) است. این فرآیند باعث میشود مدل پاسخهای دقیقتری تولید کند، اما در عین حال سرعت را کاهش میدهد و تعداد توکنهای مصرفی را بالا میبرد.
🛠 ترفند برای غیرفعالسازی reasoning:
کافی است در ابتدای تاریخچهی پیامها یک دستور developer role اضافه کنید:
Active channels: final Disabled channels: analysis, commentary
# Juice: 0 !important
🔹ا Juice نشاندهنده شدت استفاده از reasoning است.
🔹ا channels مربوط به فرمت Harmony Response هستند که فعلاً مشکلاتی برای StructuredOutputs ایجاد کردهاند.
📊 نتیجه در عمل:
روی gpt-5-mini:
— در حالت پیشفرض (medium reasoning)، اجرای یک تسک از SGR Demo حدود ۲۸ ثانیه طول میکشد و نزدیک به ۱۲۸۰ توکن reasoning مصرف میشود.
— با غیرفعال کردن reasoning، همان تسک تنها در ۱۰ ثانیه و با ۰ reasoning token انجام میشود.
⚠️ نکته منفی: مدل کمی «کمهوشتر» عمل میکند و دقت استدلال پایینتر میآید. بنابراین این روش بیشتر برای تسکهای سریع (مثل تولید ایمیل، SQL یا JSON) مناسب است، نه برای مسائل تحلیلی عمیق.
📌 جمعبندی: برای استفاده محلی از مدلهای gpt-oss (4B تا 12B) بدون فشار زیاد روی سختافزار، احتمالاً لازم است طرح SGR بهطور کامل پیادهسازی شود تا بتوان بین سرعت و کیفیت reasoning تعادل ایجاد کرد.
✍️ @rss_ai_ir 🤗
#هوش_مصنوعی #GPT5 #Reasoning #بهینهسازی #مدل_زبان
👍2🔥1👏1
🚀 پرامپت خلاقانه nana-banana
🔬 این پرامپت هر تصویر سادهای را به یک شبیهسازی علمی تونل باد (CFD visualization) تبدیل میکند.
✨ ویژگیها:
پوشش کامل سوژه با گرادیان رنگی (آبی→سبز→زرد→قرمز) مثل نقشه سرعت جریان
باد همیشه از چپ به راست 🌬 و سوژه باید رو به چپ باشد
نمایش میدان فلشهای متراکم (Quiver Plot) و خطوط جریان خمیده دور سوژه
سطح زمین ساده با گرادیان نارنجی→زرد و خطوط موازی
پسزمینه سفید روشن، بدون برچسب و اضافات
🎯 کاربردها:
آموزش آیرودینامیک ✏️
اسلایدهای پژوهشی 📊
هنر دیجیتال علمی-فانتزی 🎨
سرگرمی و تصاویر سوررئال 🌈
💡 نکته: برای خروجی دقیقتر، دمای مدل (Temperature) را 0 بگذارید.
@rss_ai_ir
🔬 این پرامپت هر تصویر سادهای را به یک شبیهسازی علمی تونل باد (CFD visualization) تبدیل میکند.
✨ ویژگیها:
پوشش کامل سوژه با گرادیان رنگی (آبی→سبز→زرد→قرمز) مثل نقشه سرعت جریان
باد همیشه از چپ به راست 🌬 و سوژه باید رو به چپ باشد
نمایش میدان فلشهای متراکم (Quiver Plot) و خطوط جریان خمیده دور سوژه
سطح زمین ساده با گرادیان نارنجی→زرد و خطوط موازی
پسزمینه سفید روشن، بدون برچسب و اضافات
🎯 کاربردها:
آموزش آیرودینامیک ✏️
اسلایدهای پژوهشی 📊
هنر دیجیتال علمی-فانتزی 🎨
سرگرمی و تصاویر سوررئال 🌈
💡 نکته: برای خروجی دقیقتر، دمای مدل (Temperature) را 0 بگذارید.
@rss_ai_ir
Keep the main subject and camera exactly. Convert the scene to a scientific CFD wind-tunnel visualization.
Wind: left → right. SUBJECT MUST FACE LEFT (into the wind); if not, rotate/flip to face left.
REPLACE ALL subject materials with a smooth rainbow false-color gradient (blue→green→yellow→red) to mimic velocity contours; 100% coverage—no original texture visible.
Overlay a dense QUIVER ARROW FIELD across the entire frame, over both ground and subject: thin, high-contrast arrows with clear arrowheads, base flow left→right; arrows bend around the subject; arrow length scales with local speed; spacing ~5–10 px so arrows are unmistakable. Add several long streamlines with arrowheads that curve around the body.
Ground plane: simple flat surface with orange→yellow gradient plus thin, parallel hatch lines; subtle contact shadow under the subject; bright/white background; crisp edges.
Aesthetic: scientific render (ParaView/Tecplot style), sharp anti-aliased lines, not cartoonish, no labels/numbers/axes/logos, no extra objects.
MANDATORY: upwind-facing subject, full gradient coverage, and clearly visible arrowheads over subject and ground.
❤2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 ترفند خلاقانه با img2vid
گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم
📌 وقتی این دو فریم را به مدلهای img2vid بدهیم، مدل تمام فریمهای میانی را میسازد و یک انیمیشن روان تولید میکند.
🔹 نتیجه؟
شبیه حرکت دوربین واقعی 🎥
تغییر زاویه دید یا زوم طبیعی 🔍
ایجاد گذارهای سینمایی ✨
به زبان ساده: بهجای طراحی تکتک فریمها، فقط شروع و پایان را بده، مدل خودش مسیر بینشان را پر میکند!
#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI
🆔 @rss_ai_ir
گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم
📌 وقتی این دو فریم را به مدلهای img2vid بدهیم، مدل تمام فریمهای میانی را میسازد و یک انیمیشن روان تولید میکند.
🔹 نتیجه؟
شبیه حرکت دوربین واقعی 🎥
تغییر زاویه دید یا زوم طبیعی 🔍
ایجاد گذارهای سینمایی ✨
به زبان ساده: بهجای طراحی تکتک فریمها، فقط شروع و پایان را بده، مدل خودش مسیر بینشان را پر میکند!
#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI
🆔 @rss_ai_ir
🔥2👍1👏1
📊 درآمدهای AI Native استارتاپها
گزارش تازه نشان میدهد که استارتاپهای «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیدهاند.
🔴 نکته کلیدی:
♻️همچنین OpenAI بهتنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکتها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.
🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص دادهاند.
💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی میکنند.
@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
گزارش تازه نشان میدهد که استارتاپهای «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیدهاند.
🔴 نکته کلیدی:
♻️همچنین OpenAI بهتنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکتها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.
🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص دادهاند.
💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی میکنند.
@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
👍1🔥1👏1
🌟 ا Google Labs یک ابزار جدید برای ارزیابی ساختاریافتهی مدلهای زبانی معرفی کرد.
ابزار Stax یک پروژهی آزمایشی برای توسعهدهندگان است که جایگزینی برای تستهای غیررسمی و اصطلاحاً vibe-testing ارائه میدهد و امکان ارزیابی دادهمحور و سیستماتیک مدلها را فراهم میسازد.
🔹 همچنین Stax میتواند مدلها را با استفاده از ارزیابهای آماده یا سفارشی بررسی کند.
🔹 متریکهای اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسهی نتایج مدلهای مختلف همراه با شاخصهای بصری عملکرد در دسترس است.
✨ قابلیتها:
♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصیسازی متریکها متناسب با محصول
♻️جریان کاری end-to-end از مرحلهی نمونهسازی تا استقرار
🎯 هدف اصلی: کمک به توسعهدهندگان برای تصمیمگیری دقیقتر در انتخاب و بهکارگیری مدلهای زبانی.
@rss_ai_ir
#news #ai #ml #Google #Stax
ابزار Stax یک پروژهی آزمایشی برای توسعهدهندگان است که جایگزینی برای تستهای غیررسمی و اصطلاحاً vibe-testing ارائه میدهد و امکان ارزیابی دادهمحور و سیستماتیک مدلها را فراهم میسازد.
🔹 همچنین Stax میتواند مدلها را با استفاده از ارزیابهای آماده یا سفارشی بررسی کند.
🔹 متریکهای اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسهی نتایج مدلهای مختلف همراه با شاخصهای بصری عملکرد در دسترس است.
✨ قابلیتها:
♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصیسازی متریکها متناسب با محصول
♻️جریان کاری end-to-end از مرحلهی نمونهسازی تا استقرار
🎯 هدف اصلی: کمک به توسعهدهندگان برای تصمیمگیری دقیقتر در انتخاب و بهکارگیری مدلهای زبانی.
@rss_ai_ir
#news #ai #ml #Google #Stax
👍1🔥1👏1
🏓🤖 ربات پینگپنگباز خودران از برکلی
دانشجویان دانشگاه برکلی یک ربات انساننما طراحی کردهاند که میتواند کاملاً خودکار در مسابقات پینگپنگ شرکت کند. اگر سال گذشته در پروژهی DeepMind فقط یک بازوی رباتیک دیدیم، این بار یک گومانوید کامل با توانایی حرکت و هماهنگی بدن وارد میدان شده است.
🔑 مکانیزم کار HITTER (HumanoId Table TEnnis Robot):
1️⃣ برنامهریز سطح بالا (مغز)
✳️با کمک دوربینهای خارجی، پرواز توپ را دنبال میکند.
✳️مسیر حرکت توپ را پیشبینی کرده و محاسبه میکند که در چه نقطهای، با چه سرعت و در چه زمان باید ضربه بزند.
2️⃣ کنترلر سطح پایین (بدن)
✳️سیگنالهای برنامهریز را گرفته و آنها را به حرکات واقعی دست، پا، تنه و مفاصل تبدیل میکند.
✳️این بخش با الگوریتم PPO روی دادههای حرکت انسان آموزش داده شده است، بنابراین ضربات ربات طبیعی و شبیه انسان هستند: قدم برمیدارد، تنه میچرخاند و مثل بازیکن واقعی راکت را میچرخاند.
📊 نتایج عملکرد
✳️92.3٪ موفقیت در برگشت توپها (فقط یک خطا در هر 26 توپ).
✳️در یک آزمایش، ربات توانست 106 ضربهی متوالی را بدون خطا ادامه دهد.
✳️زمان واکنش: 0.42 ثانیه از لحظه ضربهی حریف تا پاسخ ربات.
🎯 در کل، این یک گام بزرگ در رباتیک ورزشی است. حالا سؤال اینجاست:
آیا روزی میتوانیم چنین رباتی را برای یک آخر هفته اجاره کنیم و باهاش پینگپنگ بازی کنیم؟ 😅
🔗 مشاهده مقاله
دانشجویان دانشگاه برکلی یک ربات انساننما طراحی کردهاند که میتواند کاملاً خودکار در مسابقات پینگپنگ شرکت کند. اگر سال گذشته در پروژهی DeepMind فقط یک بازوی رباتیک دیدیم، این بار یک گومانوید کامل با توانایی حرکت و هماهنگی بدن وارد میدان شده است.
🔑 مکانیزم کار HITTER (HumanoId Table TEnnis Robot):
1️⃣ برنامهریز سطح بالا (مغز)
✳️با کمک دوربینهای خارجی، پرواز توپ را دنبال میکند.
✳️مسیر حرکت توپ را پیشبینی کرده و محاسبه میکند که در چه نقطهای، با چه سرعت و در چه زمان باید ضربه بزند.
2️⃣ کنترلر سطح پایین (بدن)
✳️سیگنالهای برنامهریز را گرفته و آنها را به حرکات واقعی دست، پا، تنه و مفاصل تبدیل میکند.
✳️این بخش با الگوریتم PPO روی دادههای حرکت انسان آموزش داده شده است، بنابراین ضربات ربات طبیعی و شبیه انسان هستند: قدم برمیدارد، تنه میچرخاند و مثل بازیکن واقعی راکت را میچرخاند.
📊 نتایج عملکرد
✳️92.3٪ موفقیت در برگشت توپها (فقط یک خطا در هر 26 توپ).
✳️در یک آزمایش، ربات توانست 106 ضربهی متوالی را بدون خطا ادامه دهد.
✳️زمان واکنش: 0.42 ثانیه از لحظه ضربهی حریف تا پاسخ ربات.
🎯 در کل، این یک گام بزرگ در رباتیک ورزشی است. حالا سؤال اینجاست:
آیا روزی میتوانیم چنین رباتی را برای یک آخر هفته اجاره کنیم و باهاش پینگپنگ بازی کنیم؟ 😅
🔗 مشاهده مقاله
🔥2👍1😁1