VIRSUN
14K subscribers
494 photos
293 videos
2 files
297 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
🚀 معرفی Environments Hub؛ فروشگاه باز برای RL-Agents

🔹 شرکت Prime Intellect اولین پلتفرم باز برای ساخت و استفاده از محیط‌های یادگیری تقویتی (RL Environments) را معرفی کرد.

🌍 محیط RL همان دنیای مجازی‌ای است که قوانین و سیستم پاداش آن تعریف می‌شود تا عامل‌ها در آن آموزش ببینند.

✍️ مشکل اصلی اینجاست: ساخت یک محیط واقعی و پیچیده برای آموزش، بسیار پرهزینه است. مثلاً برای آموزش یک عامل برنامه‌نویس نیاز به:

✳️محیط شبیه‌سازی شده IDE با کامپایلر و دیباگر
✳️تعریف دقیق Reward Function
✳️ابزارهای مانیتورینگ و پایپ‌لاین آموزش
✳️مجموعه داده‌های واقعی و Edge-caseهای متعدد
✳️چنین چیزی در آزمایشگاه‌های بزرگ میلیون‌ها دلار هزینه دارد و در اوپن‌سورس تقریباً مشابهی وجود نداشت.

حالا Environments Hub این مشکل را حل می‌کند:

♻️اولین و تنها استور باز برای محیط‌های آماده RL
♻️شامل محیط‌هایی برای آموزش عامل‌های برنامه‌نویس، ریاضی‌دان، گیمر و بسیاری حوزه‌های دیگر
♻️کاهش چشمگیر هزینه و زمان توسعه RL


💡 آندری کارپاتی هم این حرکت را به شدت تحسین کرده و آن را یک تغییر بازی (Game Changer) در توسعه عامل‌ها دانسته است.

🔗 خودتان ببینید: Environments Hub

#هوش_مصنوعی #RL #یادگیری_تقویتی #AI_industrial_news #Agents

@rss_ai_ir
😁10🔥64🎉3👍1
⚡️ معرفی OLMoASR؛ مدل‌های باز تشخیص گفتار از AI2

مؤسسه هوش مصنوعی آلن (AI2) خانواده‌ای از مدل‌های تشخیص خودکار گفتار (ASR) به نام OLMoASR منتشر کرده است.

🎙️ مدل‌ها:

🟢 OLMoASR-tiny.en (۳۹M)

🟢 OLMoASR-base.en (۷۴M)

🟢 OLMoASR-small.en (۲۴۴M)

🟢 OLMoASR-medium.en (۷۶۹M)

🟠 OLMoASR-large.en-v1
(۱.۵B، آموزش‌دیده بر روی ۴۴۰ هزار ساعت صوت)

🟠 OLMoASR-large.en-v2
(۱.۵B، آموزش‌دیده بر روی ۶۸۰ هزار ساعت صوت)


📊 در تست روی ۲۱ دیتاست، عملکرد این مدل‌ها با Whisper از OpenAI قابل مقایسه بوده و در بعضی موارد، به‌ویژه روی فایل‌های صوتی طولانی، حتی از آن هم بهتر عمل کرده‌اند.

🔓 پروژه کاملاً اپن‌سورس است:

♻️انتشار وزن مدل‌ها
♻️دیتاست و کد پردازش داده‌ها
♻️اسکریپت‌های آموزش و ارزیابی
♻️همه در GitHub و Hugging Face در دسترس هستند.


📌 لایسنس: Apache 2.0

🟡 مقاله
🟡 مجموعه مدل‌ها
🟡 گزارش فنی
🟡 دمو
🖥 GitHub

#هوش_مصنوعی #تشخیص_گفتار #ASR #AI2 #OLMoASR #AI_industrial_news

@rss_ai_ir
7👍6🔥6🎉6
💡 یکی از جالب‌ترین کاربردهای Nano-Banana همین مینی‌اپ تازه‌دستکاری‌شده است:

📌 کافیست تصویر یک شیء را از کلیپ‌بورد وارد کنید؛ برنامه به‌صورت خودکار آن را به ایزومتریک تبدیل می‌کند تا بتوانید قطعات لازم برای ساختن SimCity رویایی خودتان را بچینید 🏙️

🔧 تغییرات جدید:

♻️افزودن امکان تغییر اندازه (Resize)
♻️بهبودهای کوچک در رابط و خروجی


🌎 امتحان کنید:
https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63

@rss_ai_ir

#nano_banana #isometric #SimCity #AItools #AI
👍1🔥1👏1
📌 لیست سالانه Time 100 AI منتشر شد

📰 مجله‌ی TIME مثل هر سال فهرست ۱۰۰ فرد تأثیرگذار در حوزه هوش مصنوعی رو منتشر کرده. در صدر اسامی، چهره‌های آشنا دیده می‌شن:
سام آلتمان، ایلان ماسک، جنسن هوانگ، متیو پرینس (Cloudflare)، مارک زاکربرگ، برادران آمودئی، وِین‌فِن و چندین نام بزرگ دیگه.

اما 😅 همه‌چیز به این سادگی هم نیست...
چون غیبت بعضی غول‌ها حسابی توی چشم می‌زنه:

ایلیا سوتسکِوِر
جفری هینتون
دِمیس هاسابیس
نوآم براون
یان لِکون
مصطفی سلیمان
آراوینگ سری‌نیواس

در عوض، افرادی توی لیست دیده می‌شن که شاید انتظارش رو نداشتید:

پاپ فرانسیس!
ریک روبین (همون چهره‌ی وایرالِ "وایب‌کُدینگ" 🤣)
چند نویسنده، هنرمند و روزنامه‌نگار

👀 نتیجه؟ ترکیب امسال کمی «عجیب» از آب دراومده. بعضی‌ها حس کردن به جای تمرکز روی پیشگامان علمی، کمی بیش‌تر به جنبه‌ی فرهنگی و رسانه‌ای توجه شده.

🔗 لیست کامل رو می‌تونید اینجا ببینید: time.com/collections/time100-ai-2025/

@rss_ai_ir

#news #ai #ml #Time100 #AIInfluencers
1👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 ترفند خلاقانه با img2vid

گاهی برای ساخت یک حرکت سینمایی یا ترنزیشن، فقط کافیست دو تصویر داشته باشی:
👁 اولین فریم
👁 آخرین فریم

📌 وقتی این دو فریم را به مدل‌های img2vid بدهیم، مدل تمام فریم‌های میانی را می‌سازد و یک انیمیشن روان تولید می‌کند.

🔹 نتیجه؟

شبیه حرکت دوربین واقعی 🎥

تغییر زاویه دید یا زوم طبیعی 🔍

ایجاد گذارهای سینمایی


به زبان ساده: به‌جای طراحی تک‌تک فریم‌ها، فقط شروع و پایان را بده، مدل خودش مسیر بین‌شان را پر می‌کند!

#هوش_مصنوعی #تولید_ویدیو #ترنزیشن #AI

🆔 @rss_ai_ir
🔥3👍1👏1
📊 درآمدهای AI Native استارتاپ‌ها

گزارش تازه نشان می‌دهد که استارتاپ‌های «AI native» شامل OpenAI، Anthropic و 16 شرکت دیگر در مجموع به درآمد سالانه ۱۸.۵ میلیارد دلار رسیده‌اند.

🔴 نکته کلیدی:

♻️همچنین OpenAI به‌تنهایی بیشترین سهم را دارد.
♻️بعد از آن Anthropic قرار گرفته است.
♻️سایر شرکت‌ها مثل xAI، Cursor و 14 استارتاپ دیگر هنوز فاصله زیادی با این دو غول دارند.


🟡 در واقع ۲ شرکت اول (OpenAI و Anthropic) نزدیک به ۸۸٪ کل درآمد این حوزه را به خود اختصاص داده‌اند.

💡 بقیه بازیگران مثل Midjourney، Perplexity، Synthesia، Replit، ElevenLabs، Runway و Cohere هنوز در حال رشد هستند، اما فعلاً در لیگ دیگری بازی می‌کنند.

@rss_ai_ir
#AI #استارتاپ #بازار #OpenAI #Anthropic
👍1🔥1👏1
🌟 ا Google Labs یک ابزار جدید برای ارزیابی ساختاریافته‌ی مدل‌های زبانی معرفی کرد.

ابزار Stax یک پروژه‌ی آزمایشی برای توسعه‌دهندگان است که جایگزینی برای تست‌های غیررسمی و اصطلاحاً vibe-testing ارائه می‌دهد و امکان ارزیابی داده‌محور و سیستماتیک مدل‌ها را فراهم می‌سازد.

🔹 همچنین Stax می‌تواند مدل‌ها را با استفاده از ارزیاب‌های آماده یا سفارشی بررسی کند.
🔹 متریک‌های اصلی شامل: روانی پاسخ، ایمنی، تأخیر (latency) و درصد موفقیت در بازبینی دستی هستند.
🔹 داشبوردی برای مقایسه‌ی نتایج مدل‌های مختلف همراه با شاخص‌های بصری عملکرد در دسترس است.

قابلیت‌ها:

♻️ارزیابی سریع و قابل تکرار
♻️امکان شخصی‌سازی متریک‌ها متناسب با محصول
♻️جریان کاری end-to-end از مرحله‌ی نمونه‌سازی تا استقرار


🎯 هدف اصلی: کمک به توسعه‌دهندگان برای تصمیم‌گیری دقیق‌تر در انتخاب و به‌کارگیری مدل‌های زبانی.

@rss_ai_ir

#news #ai #ml #Google #Stax
👍1🔥1👏1
🎬 نسل جدید ویدئوهای طولانی با روش Mixture of Contexts

محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کرده‌اند که مشکل اصلی مدل‌ها را حل می‌کند:
وقتی ویدئو طولانی می‌شود، توجه مدل بیش از حد «پف می‌کند»؛ محاسبات سنگین‌تر می‌شود، جزئیات از بین می‌رود، کاراکترها فراموش می‌شوند و تصویر «سر می‌خورد».


---

🔑 ایده اصلی: Mixture of Contexts

♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم می‌شود.
♻️هر کوئری فقط بخش‌های مرتبط را انتخاب می‌کند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام می‌شود (مقایسه ویژگی بخش‌ها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریم‌های آینده را می‌بندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخش‌های انتخاب‌شده اعمال می‌شود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.



---

📊 نتایج

♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنه‌های طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.



---

🎥 جمع‌بندی

✳️در ویدئوهای کوتاه، کیفیت حفظ می‌شود.
✳️در ویدئوهای طولانی، صحنه‌ها روان‌تر و کاراکترها پایدارتر هستند.
✳️زمان تولید به‌طور محسوسی کاهش می‌یابد.


🔑 نکته مهم:
مدل خودش یاد می‌گیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا می‌کند.

🔖 لینک مقاله

#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
🎉26👍2523🥰23😁22🔥18👏16
🤯 پژوهش تازه درباره خلاقیت متن

🔎 دانشمندان نشان داده‌اند: متن‌های نوشته‌شده توسط انسان از نظر نوآوری معنایی متنوع‌تر از متن‌های تولیدشده توسط هوش مصنوعی هستند.

🧮 روش سنجش
آن‌ها متریکی به نام *semantic novelty* معرفی کردند؛ فاصله کسینوسی بین جملات متوالی.

🧠 یافته‌های کلیدی

❇️ متن‌های انسانی در همه مدل‌های امبدینگ (RoBERTa, DistilBERT, MPNet, MiniLM) امتیاز نوآوری بالاتری داشتند.
❇️ در دیتاست داستان‌گویی مشترک انسان-هوش مصنوعی، بخش انسانی تنوع معنایی بیشتری ایجاد کرد.

نکته جالب
چیزی که در AI به‌عنوان *hallucination* شناخته می‌شود، در داستان‌گویی تعاملی می‌تواند مفید باشد؛ چون پیچش‌های غیرمنتظره به روایت اضافه می‌کند.

👉 نتیجه‌گیری:
انسان‌ها خلاق‌تر و نوآورتر هستند، هوش مصنوعی پیش‌بینی‌پذیرتر است، اما در کنار همدیگر ترکیبی قدرتمند برای داستان‌سرایی می‌سازند.

🔗 جزئیات: [لینک پژوهش](https://idanvidra.github.io/playing_along_paper_site/)

@rss_ai_ir 🤖📚

#هوش_مصنوعی #خلاقیت #متن #تحقیق #AI_industrial_news
😁15👏12👍11🔥9🥰87🎉5
This media is not supported in your browser
VIEW IN TELEGRAM
❤️‍🔥 PHD: Personalized 3D Humans ❤️‍🔥

🔹 محققان ETH و Meta رویکردی نوین به نام PHD معرفی کردند؛ روشی برای بازیابی مش سه‌بعدی انسان (HMR) و بدنه شخصی‌سازی‌شده که از اطلاعات اختصاصی شکل کاربر استفاده می‌کند.

این روش دقت بالاتری در بازسازی بدن سه‌بعدی به‌دست می‌دهد و برای کاربردهایی مثل واقعیت مجازی، بازی‌ها و فیتنس دیجیتال بسیار کارآمد است.

🔗 منابع:

👉 Paper
👉 Project : https://phd-pose.github.io/
👉 Repo (به‌زودی)

@rss_ai_ir 🤖💙

#هوش_مصنوعی #سه_بعدی #متا #ETH #BodyMesh #AI_industrial_news
🎉97👍5👏5🔥3🥰3😁3
🔔 مدیرعامل انویدیا: هوش مصنوعی می‌تواند هفته کاری چهارروزه بسازد

جنسن هوانگ معتقد است بهره‌وری ناشی از AI می‌تواند هفته کاری را به ۴ روز کاهش دهد؛ درست مثل انقلاب‌های صنعتی گذشته که سبک کار و زندگی را تغییر دادند.

به گفته او:

هوش مصنوعی کارهای تکراری را حذف می‌کند، اما به جای استراحت، فرصت بیشتری برای دنبال‌کردن ایده‌ها فراهم می‌شود.

آزمایش‌ها در انگلیس، آمریکا و کانادا نشان دادند که هفته چهارروزه باعث ۲۴٪ افزایش بهره‌وری و نصف‌شدن فرسودگی شغلی شد.

او این تحول را با گذار تاریخی از هفته ۷ روزه به ۵ روزه مقایسه کرد؛ و احتمال می‌دهد AI جهش بعدی را رقم بزند.


🗓 با این حال هشدار داد: شاید در نهایت حتی مشغول‌تر از قبل شویم.

شما حاضرید هفته کاری کوتاه‌تر داشته باشید، اگر به معنی شدت بیشتر کار در هر روز باشد؟

@rss_ai_ir 🤖

#هوش_مصنوعی #Nvidia #بهره‌وری #هفته_چهارروزه #AI_industrial_news
🎉13🥰8👍6😁6👏4🔥32
🖥️ نمونه‌های کدنویسی با GPT-5

با یک پرامپت ساده می‌توان یک وب‌سایت تک‌صفحه‌ای ساخت! 🎨
اینجا مجموعه‌ای از مثال‌ها جمع‌آوری شده که نشان می‌دهد چطور می‌توان از GPT-5 برای ایجاد اپلیکیشن‌های سبک استفاده کرد:

🔗 نمونه‌ها

نکته جالب اینجاست که هیچ جادویی در کار نیست؛ فقط سایت مرتب و شسته‌رفته‌ای ساخته شده تا بتوانید از آن ترفندها و ساختارهای مختلف یاد بگیرید.

📌 حتی می‌توانید ببینید چطور پرامپت مستقیماً داخل کادر ورودی قرار داده می‌شود و کافی است روی Enter بزنید:
👉 مثال زنده

@rss_ai_ir 🤖💡

#GPT5 #هوش_مصنوعی #کدنویسی #فرانت‌اند #وب #AI_industrial_news
👍3🔥1🙏1
🍌 معرفی Zananabanana — مدلی با «درک از جهان»

برخلاف Flux یا Reve، درون بانانا یک مدل زبانی چندوجهی (Multimodal LLM) قرار دارد که فقط تصویر تولید نمی‌کند، بلکه مفاهیم پایه‌ای از جهان را هم می‌شناسد:

کمی فیزیک بلد است ⚖️

✳️جغرافیا را خوب می‌شناسد 🌍
✳️از تاریخ سر در می‌آورد 📜
✳️و به‌طور کلی ارتباطات و قوانین دنیا را می‌فهمد.


👉 به همین دلیل می‌توان پرامپت‌هایی هوشمندانه‌تر نسبت به مدل‌های دیفیوشنی نسل قبل نوشت.

🔹 یکی از ترفندهای جالب: استفاده از جایگزینی داخل [object] در پرامپت.
مثال:
"Make an isometric model of the [object] only."

که در آن [object] می‌تواند house یا room باشد.

امکانات جذاب:

♻️می‌توان درخواست چند زاویه مختلف از همان ایزومتریک را داد.

♻️می‌توان رندرها را در ابزارهایی مثل Klinger (با قابلیت First Frame → Last Frame) انداخت و پروازی مجازی روی آبجکت داشت.

♻️حتی می‌شود خواست یک wireframe روی آن بیندازد، انگار که یک مدل سه‌بعدی پولیگانی است.


@rss_ai_ir 🤖🎨

#هوش_مصنوعی #مدل_تولیدی #بانانا #گرافیک #AI_industrial_news
👏29😁27🎉2423🥰21🔥17👍14
🛠️ CAD-GPT:
هوش مصنوعی برای طراحی سه‌بعدی

♻️مدل CAD-GPT یک LLM چندوجهی است که می‌تواند بر اساس پرامپت متنی یا حتی یک تصویر، فایل‌های CAD (به‌صورت مجموعه‌ای از پارامترها) تولید کند.

🔹 در نمونه‌های ارائه‌شده، اشکال ساده سه‌بعدی ساخته شده‌اند، اما همین هم نشان می‌دهد که این رویکرد می‌تواند نقطه شروعی جدی برای طراحی هوشمند باشد.

💡 ایده اصلی روش:
♻️مدل، موقعیت‌های سه‌بعدی در فضا را به یک فضای زبانی یک‌بعدی نگاشت می‌کند؛ در نتیجه خروجی آن چیزی شبیه کد CAD است.

📄 جزئیات بیشتر: CAD-GPT

@rss_ai_ir 🤖🏗️

#هوش_مصنوعی #مدل_زبان #CAD #سه‌بعدی #طراحی #AI_industrial_news
🔥15👏14🎉13👍10😁108🥰6
This media is not supported in your browser
VIEW IN TELEGRAM
🪴 Pixie: Physics from Pixels 🪴

پژوهشگران دانشگاه‌های UPenn و MIT از مدل Pixie رونمایی کردند؛ یک شبکه عصبی که می‌تواند ویژگی‌های بصری پیش‌آموزش‌دیده (مثل CLIP) را به فیلدهای متراکم ویژگی‌های فیزیکی مواد نگاشت کند — آن هم تنها در یک forward pass.

🔹 نتیجه: شبیه‌سازی فیزیک در زمان واقعی (Real-time)

📂 این پروژه شامل دیتاست و کد متن‌باز تحت لایسنس MIT است.

🔗 منابع:
👉 مرور
👉 پروژه
👉 مخزن کد

@rss_ai_ir 🤖🧩

#هوش_مصنوعی #شبیه‌سازی #Pixie #فیزیک #بینایی_ماشین #AI_industrial_news
👍9😁5🎉54🔥4🥰4👏4
This media is not supported in your browser
VIEW IN TELEGRAM
🍏 اپل دو مدل متن‌باز جدید معرفی کرد: FastVLM و MobileCLIP2

🔹 این مدل‌ها تا ۸۵ برابر سریع‌تر و ۳.۴ برابر کوچک‌تر از نسل قبلی هستند.
🔹 مناسب برای پردازش تصاویر با وضوح بالا در کاربردهایی مثل:

♻️OCR (تشخیص متن از تصویر)

♻️Image Captioning (تولید توضیحات برای تصاویر)

♻️Visual Question Answering (پاسخ به سوالات تصویری)

♻️Image Understanding (درک محتوای تصویر)


⚡️ اپل با این حرکت جدی‌تر از همیشه وارد رقابت مدل‌های سبک و سریع برای کاربردهای صنعتی و موبایلی شده است.

لینک
@rss_ai_ir

#Apple #AI #FastVLM #MobileCLIP2 #VisionModels
👍2🔥2👏2
🎬 PixVerse V5؛ نسل تازه‌ای از مدل‌های ویدیویی

بعد از موج Veo3، Kling، Minimax و Higgs، حالا نوبت به PixVerse V5 رسیده. به‌نظر می‌رسد این نسخه تمام قابلیت‌های ترند روز را یک‌جا جمع کرده — حتی تا مرحله‌ی Lip-sync 👄🎶

🔹 طبق نمونه‌های منتشرشده (Cherry-pickها)، خروجی‌ها کیفیت بالایی دارند.

🔹 اولین دموی رسمی: یک تریلر ساخته‌شده با PixVerse و تصاویر تولیدی از Banana 🍌 — نتیجه واقعاً چشم‌نواز و قابل توجهه.


👀 اگر کسی تجربه کار عملی با این مدل داره، حتماً در کامنت‌ها به اشتراک بذاره.
من فعلاً در لیست پیگیری نگهش می‌دارم تا ببینیم چه آینده‌ای براش رقم می‌خوره.


🔗 تست و جزئیات: PixVerse V5

@rss_ai_ir 🤖🎥
#هوش_مصنوعی #مدل_ویدیویی #PixVerse #تولید_محتوا #AI_industrial_news
👍2🔥1👏1
🌐 Droplet3D
؛ نسل جدید مدل‌های سه‌بعدی از چین

♻️مدل Droplet3D برای آموزش از ویدیو استفاده می‌کند. این یعنی سیستم می‌تواند از ویدیوها اطلاعات فضایی اجسام را استخراج کرده و در نتیجه کیفیت بازسازی سه‌بعدی را بالا ببرد. 📹➡️🧩➡️🕹️

🔹 هرچه ویدیو زاویه‌های بیشتری داشته باشد، اطلاعات دقیق‌تری از شکل و ساختار شیء به دست می‌آید.

📊 زیرساخت این پروژه دیتاست عظیم Droplet3D-4M است؛ شامل ۴ میلیون شیء سه‌بعدی با توضیحات متنی کامل.

هرچند در دموی اولیه کیفیت هنوز شبیه نسل‌های قدیمی‌تر و کمی خشن به‌نظر می‌رسد، اما رویکرد نشان می‌دهد که در آینده نزدیک شاهد جهش جدی در مدل‌های 3D خواهیم بود.

🔗 جزئیات بیشتر: Droplet3D

@rss_ai_ir 🤖🎥🏗️

#هوش_مصنوعی #مدل_سه‌بعدی #3D #بینایی_ماشین #AI_industrial_news
👍11🔥6👏6🎉64🥰3😁2