VIRSUN
15.6K subscribers
368 photos
222 videos
2 files
227 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ ویژگی Gemini live که باهاش میتونید با جمنای صحبت کنید حالا امکان فعال کردن زیرنویس رو اضافه کرده که وقتی باهاش صحبت میکند یه کپشن پایین جمنای میاد و به صورت زنده صحبت‌هارو به صورت متن هم نمایش میده، اسمش کپشن لایو هست و میتونید فعال یا غیرفعالش کنید.

⬅️بیشتر بخوانید: https://gemini.google/latest-news/#drops



#هوش‌_مصنوعی #Gemini

🆔 @rss_ai_ir
👍2🔥2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖💥 پلتفرم MassGen؛ معماری چندعاملی برای همکاری بین مدل‌های هوش مصنوعی

پروژه MassGen یک چارچوب پیشرفته برای تعامل میان چندین عامل هوش مصنوعی (AI agents) است که با هدف تقسیم وظایف پیچیده میان مدل‌های مختلف طراحی شده است.
این سیستم با استفاده از هوش مصنوعی تعاملی و چندعاملی (collaborative AI)، امکان حل مسئله‌های سطح بالا را با همکاری مدل‌های متعدد فراهم می‌سازد.

🧩 ویژگی‌های کلیدی MassGen:

♻️هم‌افزایی بین مدل‌ها (model synergy)
♻️پردازش موازی وظایف پیچیده
♻️اشتراک دانش و تعامل چندعاملی
♻️ساخت اجماع (consensus) بین عامل‌ها
♻️نمایش زنده و گرافیکی از روند همکاری


📡 قابلیت اتصال به مدل‌های هوش مصنوعی برجسته مانند:

♻️Google Gemini
♻️OpenAI (مانند GPT)
♻️xAI Grok
♻️و همچنین پشتیبانی از ابزارهای سفارشی (Custom tools) و حالت تعاملی گفت‌وگو بین عامل‌ها.


این پروژه برای توسعه‌دهندگان، محققان و علاقه‌مندان به سیستم‌های چندعاملی و تعامل بین مدل‌های زبانی می‌تواند بستری فوق‌العاده قدرتمند و قابل توسعه باشد.

🔗 سورس‌کد و اطلاعات بیشتر:
github.com/Leezekun/MassGen

——
@rss_ai_ir
#هوش_مصنوعی #MultiAgent #MassGen #سیستم_هوشمند #پروژه_AI #GPT #Gemini #Grok #مدل_چندعاملی #هوش_تعاملی
👍2👏1🙏1
🎨 رقابت داغ در تولید تصویر با متن؛ Imagen 4 Ultra و GPT-Image-1 در صدر جهان

---

در تازه‌ترین رتبه‌بندی از بهترین مدل‌های تولید تصویر از متن (Text-to-Image) توسط lmarena.ai، مدل Imagen 4.0 Ultra از گوگل موفق شده با مدل GPT-Image-1 از OpenAI رتبه مشترک اول را کسب کند. این دو مدل در حال حاضر، قوی‌ترین سیستم‌های هوش مصنوعی جهان در تبدیل متن به تصویر شناخته می‌شوند. 🔥

---

📊 جزئیات رتبه‌بندی:
🥇 Imagen 4 Ultra (Google) – امتیاز 1138
🥇 GPT-Image-1 (OpenAI) – امتیاز 1137
🥉 Imagen 4.0 استاندارد – امتیاز 1117
📌 با رأی دهی ده‌ها هزار کاربر واقعی و اختلاف بسیار کم در دقت و کیفیت

---

📌 این موفقیت در حالی ثبت شده که گوگل در حال آماده‌سازی آپدیت‌های بزرگ تصویری برای Gemini 2.5 Pro و نسخه آینده Gemini 3 Pro است. به‌نظر می‌رسد در آینده نزدیک، موتور تصویرسازی Gemini با مدل Imagen ادغام خواهد شد.

---

🤖 اگر با مدل‌هایی مثل DALL·E کار کردی، وقتشه Imagen 4 Ultra و GPT-Image-1 رو هم تست کنی!
تو کدوم رو ترجیح می‌دی؟ دقت GPT یا تنوع تصویر Imagen؟ 👇

---

#هوش_مصنوعی #تولید_تصویر #TextToImage #Imagen4 #GPTImage #OpenAI #GoogleAI #Gemini #AIart

📡 :
🔗 https://yangx.top/rss_ai_ir
🔥2👍1👏1🙏1
🧠 پشته‌ی توسعه‌دهندگان RAG (بازیابی + تولید) به زبان ساده!

♻️این تصویر، نمای کاملی از ابزارها و لایه‌های مورد استفاده برای ساخت سیستم‌های RAG رو نشون می‌ده — از استخراج داده گرفته تا مدل زبانی و ارزیابی نهایی.


📌 خلاصه مهم‌ترین اجزا:
🔹 مدل‌های زبانی (LLMs):
متن‌باز: LLaMA 3.3، Mistral، Phi-4، Qwen 2.5، Gemma 3، DeepSeek
بسته: GPT (OpenAI)، Claude (Anthropic)، Gemini (Google)، Cohere، Amazon

🔹 فریم‌ورک‌ها برای پیاده‌سازی RAG:
LangChain، LlamaIndex، Haystack، Txtai

🔹 دیتابیس برداری (Vector DBs):
Chroma، Pinecone، Weaviate، Qdrant، Milvus

🔹 استخراج داده:
از وب: Crawl4AI، ScrapeGraphAI، FireCrawl
از اسناد: MegaParser، Docling، LlamaParse، ExtractThinker

🔹 مدل‌های برداری متن (Text Embedding):
SBERT، Nomic، Ollama، OpenAI، Cohere


🔹 ارزیابی عملکرد:
Giskard، Ragas، Trulens، Voyage AI
🔧 همه این ابزارها با هدف ساخت یک سیستم هوشمند RAG ترکیب می‌شن که بتونه اطلاعات رو از منابع مختلف بگیره، بفهمه، و خروجی دقیق تولید کنه.


📣 اگر می‌خوای مدل‌های Retrieval-Augmented Generation حرفه‌ای بسازی، این پشته‌ی ابزارها دقیقاً چیزیه که باید بلد باشی!


📍 آموزش‌ها و ابزارهای بیشتر در:
@rss_ai_ir
#RAG #هوش_مصنوعی #LLM #LangChain #پردازش_زبان #بردار_متن #استخراج_داده #پشته_توسعه #AItools #openai #gemini #cohere #ragstack
👏21🔥1
-

🔥 گوگل دیپ‌مایند به‌تازگی مدل قدرتمند Gemini 2.5 Deep Think را برای کاربران نسخه Ultra منتشر کرده است.

📏 ظرفیت کانتکست این مدل به ۱ میلیون توکن می‌رسد و توانایی تولید خروجی تا ۱۹۲ هزار توکن را دارد — مناسب برای تحلیل‌های عمیق و مولدهای بسیار بزرگ.

📊 نتایج بنچمارک‌ها واقعاً شگفت‌انگیزند:

▪️ HLE: امتیاز ۳۴.۸٪
▪️ Live Code Bench: دقت ۸۶.۶٪
▪️ AIME 2025: عملکرد فوق‌العاده با امتیاز ۹۹.۲٪

😮 در حالی که همه درباره GPT-5 صحبت می‌کنند، گوگل بی‌سر و صدا یکی از بهترین مدل‌ها را عرضه کرده که عملاً مرزهای هوش مصنوعی را جابجا کرده.

📌 اگر به دنبال استفاده از مدل‌های پیشرفته برای تولید محتوا، کدنویسی یا پردازش داده‌های سنگین هستید، Gemini 2.5 یکی از بهترین گزینه‌های موجود است.

🟢 نظر شما در مورد این مدل جدید چیست؟ آیا وقت آن نرسیده که به نسخه Ultra کوچ کنیم؟

#هوش_مصنوعی #گوگل #Gemini #مدل_زبان #DeepMind
@rss_ai_ir
👍55🥰52👏51😁48🎉4742🔥31
🔧 هات‌پیپر هوش مصنوعی در رباتیک | ۲۰۲۵

📌 مدل Gemini Robotics: ورود رسمی هوش مصنوعی به دنیای فیزیکی

گوگل دیپ‌مایند در مقاله‌ای با عنوان Gemini Robotics مدل جدیدی را معرفی کرده که توانایی ترکیب بینایی، زبان و حرکت (Vision-Language-Action) را برای کنترل بازوهای ربات در محیط‌های واقعی دارد — بدون نیاز به آموزش سخت‌افزاری خاص!

📌 ویژگی‌های کلیدی:
🔹 مدل پایه گرفته‌شده از Gemini 2.0
🔹 توانایی کنترل ربات در محیط واقعی با ورودی زبان طبیعی
🔹 تعمیم بالا برای سخت‌افزارهای مختلف (Franka، Aloha2، Apptronik)
🔹 درک فضایی-زمانی، پیش‌بینی مسیر، گرفتن اشیا

📍 چطور کار می‌کنه؟
با فقط چند صد مثال، مدل به ربات جدید منتقل میشه و می‌تونه کارهایی مثل تا کردن اوریگامی یا برداشتن اشیا رو انجام بده — انگار ربات "می‌فهمه" کجا هست و باید چه کار کنه.

🧠 این مقاله چرا انقلابی‌ست؟
برای اولین‌بار اتصال عمیق NLP و حرکت فیزیکی ایجاد شده. ربات‌ها حالا می‌تونن مثل انسان فکر کنن، حرف بزنن و دست به عمل بزنن — فقط با یک مدل!

🌐 لینک مقاله:
🔗 arxiv.org/abs/2503.20020
📖 گزارش کامل:
🔗 deepmind.google
📰 مقاله Wired:
🔗 wired.com

📡 با ما همراه باش تو @rss_ai_ir

#رباتیک #هوش_مصنوعی #Gemini #DeepMind #AI #EmbodiedAI #VLA #روبات #هات_پیپر
22🎉21🔥19😁19👏13👍12🥰11
🤖 مغز متفکر پشت ChatGPT و Gemini چیست؟ با RLHF آشنا شوید! 🧠

تا حالا از خودتان پرسیده‌اید چطور مدل‌های هوش مصنوعی مثل ChatGPT یا Gemini اینقدر خوب، مفید و "انسان‌گونه" صحبت می‌کنند؟ جواب در یک تکنیک انقلابی به نام RLHF نهفته است.

عبارت RLHF مخفف چیست؟
R**einforcement **L**earning from **H**uman **F**eedback
یادگیری تقویتی از بازخورد انسانی


به زبان ساده، RLHF فرآیندی است که در آن انسان‌ها به هوش مصنوعی "درس اخلاق و رفتار" می‌دهند!

---

🤔 این فرآیند چطور کار می‌کند؟

این جادو در سه مرحله اتفاق می‌افتد:

1️⃣ آموزش اولیه (کسب دانش خام):
یک مدل زبانی بزرگ (LLM) با حجم عظیمی از داده‌های اینترنتی آموزش می‌بیند تا اصول زبان و دانش عمومی را یاد بگیرد. در این مرحله، مدل مثل یک دانشمند همه‌چیزدان اما کمی بی‌ملاحظه است.

2️⃣ ساخت "وجدان" مصنوعی (مدل پاداش):
اینجاست که انسان‌ها وارد می‌شوند!
* مدل برای یک سوال، چندین جواب مختلف تولید می‌کند.
* اپراتورهای انسانی این جواب‌ها را از بهترین به بدترین رتبه‌بندی می‌کنند (مثلاً: جواب A عالیه، جواب B خوبه، جواب C بده).
* با هزاران نمونه از این رتبه‌بندی‌ها، یک مدل جدید به نام "مدل پاداش" (Reward Model) ساخته می‌شود. این مدل یاد می‌گیرد که مثل یک انسان، پاسخ‌های خوب را از بد تشخیص دهد. در واقع، این مدل نقش "وجدان" یا "معیار سنجش" را برای هوش مصنوعی ایفا می‌کند.

3️⃣ تنظیم دقیق با یادگیری تقویتی (مرحله ادب‌آموزی):
* مدل اصلی حالا سعی می‌کند پاسخ‌هایی تولید کند که از "مدل پاداش" امتیاز بالایی بگیرند.
* اگر پاسخی تولید کند که مفید، صادقانه و بی‌خطر باشد، پاداش می‌گیرد و آن مسیر را تقویت می‌کند.
* اگر پاسخ بدی بدهد، تنبیه (پاداش منفی) می‌شود و یاد می‌گیرد که دیگر آن اشتباه را تکرار نکند.

این چرخه بارها و بارها تکرار می‌شود تا مدل نهایی، یک دستیار هوشمند، هم‌راستا با ارزش‌های انسانی و ایمن باشد.

---

💡 چرا RLHF اینقدر مهم است؟

این تکنیک مدل‌های هوش مصنوعی را از یک ماشین پاسخگوی ساده به یک همکار و دستیار قابل اعتماد تبدیل می‌کند که مفاهیم پیچیده‌ای مثل ادب، مفید بودن و ایمنی را درک می‌کند.

📚 برای مطالعه بیشتر و منابع فنی:

اگر به جزئیات فنی علاقه‌مندید، این منابع فوق‌العاده هستند:

🔗 مقاله وبلاگ Hugging Face (توضیح عالی):
این مقاله یکی از بهترین منابع برای درک عمیق و تصویری RLHF است.
[https://huggingface.co/blog/rlhf]

👨‍💻 ریپازیتوری گیت‌هاب (کتابخانه TRL):
کتابخانه trl از Hugging Face به شما اجازه می‌دهد تا مدل‌های خود را با استفاده از RLHF آموزش دهید. نمونه کدها و مستندات کاملی دارد.
[https://github.com/huggingface/trl]

@rss_ai_ir
#هوش_مصنوعی #یادگیری_ماشین #یادگیری_تقویتی #RLHF #ChatGPT #Gemini #تکنولوژی #AI #MachineLearning
20😁19👍18🥰16🎉14🔥13👏13🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
آخرین وضعیت رقابت مدل‌های هوش مصنوعی در المپیک AI (بازی شطرنج)

در رقابتی که به‌عنوان محک استدلال و تصمیم‌گیری مدل‌های زبانی طراحی شده، نتایج اولیه جالب توجه است:

🔹 مدل گروک دقیق‌ترین و قوی‌ترین بازی‌ها را تا این لحظه ارائه داده
🔹 مدل جمینی نیز با اختلاف اندک در جایگاه دوم قرار گرفته
🔹 تیم اوپن‌AI در تصمیم‌گیری‌های لحظه‌ای دچار اشتباهات زیادی شده
🔹 مدل کلود برخلاف انتظارات، عملکرد ناامیدکننده‌ای داشته
🔹 در نهایت، DeepSeek ضعیف‌ترین عملکرد را در جدول از خود نشان داده است

این رقابت، فرصتی منحصربه‌فرد برای سنجش مهارت‌های استدلالی و واکنش هوش مصنوعی در محیط‌های پیچیده و تعاملی است.

#هوش_مصنوعی #شطرنج #Grok #Gemini #Claude #OpenAI
@rss_ai_ir 🤖
👏23🎉18👍17🥰16😁15🔥1311🙏1
🚀 مدل جی‌پی‌تی-۵ به‌عنوان یک نقطه عطف در دنیای کدنویسی شناخته شده است

@rss_ai_ir

🧑‍💻 یکی از توسعه‌دهندگان باسابقه که از نسخه‌های مختلف GPT از ابتدا تاکنون استفاده کرده، تجربه‌ی خود را از کار با GPT-5 این‌گونه توصیف کرده:

💡 عملکرد در کدنویسی واقعاً حیرت‌انگیز است. به‌گونه‌ای که پروژه‌ای کامل با زبان پایتون در مدت دو ساعت همراه با تقسیم‌بندی ماژول‌ها، اضافه کردن منطق جدید، و اجرای نهایی بدون خطا تولید شده — چیزی که با Gemini Pro 2.5 یا Sonnet 4 هرگز قابل دستیابی نبوده است.


🌐 تنها با یک درخواست ساده، یک صفحه‌ی کامل وب طراحی شده که شامل استایل‌ها، انیمیشن‌ها، وضعیت دکمه‌ها و طراحی واکنش‌گراست. فرقی ندارد که ایده‌ی اولیه باشد یا مقاله علمی، مدل به‌سرعت آن را به وب‌سایت کاربردی تبدیل می‌کند.


📸 دیباگ از روی اسکرین‌شات‌ها هم به‌درستی انجام می‌شود. به‌عنوان مثال، این صفحات فقط در ۱ تا ۳ تعامل ساخته شده‌اند:
https://shir-man.com/pie-photo/
https://shir-man.com/solar/


📅 با توجه به اینکه آموزش مدل تا مهر ۱۴۰۳ (اکتبر ۲۰۲۴) ادامه داشته، اطلاعات آن شامل Agentهای LLM، نحوه‌ی اتصال به API شرکت‌های بزرگ و ساخت سریع نرم‌افزارهای مدرن است.


📉 در مقایسه با مدل‌های رقیب، نه‌تنها کیفیت بالاتری دارد، بلکه هزینه‌ی استفاده از آن نیز پایین‌تر است. حتی می‌توان در API مشخص کرد که مدل چه‌میزان «زمان تفکر» داشته باشد و این ویژگی در قیمت خروجی تأثیرگذار است.


🔧 هرچند گاهی در مسائل ساده، بیش‌ازحد مهندسی‌شده عمل می‌کند، اما همین پیچیدگی‌ها در عمل به نتیجه‌ی درست منجر می‌شوند — نه مانند رقبایی که خروجی‌های اشتباه یا بلااستفاده تولید می‌کنند.


📌 این مدل اولین تجربه‌ی واقعی از یک "همکار هوشمند" برای توسعه‌دهندگان است. رقبایی مثل Anthropic باید برای رسیدن به چنین سطحی، گام‌های بزرگی بردارند.


#جی_پی_تی۵ #هوش_مصنوعی #کدنویسی #پایتون #openai #مدل_زبان #هوش_برنامه_نویس #Claude #Gemini #توسعه_نرم_افزار #ai4dev


@rss_ai_ir
🎉13👍10👏10😁9🥰84🔥3
نمودار رشد ماه‌به‌ماه بازدید از وب‌سایت‌های برتر GenAI نشان می‌دهد که Grok با رشد چشمگیر ۲۷.۲۷٪ در صدر قرار دارد و به‌وضوح Grok 4 تأثیر بزرگی بر افزایش استفاده کاربران گذاشته است.

📊 آمار تغییرات (جولای ۲۰۲۵ نسبت به ژوئن ۲۰۲۵):

* ChatGPT.com ۶.۰۳٪
* Gemini.google.com ۷.۸۸٪
* DeepSeek.com ۹.۱۷٪
* Grok.com ۲۷.۲۷٪
* Perplexity.ai ۸.۶۰٪
* Claude.ai ۱۰.۴۷٪

به نظر می‌رسد رقابت بین پلتفرم‌های هوش مصنوعی مولد روزبه‌روز شدیدتر می‌شود و Grok با آپدیت جدید خود جهش قابل توجهی داشته است.

#هوش_مصنوعی 🤖 #GenAI 📈 #Grok 🚀 #ChatGPT 💬 #Claude 🧠 #Gemini 🌐

@rss_ai_ir 🚀
👍1🔥1👏1
🩺 گوگل از سیستم هوش مصنوعی پزشکی g-AMIE رونمایی کرد — مدلی که به‌جای جایگزینی پزشک، نقش دستیار تشخیصی را ایفا می‌کند.


---

🔍 ایده اصلی

مدل به‌طور مستقیم توصیه پزشکی نمی‌دهد، بلکه برای پزشک یک خلاصه اطلاعاتی و فرضیه‌های قابل بررسی تولید می‌کند.
هسته سیستم بر پایه Gemini 2.0 Flash ساخته شده، اما طراحی آن به‌شکل سه عامل تخصصی انجام می‌شود:

1️⃣ عامل گفت‌وگویی — با بیمار گفتگو می‌کند، مدارک را دریافت می‌کند و یک جمع‌بندی اولیه با فرضیه‌ها ارائه می‌دهد.
2️⃣ عامل بازبین — بررسی می‌کند که محتوای عامل گفت‌وگویی شامل توصیه پزشکی مستقیم نباشد (این اختیار فقط با پزشک است).
3️⃣ عامل SOAP — گزارش نهایی را در قالب:

✳️یافته‌های عینی
✳️فرضیه‌ها و برنامه بررسی
✳️پیش‌نویس توضیح برای بیمار
تهیه می‌کند.


---

🏥 فرآیند استفاده

پزشک در یک رابط کاربری، گزارش را مرور و ویرایش می‌کند، سپس تصمیم می‌گیرد تشخیص نهایی و برنامه درمانی چه باشد.


---

📊 نکات قابل توجه

✳️تمرکز گوگل بر تقویت نقش پزشک، نه جایگزینی او
✳️امکان استفاده تقریباً بدون ریسک در محیط‌های درمانی واقعی

در آزمایش‌ها، g-AMIE از نظر دقت فرضیه‌های تشخیصی، برنامه درمانی پیشنهادی و حتی سطح همدلی، عملکردی بهتر از پزشکان و کادر درمان تازه‌کار داشته است.


📎 اطلاعات بیشتر در وبلاگ گوگل

#هوش_مصنوعی 🤖 #پزشکی 🩺 #گوگل 🏢 #سیستم_تشخیصی #Gemini
👍76😁6🎉5🔥3
🛠 نقشه‌راه عمومی Gemini CLI منتشر شد — هدف: ساخت یک عامل کدنویسی متن‌باز قدرتمند با محوریت جامعه کاربری.

پروژه در ۴ جهت اصلی در حال توسعه است:

1️⃣ قابل‌گسترش (Extensible)
امکان توسعه‌پذیری برای هر محیط و سناریو: اسلش‌کامندهای سفارشی، پروتکل‌های ریموت، اجرای فایل‌های .gemini.md با ابزارهای کاربر.

2️⃣ در همه‌جا (Everywhere)
اجرای عامل به‌عنوان یک فرآیند پس‌زمینه در محیط‌های مختلف: لوکال، کانتینرها، GitHub Actions و فضای ابری. حتی پشتیبانی از تفویض وظیفه به زیرعامل‌ها.

3️⃣ هوشمند (Intelligent)
تمرکز بر کیفیت مدل‌ها و ابزارها؛ هدف کسب رتبه‌های بالا در بنچمارک‌هایی مثل SWE Bench. تمامی باگ‌های حیاتی (P0) پیش از نسخه ۱.۰ رفع خواهند شد.

4️⃣ متن‌باز (Open Source)
ساخته‌شده در تعامل با جامعه: پاسخ سریع به Issues و PRها، بکلاگ حداقلی و فرآیندهای مشارکت ساده و روان.


---

🔄 جریان‌های کاری (Workstreams) فعلی:

♻️بهبود کیفیت مدل (تقویت استدلال، حذف تکرارها)
♻️بهینه‌سازی عملکرد (Caching، مسیریابی هوشمند مدل‌ها)
♻️گسترش‌پذیری (عامل‌های پس‌زمینه، استقرار ابری)
♻️اتوماسیون جامعه (بهبود Dev Flow)


📌 اگر می‌خواهید در توسعه نسل بعدی ابزارهای کدنویسی AI مشارکت کنید، اکنون بهترین زمان برای پیوستن به Gemini CLI است.

🔗 جزئیات در گیت‌هاب

#هوش_مصنوعی #کدنویسی #Gemini #متن_باز
@rss_ai_ir
13👍12🔥10🎉10😁9👏4🥰3