🎨 رقابت داغ در تولید تصویر با متن؛ Imagen 4 Ultra و GPT-Image-1 در صدر جهان
---
در تازهترین رتبهبندی از بهترین مدلهای تولید تصویر از متن (Text-to-Image) توسط lmarena.ai، مدل Imagen 4.0 Ultra از گوگل موفق شده با مدل GPT-Image-1 از OpenAI رتبه مشترک اول را کسب کند. این دو مدل در حال حاضر، قویترین سیستمهای هوش مصنوعی جهان در تبدیل متن به تصویر شناخته میشوند. 🔥
---
📊 جزئیات رتبهبندی:
🥇 Imagen 4 Ultra (Google) – امتیاز 1138
🥇 GPT-Image-1 (OpenAI) – امتیاز 1137
🥉 Imagen 4.0 استاندارد – امتیاز 1117
📌 با رأی دهی دهها هزار کاربر واقعی و اختلاف بسیار کم در دقت و کیفیت
---
📌 این موفقیت در حالی ثبت شده که گوگل در حال آمادهسازی آپدیتهای بزرگ تصویری برای Gemini 2.5 Pro و نسخه آینده Gemini 3 Pro است. بهنظر میرسد در آینده نزدیک، موتور تصویرسازی Gemini با مدل Imagen ادغام خواهد شد.
---
🤖 اگر با مدلهایی مثل DALL·E کار کردی، وقتشه Imagen 4 Ultra و GPT-Image-1 رو هم تست کنی!
تو کدوم رو ترجیح میدی؟ دقت GPT یا تنوع تصویر Imagen؟ 👇
---
#هوش_مصنوعی #تولید_تصویر #TextToImage #Imagen4 #GPTImage #OpenAI #GoogleAI #Gemini #AIart
📡 :
🔗 https://yangx.top/rss_ai_ir
---
در تازهترین رتبهبندی از بهترین مدلهای تولید تصویر از متن (Text-to-Image) توسط lmarena.ai، مدل Imagen 4.0 Ultra از گوگل موفق شده با مدل GPT-Image-1 از OpenAI رتبه مشترک اول را کسب کند. این دو مدل در حال حاضر، قویترین سیستمهای هوش مصنوعی جهان در تبدیل متن به تصویر شناخته میشوند. 🔥
---
📊 جزئیات رتبهبندی:
🥇 Imagen 4 Ultra (Google) – امتیاز 1138
🥇 GPT-Image-1 (OpenAI) – امتیاز 1137
🥉 Imagen 4.0 استاندارد – امتیاز 1117
📌 با رأی دهی دهها هزار کاربر واقعی و اختلاف بسیار کم در دقت و کیفیت
---
📌 این موفقیت در حالی ثبت شده که گوگل در حال آمادهسازی آپدیتهای بزرگ تصویری برای Gemini 2.5 Pro و نسخه آینده Gemini 3 Pro است. بهنظر میرسد در آینده نزدیک، موتور تصویرسازی Gemini با مدل Imagen ادغام خواهد شد.
---
🤖 اگر با مدلهایی مثل DALL·E کار کردی، وقتشه Imagen 4 Ultra و GPT-Image-1 رو هم تست کنی!
تو کدوم رو ترجیح میدی؟ دقت GPT یا تنوع تصویر Imagen؟ 👇
---
#هوش_مصنوعی #تولید_تصویر #TextToImage #Imagen4 #GPTImage #OpenAI #GoogleAI #Gemini #AIart
📡 :
🔗 https://yangx.top/rss_ai_ir
🔥2👍1👏1🙏1
🧠 پشتهی توسعهدهندگان RAG (بازیابی + تولید) به زبان ساده!
♻️این تصویر، نمای کاملی از ابزارها و لایههای مورد استفاده برای ساخت سیستمهای RAG رو نشون میده — از استخراج داده گرفته تا مدل زبانی و ارزیابی نهایی.
📌 خلاصه مهمترین اجزا:
🔹 مدلهای زبانی (LLMs):
متنباز: LLaMA 3.3، Mistral، Phi-4، Qwen 2.5، Gemma 3، DeepSeek
بسته: GPT (OpenAI)، Claude (Anthropic)، Gemini (Google)، Cohere، Amazon
🔹 فریمورکها برای پیادهسازی RAG:
LangChain، LlamaIndex، Haystack، Txtai
🔹 دیتابیس برداری (Vector DBs):
Chroma، Pinecone، Weaviate، Qdrant، Milvus
🔹 استخراج داده:
از وب: Crawl4AI، ScrapeGraphAI، FireCrawl
از اسناد: MegaParser، Docling، LlamaParse، ExtractThinker
🔹 مدلهای برداری متن (Text Embedding):
SBERT، Nomic، Ollama، OpenAI، Cohere
🔹 ارزیابی عملکرد:
Giskard، Ragas، Trulens، Voyage AI
🔧 همه این ابزارها با هدف ساخت یک سیستم هوشمند RAG ترکیب میشن که بتونه اطلاعات رو از منابع مختلف بگیره، بفهمه، و خروجی دقیق تولید کنه.
📣 اگر میخوای مدلهای Retrieval-Augmented Generation حرفهای بسازی، این پشتهی ابزارها دقیقاً چیزیه که باید بلد باشی!
📍 آموزشها و ابزارهای بیشتر در:
@rss_ai_ir
#RAG #هوش_مصنوعی #LLM #LangChain #پردازش_زبان #بردار_متن #استخراج_داده #پشته_توسعه #AItools #openai #gemini #cohere #ragstack
♻️این تصویر، نمای کاملی از ابزارها و لایههای مورد استفاده برای ساخت سیستمهای RAG رو نشون میده — از استخراج داده گرفته تا مدل زبانی و ارزیابی نهایی.
📌 خلاصه مهمترین اجزا:
🔹 مدلهای زبانی (LLMs):
متنباز: LLaMA 3.3، Mistral، Phi-4، Qwen 2.5، Gemma 3، DeepSeek
بسته: GPT (OpenAI)، Claude (Anthropic)، Gemini (Google)، Cohere، Amazon
🔹 فریمورکها برای پیادهسازی RAG:
LangChain، LlamaIndex، Haystack، Txtai
🔹 دیتابیس برداری (Vector DBs):
Chroma، Pinecone، Weaviate، Qdrant، Milvus
🔹 استخراج داده:
از وب: Crawl4AI، ScrapeGraphAI، FireCrawl
از اسناد: MegaParser، Docling، LlamaParse، ExtractThinker
🔹 مدلهای برداری متن (Text Embedding):
SBERT، Nomic، Ollama، OpenAI، Cohere
🔹 ارزیابی عملکرد:
Giskard، Ragas، Trulens، Voyage AI
🔧 همه این ابزارها با هدف ساخت یک سیستم هوشمند RAG ترکیب میشن که بتونه اطلاعات رو از منابع مختلف بگیره، بفهمه، و خروجی دقیق تولید کنه.
📣 اگر میخوای مدلهای Retrieval-Augmented Generation حرفهای بسازی، این پشتهی ابزارها دقیقاً چیزیه که باید بلد باشی!
📍 آموزشها و ابزارهای بیشتر در:
@rss_ai_ir
#RAG #هوش_مصنوعی #LLM #LangChain #پردازش_زبان #بردار_متن #استخراج_داده #پشته_توسعه #AItools #openai #gemini #cohere #ragstack
👏2❤1🔥1
-
🔥 گوگل دیپمایند بهتازگی مدل قدرتمند Gemini 2.5 Deep Think را برای کاربران نسخه Ultra منتشر کرده است.
📏 ظرفیت کانتکست این مدل به ۱ میلیون توکن میرسد و توانایی تولید خروجی تا ۱۹۲ هزار توکن را دارد — مناسب برای تحلیلهای عمیق و مولدهای بسیار بزرگ.
📊 نتایج بنچمارکها واقعاً شگفتانگیزند:
▪️ HLE: امتیاز ۳۴.۸٪
▪️ Live Code Bench: دقت ۸۶.۶٪
▪️ AIME 2025: عملکرد فوقالعاده با امتیاز ۹۹.۲٪
😮 در حالی که همه درباره GPT-5 صحبت میکنند، گوگل بیسر و صدا یکی از بهترین مدلها را عرضه کرده که عملاً مرزهای هوش مصنوعی را جابجا کرده.
📌 اگر به دنبال استفاده از مدلهای پیشرفته برای تولید محتوا، کدنویسی یا پردازش دادههای سنگین هستید، Gemini 2.5 یکی از بهترین گزینههای موجود است.
🟢 نظر شما در مورد این مدل جدید چیست؟ آیا وقت آن نرسیده که به نسخه Ultra کوچ کنیم؟
#هوش_مصنوعی #گوگل #Gemini #مدل_زبان #DeepMind
@rss_ai_ir ✅
🔥 گوگل دیپمایند بهتازگی مدل قدرتمند Gemini 2.5 Deep Think را برای کاربران نسخه Ultra منتشر کرده است.
📏 ظرفیت کانتکست این مدل به ۱ میلیون توکن میرسد و توانایی تولید خروجی تا ۱۹۲ هزار توکن را دارد — مناسب برای تحلیلهای عمیق و مولدهای بسیار بزرگ.
📊 نتایج بنچمارکها واقعاً شگفتانگیزند:
▪️ HLE: امتیاز ۳۴.۸٪
▪️ Live Code Bench: دقت ۸۶.۶٪
▪️ AIME 2025: عملکرد فوقالعاده با امتیاز ۹۹.۲٪
😮 در حالی که همه درباره GPT-5 صحبت میکنند، گوگل بیسر و صدا یکی از بهترین مدلها را عرضه کرده که عملاً مرزهای هوش مصنوعی را جابجا کرده.
📌 اگر به دنبال استفاده از مدلهای پیشرفته برای تولید محتوا، کدنویسی یا پردازش دادههای سنگین هستید، Gemini 2.5 یکی از بهترین گزینههای موجود است.
🟢 نظر شما در مورد این مدل جدید چیست؟ آیا وقت آن نرسیده که به نسخه Ultra کوچ کنیم؟
#هوش_مصنوعی #گوگل #Gemini #مدل_زبان #DeepMind
@rss_ai_ir ✅
👍55🥰52👏51😁48🎉47❤42🔥31
🔧 هاتپیپر هوش مصنوعی در رباتیک | ۲۰۲۵
📌 مدل Gemini Robotics: ورود رسمی هوش مصنوعی به دنیای فیزیکی
گوگل دیپمایند در مقالهای با عنوان Gemini Robotics مدل جدیدی را معرفی کرده که توانایی ترکیب بینایی، زبان و حرکت (Vision-Language-Action) را برای کنترل بازوهای ربات در محیطهای واقعی دارد — بدون نیاز به آموزش سختافزاری خاص!
📌 ویژگیهای کلیدی:
🔹 مدل پایه گرفتهشده از Gemini 2.0
🔹 توانایی کنترل ربات در محیط واقعی با ورودی زبان طبیعی
🔹 تعمیم بالا برای سختافزارهای مختلف (Franka، Aloha2، Apptronik)
🔹 درک فضایی-زمانی، پیشبینی مسیر، گرفتن اشیا
📍 چطور کار میکنه؟
با فقط چند صد مثال، مدل به ربات جدید منتقل میشه و میتونه کارهایی مثل تا کردن اوریگامی یا برداشتن اشیا رو انجام بده — انگار ربات "میفهمه" کجا هست و باید چه کار کنه.
🧠 این مقاله چرا انقلابیست؟
برای اولینبار اتصال عمیق NLP و حرکت فیزیکی ایجاد شده. رباتها حالا میتونن مثل انسان فکر کنن، حرف بزنن و دست به عمل بزنن — فقط با یک مدل!
🌐 لینک مقاله:
🔗 arxiv.org/abs/2503.20020
📖 گزارش کامل:
🔗 deepmind.google
📰 مقاله Wired:
🔗 wired.com
📡 با ما همراه باش تو @rss_ai_ir
#رباتیک #هوش_مصنوعی #Gemini #DeepMind #AI #EmbodiedAI #VLA #روبات #هات_پیپر
📌 مدل Gemini Robotics: ورود رسمی هوش مصنوعی به دنیای فیزیکی
گوگل دیپمایند در مقالهای با عنوان Gemini Robotics مدل جدیدی را معرفی کرده که توانایی ترکیب بینایی، زبان و حرکت (Vision-Language-Action) را برای کنترل بازوهای ربات در محیطهای واقعی دارد — بدون نیاز به آموزش سختافزاری خاص!
📌 ویژگیهای کلیدی:
🔹 مدل پایه گرفتهشده از Gemini 2.0
🔹 توانایی کنترل ربات در محیط واقعی با ورودی زبان طبیعی
🔹 تعمیم بالا برای سختافزارهای مختلف (Franka، Aloha2، Apptronik)
🔹 درک فضایی-زمانی، پیشبینی مسیر، گرفتن اشیا
📍 چطور کار میکنه؟
با فقط چند صد مثال، مدل به ربات جدید منتقل میشه و میتونه کارهایی مثل تا کردن اوریگامی یا برداشتن اشیا رو انجام بده — انگار ربات "میفهمه" کجا هست و باید چه کار کنه.
🧠 این مقاله چرا انقلابیست؟
برای اولینبار اتصال عمیق NLP و حرکت فیزیکی ایجاد شده. رباتها حالا میتونن مثل انسان فکر کنن، حرف بزنن و دست به عمل بزنن — فقط با یک مدل!
🌐 لینک مقاله:
🔗 arxiv.org/abs/2503.20020
📖 گزارش کامل:
🔗 deepmind.google
📰 مقاله Wired:
🔗 wired.com
📡 با ما همراه باش تو @rss_ai_ir
#رباتیک #هوش_مصنوعی #Gemini #DeepMind #AI #EmbodiedAI #VLA #روبات #هات_پیپر
❤22🎉21🔥19😁19👏13👍12🥰11
🤖 مغز متفکر پشت ChatGPT و Gemini چیست؟ با RLHF آشنا شوید! 🧠
تا حالا از خودتان پرسیدهاید چطور مدلهای هوش مصنوعی مثل ChatGPT یا Gemini اینقدر خوب، مفید و "انسانگونه" صحبت میکنند؟ جواب در یک تکنیک انقلابی به نام RLHF نهفته است.
عبارت RLHF مخفف چیست؟
✨ R**einforcement **L**earning from **H**uman **F**eedback
✨یادگیری تقویتی از بازخورد انسانی
به زبان ساده، RLHF فرآیندی است که در آن انسانها به هوش مصنوعی "درس اخلاق و رفتار" میدهند!
---
🤔 این فرآیند چطور کار میکند؟
این جادو در سه مرحله اتفاق میافتد:
1️⃣ آموزش اولیه (کسب دانش خام):
یک مدل زبانی بزرگ (LLM) با حجم عظیمی از دادههای اینترنتی آموزش میبیند تا اصول زبان و دانش عمومی را یاد بگیرد. در این مرحله، مدل مثل یک دانشمند همهچیزدان اما کمی بیملاحظه است.
2️⃣ ساخت "وجدان" مصنوعی (مدل پاداش):
اینجاست که انسانها وارد میشوند!
* مدل برای یک سوال، چندین جواب مختلف تولید میکند.
* اپراتورهای انسانی این جوابها را از بهترین به بدترین رتبهبندی میکنند (مثلاً: جواب A عالیه، جواب B خوبه، جواب C بده).
* با هزاران نمونه از این رتبهبندیها، یک مدل جدید به نام "مدل پاداش" (Reward Model) ساخته میشود. این مدل یاد میگیرد که مثل یک انسان، پاسخهای خوب را از بد تشخیص دهد. در واقع، این مدل نقش "وجدان" یا "معیار سنجش" را برای هوش مصنوعی ایفا میکند.
3️⃣ تنظیم دقیق با یادگیری تقویتی (مرحله ادبآموزی):
* مدل اصلی حالا سعی میکند پاسخهایی تولید کند که از "مدل پاداش" امتیاز بالایی بگیرند.
* اگر پاسخی تولید کند که مفید، صادقانه و بیخطر باشد، پاداش میگیرد و آن مسیر را تقویت میکند.
* اگر پاسخ بدی بدهد، تنبیه (پاداش منفی) میشود و یاد میگیرد که دیگر آن اشتباه را تکرار نکند.
این چرخه بارها و بارها تکرار میشود تا مدل نهایی، یک دستیار هوشمند، همراستا با ارزشهای انسانی و ایمن باشد.
---
💡 چرا RLHF اینقدر مهم است؟
این تکنیک مدلهای هوش مصنوعی را از یک ماشین پاسخگوی ساده به یک همکار و دستیار قابل اعتماد تبدیل میکند که مفاهیم پیچیدهای مثل ادب، مفید بودن و ایمنی را درک میکند.
📚 برای مطالعه بیشتر و منابع فنی:
اگر به جزئیات فنی علاقهمندید، این منابع فوقالعاده هستند:
🔗 مقاله وبلاگ Hugging Face (توضیح عالی):
این مقاله یکی از بهترین منابع برای درک عمیق و تصویری RLHF است.
[https://huggingface.co/blog/rlhf]
👨💻 ریپازیتوری گیتهاب (کتابخانه TRL):
کتابخانه
[https://github.com/huggingface/trl]
@rss_ai_ir
#هوش_مصنوعی #یادگیری_ماشین #یادگیری_تقویتی #RLHF #ChatGPT #Gemini #تکنولوژی #AI #MachineLearning
تا حالا از خودتان پرسیدهاید چطور مدلهای هوش مصنوعی مثل ChatGPT یا Gemini اینقدر خوب، مفید و "انسانگونه" صحبت میکنند؟ جواب در یک تکنیک انقلابی به نام RLHF نهفته است.
عبارت RLHF مخفف چیست؟
✨ R**einforcement **L**earning from **H**uman **F**eedback
✨یادگیری تقویتی از بازخورد انسانی
به زبان ساده، RLHF فرآیندی است که در آن انسانها به هوش مصنوعی "درس اخلاق و رفتار" میدهند!
---
🤔 این فرآیند چطور کار میکند؟
این جادو در سه مرحله اتفاق میافتد:
1️⃣ آموزش اولیه (کسب دانش خام):
یک مدل زبانی بزرگ (LLM) با حجم عظیمی از دادههای اینترنتی آموزش میبیند تا اصول زبان و دانش عمومی را یاد بگیرد. در این مرحله، مدل مثل یک دانشمند همهچیزدان اما کمی بیملاحظه است.
2️⃣ ساخت "وجدان" مصنوعی (مدل پاداش):
اینجاست که انسانها وارد میشوند!
* مدل برای یک سوال، چندین جواب مختلف تولید میکند.
* اپراتورهای انسانی این جوابها را از بهترین به بدترین رتبهبندی میکنند (مثلاً: جواب A عالیه، جواب B خوبه، جواب C بده).
* با هزاران نمونه از این رتبهبندیها، یک مدل جدید به نام "مدل پاداش" (Reward Model) ساخته میشود. این مدل یاد میگیرد که مثل یک انسان، پاسخهای خوب را از بد تشخیص دهد. در واقع، این مدل نقش "وجدان" یا "معیار سنجش" را برای هوش مصنوعی ایفا میکند.
3️⃣ تنظیم دقیق با یادگیری تقویتی (مرحله ادبآموزی):
* مدل اصلی حالا سعی میکند پاسخهایی تولید کند که از "مدل پاداش" امتیاز بالایی بگیرند.
* اگر پاسخی تولید کند که مفید، صادقانه و بیخطر باشد، پاداش میگیرد و آن مسیر را تقویت میکند.
* اگر پاسخ بدی بدهد، تنبیه (پاداش منفی) میشود و یاد میگیرد که دیگر آن اشتباه را تکرار نکند.
این چرخه بارها و بارها تکرار میشود تا مدل نهایی، یک دستیار هوشمند، همراستا با ارزشهای انسانی و ایمن باشد.
---
💡 چرا RLHF اینقدر مهم است؟
این تکنیک مدلهای هوش مصنوعی را از یک ماشین پاسخگوی ساده به یک همکار و دستیار قابل اعتماد تبدیل میکند که مفاهیم پیچیدهای مثل ادب، مفید بودن و ایمنی را درک میکند.
📚 برای مطالعه بیشتر و منابع فنی:
اگر به جزئیات فنی علاقهمندید، این منابع فوقالعاده هستند:
🔗 مقاله وبلاگ Hugging Face (توضیح عالی):
این مقاله یکی از بهترین منابع برای درک عمیق و تصویری RLHF است.
[https://huggingface.co/blog/rlhf]
👨💻 ریپازیتوری گیتهاب (کتابخانه TRL):
کتابخانه
trl
از Hugging Face به شما اجازه میدهد تا مدلهای خود را با استفاده از RLHF آموزش دهید. نمونه کدها و مستندات کاملی دارد.[https://github.com/huggingface/trl]
@rss_ai_ir
#هوش_مصنوعی #یادگیری_ماشین #یادگیری_تقویتی #RLHF #ChatGPT #Gemini #تکنولوژی #AI #MachineLearning
❤20😁19👍18🥰16🎉14🔥13👏13🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
♟ آخرین وضعیت رقابت مدلهای هوش مصنوعی در المپیک AI (بازی شطرنج)
در رقابتی که بهعنوان محک استدلال و تصمیمگیری مدلهای زبانی طراحی شده، نتایج اولیه جالب توجه است:
🔹 مدل گروک دقیقترین و قویترین بازیها را تا این لحظه ارائه داده
🔹 مدل جمینی نیز با اختلاف اندک در جایگاه دوم قرار گرفته
🔹 تیم اوپنAI در تصمیمگیریهای لحظهای دچار اشتباهات زیادی شده
🔹 مدل کلود برخلاف انتظارات، عملکرد ناامیدکنندهای داشته
🔹 در نهایت، DeepSeek ضعیفترین عملکرد را در جدول از خود نشان داده است
این رقابت، فرصتی منحصربهفرد برای سنجش مهارتهای استدلالی و واکنش هوش مصنوعی در محیطهای پیچیده و تعاملی است.
#هوش_مصنوعی #شطرنج #Grok #Gemini #Claude #OpenAI
@rss_ai_ir 🤖
در رقابتی که بهعنوان محک استدلال و تصمیمگیری مدلهای زبانی طراحی شده، نتایج اولیه جالب توجه است:
🔹 مدل گروک دقیقترین و قویترین بازیها را تا این لحظه ارائه داده
🔹 مدل جمینی نیز با اختلاف اندک در جایگاه دوم قرار گرفته
🔹 تیم اوپنAI در تصمیمگیریهای لحظهای دچار اشتباهات زیادی شده
🔹 مدل کلود برخلاف انتظارات، عملکرد ناامیدکنندهای داشته
🔹 در نهایت، DeepSeek ضعیفترین عملکرد را در جدول از خود نشان داده است
این رقابت، فرصتی منحصربهفرد برای سنجش مهارتهای استدلالی و واکنش هوش مصنوعی در محیطهای پیچیده و تعاملی است.
#هوش_مصنوعی #شطرنج #Grok #Gemini #Claude #OpenAI
@rss_ai_ir 🤖
👏23🎉18👍17🥰16😁15🔥13❤11🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 مدل جیپیتی-۵ بهعنوان یک نقطه عطف در دنیای کدنویسی شناخته شده است
@rss_ai_ir
🧑💻 یکی از توسعهدهندگان باسابقه که از نسخههای مختلف GPT از ابتدا تاکنون استفاده کرده، تجربهی خود را از کار با GPT-5 اینگونه توصیف کرده:
💡 عملکرد در کدنویسی واقعاً حیرتانگیز است. بهگونهای که پروژهای کامل با زبان پایتون در مدت دو ساعت همراه با تقسیمبندی ماژولها، اضافه کردن منطق جدید، و اجرای نهایی بدون خطا تولید شده — چیزی که با Gemini Pro 2.5 یا Sonnet 4 هرگز قابل دستیابی نبوده است.
🌐 تنها با یک درخواست ساده، یک صفحهی کامل وب طراحی شده که شامل استایلها، انیمیشنها، وضعیت دکمهها و طراحی واکنشگراست. فرقی ندارد که ایدهی اولیه باشد یا مقاله علمی، مدل بهسرعت آن را به وبسایت کاربردی تبدیل میکند.
📸 دیباگ از روی اسکرینشاتها هم بهدرستی انجام میشود. بهعنوان مثال، این صفحات فقط در ۱ تا ۳ تعامل ساخته شدهاند:
https://shir-man.com/pie-photo/
https://shir-man.com/solar/
📅 با توجه به اینکه آموزش مدل تا مهر ۱۴۰۳ (اکتبر ۲۰۲۴) ادامه داشته، اطلاعات آن شامل Agentهای LLM، نحوهی اتصال به API شرکتهای بزرگ و ساخت سریع نرمافزارهای مدرن است.
📉 در مقایسه با مدلهای رقیب، نهتنها کیفیت بالاتری دارد، بلکه هزینهی استفاده از آن نیز پایینتر است. حتی میتوان در API مشخص کرد که مدل چهمیزان «زمان تفکر» داشته باشد و این ویژگی در قیمت خروجی تأثیرگذار است.
🔧 هرچند گاهی در مسائل ساده، بیشازحد مهندسیشده عمل میکند، اما همین پیچیدگیها در عمل به نتیجهی درست منجر میشوند — نه مانند رقبایی که خروجیهای اشتباه یا بلااستفاده تولید میکنند.
📌 این مدل اولین تجربهی واقعی از یک "همکار هوشمند" برای توسعهدهندگان است. رقبایی مثل Anthropic باید برای رسیدن به چنین سطحی، گامهای بزرگی بردارند.
#جی_پی_تی۵ #هوش_مصنوعی #کدنویسی #پایتون #openai #مدل_زبان #هوش_برنامه_نویس #Claude #Gemini #توسعه_نرم_افزار #ai4dev
@rss_ai_ir
@rss_ai_ir
🧑💻 یکی از توسعهدهندگان باسابقه که از نسخههای مختلف GPT از ابتدا تاکنون استفاده کرده، تجربهی خود را از کار با GPT-5 اینگونه توصیف کرده:
💡 عملکرد در کدنویسی واقعاً حیرتانگیز است. بهگونهای که پروژهای کامل با زبان پایتون در مدت دو ساعت همراه با تقسیمبندی ماژولها، اضافه کردن منطق جدید، و اجرای نهایی بدون خطا تولید شده — چیزی که با Gemini Pro 2.5 یا Sonnet 4 هرگز قابل دستیابی نبوده است.
🌐 تنها با یک درخواست ساده، یک صفحهی کامل وب طراحی شده که شامل استایلها، انیمیشنها، وضعیت دکمهها و طراحی واکنشگراست. فرقی ندارد که ایدهی اولیه باشد یا مقاله علمی، مدل بهسرعت آن را به وبسایت کاربردی تبدیل میکند.
📸 دیباگ از روی اسکرینشاتها هم بهدرستی انجام میشود. بهعنوان مثال، این صفحات فقط در ۱ تا ۳ تعامل ساخته شدهاند:
https://shir-man.com/pie-photo/
https://shir-man.com/solar/
📅 با توجه به اینکه آموزش مدل تا مهر ۱۴۰۳ (اکتبر ۲۰۲۴) ادامه داشته، اطلاعات آن شامل Agentهای LLM، نحوهی اتصال به API شرکتهای بزرگ و ساخت سریع نرمافزارهای مدرن است.
📉 در مقایسه با مدلهای رقیب، نهتنها کیفیت بالاتری دارد، بلکه هزینهی استفاده از آن نیز پایینتر است. حتی میتوان در API مشخص کرد که مدل چهمیزان «زمان تفکر» داشته باشد و این ویژگی در قیمت خروجی تأثیرگذار است.
🔧 هرچند گاهی در مسائل ساده، بیشازحد مهندسیشده عمل میکند، اما همین پیچیدگیها در عمل به نتیجهی درست منجر میشوند — نه مانند رقبایی که خروجیهای اشتباه یا بلااستفاده تولید میکنند.
📌 این مدل اولین تجربهی واقعی از یک "همکار هوشمند" برای توسعهدهندگان است. رقبایی مثل Anthropic باید برای رسیدن به چنین سطحی، گامهای بزرگی بردارند.
#جی_پی_تی۵ #هوش_مصنوعی #کدنویسی #پایتون #openai #مدل_زبان #هوش_برنامه_نویس #Claude #Gemini #توسعه_نرم_افزار #ai4dev
@rss_ai_ir
🎉13👍10👏10😁9🥰8❤4🔥3
نمودار رشد ماهبهماه بازدید از وبسایتهای برتر GenAI نشان میدهد که Grok با رشد چشمگیر ۲۷.۲۷٪ در صدر قرار دارد و بهوضوح Grok 4 تأثیر بزرگی بر افزایش استفاده کاربران گذاشته است.
📊 آمار تغییرات (جولای ۲۰۲۵ نسبت به ژوئن ۲۰۲۵):
* ChatGPT.com ➕ ۶.۰۳٪
* Gemini.google.com ➕ ۷.۸۸٪
* DeepSeek.com ➖ ۹.۱۷٪
* Grok.com ➕ ۲۷.۲۷٪
* Perplexity.ai ➕ ۸.۶۰٪
* Claude.ai ➕ ۱۰.۴۷٪
به نظر میرسد رقابت بین پلتفرمهای هوش مصنوعی مولد روزبهروز شدیدتر میشود و Grok با آپدیت جدید خود جهش قابل توجهی داشته است.
#هوش_مصنوعی 🤖 #GenAI 📈 #Grok 🚀 #ChatGPT 💬 #Claude 🧠 #Gemini 🌐
@rss_ai_ir 🚀
📊 آمار تغییرات (جولای ۲۰۲۵ نسبت به ژوئن ۲۰۲۵):
* ChatGPT.com ➕ ۶.۰۳٪
* Gemini.google.com ➕ ۷.۸۸٪
* DeepSeek.com ➖ ۹.۱۷٪
* Grok.com ➕ ۲۷.۲۷٪
* Perplexity.ai ➕ ۸.۶۰٪
* Claude.ai ➕ ۱۰.۴۷٪
به نظر میرسد رقابت بین پلتفرمهای هوش مصنوعی مولد روزبهروز شدیدتر میشود و Grok با آپدیت جدید خود جهش قابل توجهی داشته است.
#هوش_مصنوعی 🤖 #GenAI 📈 #Grok 🚀 #ChatGPT 💬 #Claude 🧠 #Gemini 🌐
@rss_ai_ir 🚀
👍1🔥1👏1
🩺 گوگل از سیستم هوش مصنوعی پزشکی g-AMIE رونمایی کرد — مدلی که بهجای جایگزینی پزشک، نقش دستیار تشخیصی را ایفا میکند.
---
🔍 ایده اصلی
مدل بهطور مستقیم توصیه پزشکی نمیدهد، بلکه برای پزشک یک خلاصه اطلاعاتی و فرضیههای قابل بررسی تولید میکند.
هسته سیستم بر پایه Gemini 2.0 Flash ساخته شده، اما طراحی آن بهشکل سه عامل تخصصی انجام میشود:
1️⃣ عامل گفتوگویی — با بیمار گفتگو میکند، مدارک را دریافت میکند و یک جمعبندی اولیه با فرضیهها ارائه میدهد.
2️⃣ عامل بازبین — بررسی میکند که محتوای عامل گفتوگویی شامل توصیه پزشکی مستقیم نباشد (این اختیار فقط با پزشک است).
3️⃣ عامل SOAP — گزارش نهایی را در قالب:
✳️یافتههای عینی
✳️فرضیهها و برنامه بررسی
✳️پیشنویس توضیح برای بیمار
تهیه میکند.
---
🏥 فرآیند استفاده
پزشک در یک رابط کاربری، گزارش را مرور و ویرایش میکند، سپس تصمیم میگیرد تشخیص نهایی و برنامه درمانی چه باشد.
---
📊 نکات قابل توجه
✳️تمرکز گوگل بر تقویت نقش پزشک، نه جایگزینی او
✳️امکان استفاده تقریباً بدون ریسک در محیطهای درمانی واقعی
در آزمایشها، g-AMIE از نظر دقت فرضیههای تشخیصی، برنامه درمانی پیشنهادی و حتی سطح همدلی، عملکردی بهتر از پزشکان و کادر درمان تازهکار داشته است.
📎 اطلاعات بیشتر در وبلاگ گوگل
#هوش_مصنوعی 🤖 #پزشکی 🩺 #گوگل 🏢 #سیستم_تشخیصی #Gemini
---
🔍 ایده اصلی
مدل بهطور مستقیم توصیه پزشکی نمیدهد، بلکه برای پزشک یک خلاصه اطلاعاتی و فرضیههای قابل بررسی تولید میکند.
هسته سیستم بر پایه Gemini 2.0 Flash ساخته شده، اما طراحی آن بهشکل سه عامل تخصصی انجام میشود:
1️⃣ عامل گفتوگویی — با بیمار گفتگو میکند، مدارک را دریافت میکند و یک جمعبندی اولیه با فرضیهها ارائه میدهد.
2️⃣ عامل بازبین — بررسی میکند که محتوای عامل گفتوگویی شامل توصیه پزشکی مستقیم نباشد (این اختیار فقط با پزشک است).
3️⃣ عامل SOAP — گزارش نهایی را در قالب:
✳️یافتههای عینی
✳️فرضیهها و برنامه بررسی
✳️پیشنویس توضیح برای بیمار
تهیه میکند.
---
🏥 فرآیند استفاده
پزشک در یک رابط کاربری، گزارش را مرور و ویرایش میکند، سپس تصمیم میگیرد تشخیص نهایی و برنامه درمانی چه باشد.
---
📊 نکات قابل توجه
✳️تمرکز گوگل بر تقویت نقش پزشک، نه جایگزینی او
✳️امکان استفاده تقریباً بدون ریسک در محیطهای درمانی واقعی
در آزمایشها، g-AMIE از نظر دقت فرضیههای تشخیصی، برنامه درمانی پیشنهادی و حتی سطح همدلی، عملکردی بهتر از پزشکان و کادر درمان تازهکار داشته است.
📎 اطلاعات بیشتر در وبلاگ گوگل
#هوش_مصنوعی 🤖 #پزشکی 🩺 #گوگل 🏢 #سیستم_تشخیصی #Gemini
👍8❤6😁6🎉5🔥3
🛠 نقشهراه عمومی Gemini CLI منتشر شد — هدف: ساخت یک عامل کدنویسی متنباز قدرتمند با محوریت جامعه کاربری.
پروژه در ۴ جهت اصلی در حال توسعه است:
1️⃣ قابلگسترش (Extensible)
امکان توسعهپذیری برای هر محیط و سناریو: اسلشکامندهای سفارشی، پروتکلهای ریموت، اجرای فایلهای .gemini.md با ابزارهای کاربر.
2️⃣ در همهجا (Everywhere)
اجرای عامل بهعنوان یک فرآیند پسزمینه در محیطهای مختلف: لوکال، کانتینرها، GitHub Actions و فضای ابری. حتی پشتیبانی از تفویض وظیفه به زیرعاملها.
3️⃣ هوشمند (Intelligent)
تمرکز بر کیفیت مدلها و ابزارها؛ هدف کسب رتبههای بالا در بنچمارکهایی مثل SWE Bench. تمامی باگهای حیاتی (P0) پیش از نسخه ۱.۰ رفع خواهند شد.
4️⃣ متنباز (Open Source)
ساختهشده در تعامل با جامعه: پاسخ سریع به Issues و PRها، بکلاگ حداقلی و فرآیندهای مشارکت ساده و روان.
---
🔄 جریانهای کاری (Workstreams) فعلی:
♻️بهبود کیفیت مدل (تقویت استدلال، حذف تکرارها)
♻️بهینهسازی عملکرد (Caching، مسیریابی هوشمند مدلها)
♻️گسترشپذیری (عاملهای پسزمینه، استقرار ابری)
♻️اتوماسیون جامعه (بهبود Dev Flow)
📌 اگر میخواهید در توسعه نسل بعدی ابزارهای کدنویسی AI مشارکت کنید، اکنون بهترین زمان برای پیوستن به Gemini CLI است.
🔗 جزئیات در گیتهاب
#هوش_مصنوعی #کدنویسی #Gemini #متن_باز
@rss_ai_ir
پروژه در ۴ جهت اصلی در حال توسعه است:
1️⃣ قابلگسترش (Extensible)
امکان توسعهپذیری برای هر محیط و سناریو: اسلشکامندهای سفارشی، پروتکلهای ریموت، اجرای فایلهای .gemini.md با ابزارهای کاربر.
2️⃣ در همهجا (Everywhere)
اجرای عامل بهعنوان یک فرآیند پسزمینه در محیطهای مختلف: لوکال، کانتینرها، GitHub Actions و فضای ابری. حتی پشتیبانی از تفویض وظیفه به زیرعاملها.
3️⃣ هوشمند (Intelligent)
تمرکز بر کیفیت مدلها و ابزارها؛ هدف کسب رتبههای بالا در بنچمارکهایی مثل SWE Bench. تمامی باگهای حیاتی (P0) پیش از نسخه ۱.۰ رفع خواهند شد.
4️⃣ متنباز (Open Source)
ساختهشده در تعامل با جامعه: پاسخ سریع به Issues و PRها، بکلاگ حداقلی و فرآیندهای مشارکت ساده و روان.
---
🔄 جریانهای کاری (Workstreams) فعلی:
♻️بهبود کیفیت مدل (تقویت استدلال، حذف تکرارها)
♻️بهینهسازی عملکرد (Caching، مسیریابی هوشمند مدلها)
♻️گسترشپذیری (عاملهای پسزمینه، استقرار ابری)
♻️اتوماسیون جامعه (بهبود Dev Flow)
📌 اگر میخواهید در توسعه نسل بعدی ابزارهای کدنویسی AI مشارکت کنید، اکنون بهترین زمان برای پیوستن به Gemini CLI است.
🔗 جزئیات در گیتهاب
#هوش_مصنوعی #کدنویسی #Gemini #متن_باز
@rss_ai_ir
❤13👍12🔥10🎉10😁9👏4🥰3
⚠️ اپل به فکر استفاده از Gemini برای سیری — تغییر مسیر یا اعتراف به ضعف؟
گزارشها میگویند اپل در حال مذاکره اولیه با گوگل است تا نسخه جدید سیری را با یک مدل سفارشی از Gemini تقویت کند. این تغییر مسیر برای شرکتی که همیشه روی توسعه داخلی تأکید داشته، اتفاق بزرگی است.
🔹 چالش اصلی: ساخت سیری هوشمندتر که واقعاً بافت مکالمه را بفهمد و بتواند وظایف چندمرحلهای پیچیده را مدیریت کند — چیزی که سیری سالها از رقبایش عقب مانده.
🔹 پروژه بازطراحی سیری به ۲۰۲۶ موکول شده و حالا اپل دنبال تزریق توان AI بیرونی است.
🔹 اپل یک رقابت داخلی یا بهاصطلاح bake-off راه انداخته: مدلهای خودش (Linwood) در برابر تکنولوژیهای بیرونی (Glenwood، Gemini، Claude و ChatGPT).
🔹 واکنش بازار سریع بود: سهام گوگل بین ۳ تا ۳.۷٪ و سهام اپل بین ۱.۴ تا ۱.۶٪ رشد کرد؛ سرمایهگذاران معتقدند این همکاری میتواند فاصله اپل در حوزه GenAI را جبران کند.
📌 اگر اپل بهطور کامل به سراغ Gemini برود، این فقط یک همکاری ساده نیست — بلکه اعتراف علنی است به اینکه سیری بهتنهایی نمیتواند رقابت کند.
#هوش_مصنوعی #اپل #گوگل #Gemini #Siri #AI
@rss_ai_ir
گزارشها میگویند اپل در حال مذاکره اولیه با گوگل است تا نسخه جدید سیری را با یک مدل سفارشی از Gemini تقویت کند. این تغییر مسیر برای شرکتی که همیشه روی توسعه داخلی تأکید داشته، اتفاق بزرگی است.
🔹 چالش اصلی: ساخت سیری هوشمندتر که واقعاً بافت مکالمه را بفهمد و بتواند وظایف چندمرحلهای پیچیده را مدیریت کند — چیزی که سیری سالها از رقبایش عقب مانده.
🔹 پروژه بازطراحی سیری به ۲۰۲۶ موکول شده و حالا اپل دنبال تزریق توان AI بیرونی است.
🔹 اپل یک رقابت داخلی یا بهاصطلاح bake-off راه انداخته: مدلهای خودش (Linwood) در برابر تکنولوژیهای بیرونی (Glenwood، Gemini، Claude و ChatGPT).
🔹 واکنش بازار سریع بود: سهام گوگل بین ۳ تا ۳.۷٪ و سهام اپل بین ۱.۴ تا ۱.۶٪ رشد کرد؛ سرمایهگذاران معتقدند این همکاری میتواند فاصله اپل در حوزه GenAI را جبران کند.
📌 اگر اپل بهطور کامل به سراغ Gemini برود، این فقط یک همکاری ساده نیست — بلکه اعتراف علنی است به اینکه سیری بهتنهایی نمیتواند رقابت کند.
#هوش_مصنوعی #اپل #گوگل #Gemini #Siri #AI
@rss_ai_ir
🔥9❤4😁4🎉4👍3
📌 کاربردهای جالب Gemini-2.5-Flash-Image-Preview
♻️مدل جدید گوگل یعنی Gemini-2.5-Flash-Image-Preview حالا در Google AI Studio قابل استفاده است و میتوان با آن اپلیکیشنهای خلاقانهای ساخت.
🔹 چند نمونه کاربرد:
✏️ قابلیت Gemini Co-Drawing: مدل میتواند یک دیاگرام دستنویس را بخواند، محاسبات لازم را انجام دهد و طبق دستور، ویرایشهای پیچیده روی شکل انجام دهد.
📊 تحلیل نمودارها و تصاویر همراه با توضیح و محاسبات
🎨 ویرایش ترکیبی متن + تصویر برای طراحی سریع پروتوتایپها
🧮 حل مسائل ریاضی از روی شکلهای ترسیمشده
👨🏫 کمک در آموزش بصری، مثل اصلاح نقشههای درسی یا دیاگرامهای علمی
🔗 نمونه اپلیکیشنها:
Google AI Studio Apps
🔗 جزئیات فنی و قیمت:
Google Developer Blog
#هوش_مصنوعی #Gemini #مولتیمودال #پردازش_تصویر #گوگل
♻️مدل جدید گوگل یعنی Gemini-2.5-Flash-Image-Preview حالا در Google AI Studio قابل استفاده است و میتوان با آن اپلیکیشنهای خلاقانهای ساخت.
🔹 چند نمونه کاربرد:
✏️ قابلیت Gemini Co-Drawing: مدل میتواند یک دیاگرام دستنویس را بخواند، محاسبات لازم را انجام دهد و طبق دستور، ویرایشهای پیچیده روی شکل انجام دهد.
📊 تحلیل نمودارها و تصاویر همراه با توضیح و محاسبات
🎨 ویرایش ترکیبی متن + تصویر برای طراحی سریع پروتوتایپها
🧮 حل مسائل ریاضی از روی شکلهای ترسیمشده
👨🏫 کمک در آموزش بصری، مثل اصلاح نقشههای درسی یا دیاگرامهای علمی
🔗 نمونه اپلیکیشنها:
Google AI Studio Apps
🔗 جزئیات فنی و قیمت:
Google Developer Blog
#هوش_مصنوعی #Gemini #مولتیمودال #پردازش_تصویر #گوگل
🎉8🔥7❤5👍3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.
🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایشهای چندمرحلهای (multi-turn edits) بهصورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini
آیا این ابزار میتواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨
#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایشهای چندمرحلهای (multi-turn edits) بهصورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini
آیا این ابزار میتواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨✨
#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔥15🎉13👍12❤9😁3👏1🙏1