اخبار هوش مصنوعی
2.8K subscribers
740 photos
423 videos
1.01K files
1.43K links
آخرین اخبار و منابع فناوری ؛ هوش مصنوعی و یادگیری ماشین

@GPT360
加入频道
This media is not supported in your browser
VIEW IN TELEGRAM
شرکت چینی Moonshot AI یه قابلیت تازه به Kimi اضافه کرده به اسم «PPT Assistant». باهاش می‌تونی فقط با یه متن ساده یا حتی فایل PDF و Word، درجا یه پاورپوینت شیک بسازی. خبر خوب؟ فارسی رو کامل ساپورت می‌کنه و کاملاً رایگانه، بدون هیچ محدودیتی!
https://www.kimi.com/kimiplus/cvvm7bkheutnihqi2100

#هوش_مصنوعی
This media is not supported in your browser
VIEW IN TELEGRAM
راهنمای تشخیص محتوای تولیدی هوش مصنوعی

مبارزه با اخبار جعلی

لینکهای ذکر شده در این پادکست
🔎 ابزارهای تشخیص محتوای AI
راهنمای GIJN
Forensically – تحلیل تصویر
TrueMedia – شناسایی دیپ‌فیک سیاسی
Image Whisperer – تأیید رسانه
Hiya Voice Detector – تشخیص صدا


منبع
This media is not supported in your browser
VIEW IN TELEGRAM
شبیه سازی شبکه های عصبی در یادگیری ماشین
1
DeepDream

یه شبکه عصبی از گوگل که عکسارو خیلی خلاقانه دستکاری می‌کنه.
کار اصلیش اینه که از دل عکسای معمولی، طرح‌ها و جزئیات پنهونو بزرگ‌نمایی کنه و یه تصویر عجیب‌غریب و هنری تحویلت بده.

خیلی توی هنر دیجیتال و ساخت بک‌گراند یا تصاویر سورئال استفاده میشه.

می‌تونی شدت و سبک تغییرات رو تنظیم کنی تا خروجی‌ از یه حالت ملایم تا خیلی ترسناک و رویایی فرق داشته باشه.

https://deepdreamgenerator.com/

#هوش_مصنوعی
🔥2
🎬 Veo 3 Ultimate — آپدیت بزرگ از گوگل

گوگل همزمان با معرفی Nano Banana، به‌صورت بی‌سروصدا آپدیت مهمی منتشر کرد:
🔹 حالا با اشتراک Ultra می‌توان بی‌نهایت ویدیو روی نسخه سبک‌تر Veo 3 Fast تولید کرد.

💵 قبلاً هر ثانیه تولید ویدیو حدود ۰.۴ دلار هزینه داشت (یعنی یک ویدیو کوتاه تا ۳.۲ دلار). حالا همه‌چیز فقط با ۲۵۰ دلار در ماه نامحدود است.

👨‍💻 این خبر می‌تواند فریلنسـرها و استودیوهای تبلیغاتی را به سمت گوگل بکشاند.
⚠️ اما هنوز دو محدودیت باقی است:
— نبود پشتیبانی از ویدیوی عمودی 📱
— رزولوشن فقط ۷۲۰p (در حالی که Kling مدت‌هاست روی ۱۰۸۰p کار می‌کند).
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Krea Real-Time Video — آینده‌ی Img2Video؟

🔹 Img2video یا Video2video؟
Krea به‌تازگی ژنراتور ویدیو در لحظه (real-time) معرفی کرده که با کشیدن شکل‌های ساده‌ی هندسی می‌توان آن را کنترل کرد.

👀 نتیجه چیزی شبیه real-time img2img است، با این تفاوت که:
— انسجام زمانی (temporal consistency) رعایت می‌شود.
— تولیدها به نسل‌های قبلی توجه دارند تا تصویر پایدارتر باشد.

⚡️ سرعت رندر هم جالب است: ۱۲ فریم بر ثانیه در لحظه.

🎶 شاید برای پروژه‌های مفهومی یا موزیک‌ویدیوها خیلی جذاب باشد. در عمل چقدر کاربردی است؟ باید صبر کنیم و دید.
ارتقای جدی OpenAI Codex

🔧 مهم‌ترین تغییر — بازطراحی کامل CLI با کلی قابلیت جدید:
— صف پیام‌ها
— جستجو در اینترنت
— لیست‌های TODO
— پشتیبانی از ورودی تصویری
— و کلی بهبود جزئی دیگه

⚡️ همچنین افزونه‌ای برای VSCode عرضه شده (سازگار با Cursor، Windsurf و سایر فورک‌ها):
— امکان اجرای تسک‌ها هم روی سیستم محلی و هم روی فضای ابری
— اتصال به GitHub حالا می‌تونه به‌صورت خودکار Pull Requestها رو بررسی کنه

📈 Codex که در ابتدا شروع موفقی نداشت، توی یک ماه اخیر به رقیب جدی Claude Code تبدیل شده.
و جایی که رقابت باشه، کیفیت محصولات هم بالاتر میره.

🧩 #هوش_مصنوعی #OpenAI #Codex #کدنویسی
چطور ChatGPT رو در چند ثانیه طبیعی‌تر کنیم

هیچ ابزار خارجی لازم نیست — تنظیماتش داخل خود ChatGPT هست.

🔸 ChatGPT رو باز کن
🔸 روی عکس پروفایلت بزن → Customize ChatGPT
🔸 داخل بخش Traits این متن رو بذار:

✍️
«به انگلیسی طبیعی و انسانی بنویس. لحن رباتی و خیلی رسمی نداشته باش.
از جملات خشک، نقل‌قول زیاد، اصطلاحات شرکتی و اداری دوری کن.
ساده و روشن بنویس. اگر مکالمه‌ای باشه و مفهوم رو بهتر برسونه، اشکالی نداره.
جملات تکراری و طولانی الکی نساز.
ریتم جمله‌ها رو تغییر بده تا متن زنده‌تر به‌نظر برسه.
اولویت با وضوح، سبک شخصی و ارزش عملی در هر خطه.
هر جمله باید هدفمند باشه، نه مکانیکی.»

📌 وقتی ذخیره بشه، خروجی ChatGPT دیگه خشک و رسمی نیست و متن‌ها خیلی شفاف‌تر، روان‌تر و طبیعی‌تر می‌شن.
1
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 ساخت کتاب صوتی از هر متن یا کتاب فقط در چند ثانیه با هوش مصنوعی

ویژگی‌های این ابزار جدید:
— پشتیبانی از چندین زبان؛
— استفاده از یکی از بهترین مدل‌های تبدیل متن به گفتار: KokoroTTS؛
— امکان ساخت صدای اختصاصی در صورت عدم رضایت از لیست آماده؛
— نصب و راه‌اندازی ساده؛
— کاملاً اوپن‌سورس و رایگان برای همه.
😍2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 سیستم Blackdot — ربات جدید برای تاتو با هوش مصنوعی و بینایی کامپیوتری

این ربات توسط یک استارتاپ آمریکایی ساخته شده و می‌تواند تاتوهای سیاه‌وسفید را روی قسمت‌های صاف پوست مثل دست و پا اجرا کند. در آینده هم قابلیت کار روی بخش‌هایی مثل سینه و شانه اضافه خواهد شد.

🎨 طراحی تاتوها توسط هنرمندان حرفه‌ای انجام می‌شود. سپس طرح انتخابی با سایز دلخواه به ربات داده می‌شود.
🖤 ربات جوهر را به شکل نقاطی می‌گذارد که حتی از ضخامت یک تار مو هم باریک‌ترند.
📷 یک دوربین داخلی و لیزر به صورت لحظه‌ای کیفیت را کنترل کرده و تنظیمات را تغییر می‌دهند.

نتیجه: سرعت بیشتر، دقت بالاتر و درد کمتر نسبت به روش سنتی، چون سوراخ‌کاری‌ها سطحی‌تر هستند.
👏1
Media is too big
VIEW IN TELEGRAM
🚀 HunyuanWorld-Voyager — هوش مصنوعی برای ساخت دنیاهای سه‌بعدی

Tencent اولین مدل اپن‌سورس دنیا رو معرفی کرده که همزمان ویدیو رو به صحنه‌ی سه‌بعدی واقعی تبدیل می‌کنه و بازسازی سه‌بعدی رو به صورت بومی انجام میده.

یعنی چی؟
تبدیل مستقیم ویدیو به دنیای سه‌بعدی، بدون نیاز به ابزار اضافه
مدل «حافظه‌ی فضایی» داره و هندسه‌ی درست رو از هر زاویه‌ای نگه میداره
رتبه‌ی شماره ۱ در Stanford WorldScore برای ویدیو و بازسازی سه‌بعدی

🎮 کاربردها: واقعیت مجازی (VR)، بازی‌ها، شبیه‌سازی و پروژه‌های سه‌بعدی — با کنترل از طریق کیبورد یا جوی‌استیک.

🌐 Project Page: https://3d-models.hunyuan.tencent.com/world/
💻 GitHub: https://github.com/Tencent-Hunyuan/HunyuanWorld-Voyager
🤗 HuggingFace: https://huggingface.co/tencent/HunyuanWorld-Voyager
📄 PDF: https://3d-models.hunyuan.tencent.com/voyager/voyager_en/assets/HYWorld_Voyager.pdf
🏆 Leaderboard: https://huggingface.co/spaces/Howieeeee/WorldScore_Leaderboard

@ai_machinelearning_big_data

#هوش_مصنوعی #سه‌بعدی #VR #بازی #اپن_سورس
2
💡 پژوهشگران ByteDance و استنفورد روشی تازه برای ساخت ویدیوهای طولانی معرفی کرده‌اند: Mixture of Contexts.

🔑 مشکل اصلی:
وقتی ویدیو طولانی می‌شود، توجه مدل بیش از حد گسترده می‌شود:

هزینه‌ی محاسبات بالا می‌رود

جزئیات از دست می‌رود

شخصیت‌ها فراموش می‌شوند و ویدیو دچار «انحراف» می‌گردد


نوآوری Mixture of Contexts:

ویدیو به بخش‌هایی (فریم‌ها، شات‌ها، کپشن‌ها) تقسیم می‌شود

هر بار فقط بخش‌های مرتبط انتخاب می‌شوند، نه کل تاریخچه

انتخاب بخش‌ها با مقایسه‌ی ویژگی‌ها و ارزیابی میزان ارتباط انجام می‌شود

دو «لنگر» همیشه حفظ می‌شوند: پرامپت کامل متنی و شات محلی برای جزئیات

Causal Mask دسترسی به فریم‌های آینده را می‌بندد تا حلقه‌ی تکراری ایجاد نشود

سپس Flash Attention فقط روی همین بخش‌های منتخب اعمال می‌شود → محاسبات وابسته به کل طول ویدیو نیست، بلکه فقط به محتوای مفید


📊 نتایج:

۷ برابر کاهش FLOPs

۲.۲ برابر سرعت بیشتر

در صحنه‌های طولانی (۱۸۰هزار توکن) تا ۸۵٪ توجه بیهوده حذف می‌شود


🎥 دستاورد:

کیفیت کلیپ‌های کوتاه حفظ می‌شود

صحنه‌های بلند روان‌تر و شخصیت‌ها پایدارتر هستند
آموزش ساخت اکشن فیگور واقع‌گرایان


به جمنای یا گوگل استودیو برید  به قسمت image یا nano banan برید  عکس رو آپلود کنید و این پرامپت رو وارد کنید

Create a 1/7 scale commercialized figurine of the characters in the picture, in a realistic style, in a real environment. The figurine is placed on a computer desk. The figurine has a round transparent acrylic base, with no text on the base. The content on the computer screen is a 3D modeling process of this figurine. Next to the computer screen is a toy packaging box, designed in a style reminiscent of high-quality collectible figures, printed with original artwork. The packaging features two-dimensional flat illustrations.


تمام
اکانت رسمی Nano Banana گوگل توی ایکس فعال شده. هر وقت منشنش کنی و یه پرامپت براش بنویسی، همون‌جا برات تصویر می‌سازه.

https://x.com/NanoBanana

#هوش_مصنوعی
👍1