📦 کتابخانه LangExtract از گوگل؛ استخراج ساختار از متن به کمک هوش مصنوعی
🔍 گوگل بهتازگی از LangExtract رونمایی کرده؛ یک کتابخانه اپنسورس پایتون برای استخراج اطلاعات ساختاریافته از متون بلند، با بهرهگیری از مدلهای LLM مثل Gemini.
📌 ویژگیهای برجسته LangExtract:
✅ ردیابی دقیق منبع اطلاعات:
هر دادهای که استخراج میشود (مثل نام، تاریخ یا دوز دارو)، به مکان دقیق آن در متن اصلی اشاره دارد. این یعنی میتوان منشأ دقیق اطلاعات را بررسی کرد.
✅ فرمت خروجی قابلاعتماد و مشخص:
با استفاده از چند مثال و تعیین ساختار موردنظر، خروجی همیشه فرمتی منسجم و قابلپیشبینی دارد.
✅ پشتیبانی از متون بسیار طولانی:
متنها به بخشهایی تقسیم شده و بهصورت موازی پردازش میشوند. این باعث افزایش دقت و مقیاسپذیری در دادههای سنگین میشود.
✅ نمایش گرافیکی HTML:
با خروجی تعاملی HTML میتوانید هزاران برچسب استخراجشده را در متن بهصورت بصری بررسی کنید.
✅ سازگار با LLMهای مختلف:
گرچه توسط گوگل توسعه یافته، اما فقط محدود به Gemini نیست. میتوانید از مدلهای دیگر بهصورت محلی یا ابری استفاده کنید.
✅ قابلیت غنیسازی با دانش عمومی مدلها:
بعضی دادهها ممکن است از "دانش درونی" مدل استخراج شوند؛ مثلاً اطلاعاتی که صراحتاً در متن نیست اما مدل بر اساس دانش عمومی خود پیشنهاد میدهد.
🔬 کاربرد اصلی اولیه: تحلیل گزارشهای پزشکی گوگل در دمو RadExtract نشان داده که این ابزار چگونه میتواند از گزارشهای رادیولوژی، دادههای مهم را استخراج و ساختاردهی کند.
🧪 دمو آنلاین: RadExtract در Hugging Face
📚 توضیح رسمی: مقاله وبلاگ گوگل
💾 سورسکد: LangExtract در گیتهاب
🔖 لایسنس: Apache 2.0
@rss_ai_ir
#استخراج_اطلاعات #هوش_مصنوعی #Google #LangExtract #LLM #پردازش_زبان_طبیعی
🔍 گوگل بهتازگی از LangExtract رونمایی کرده؛ یک کتابخانه اپنسورس پایتون برای استخراج اطلاعات ساختاریافته از متون بلند، با بهرهگیری از مدلهای LLM مثل Gemini.
📌 ویژگیهای برجسته LangExtract:
✅ ردیابی دقیق منبع اطلاعات:
هر دادهای که استخراج میشود (مثل نام، تاریخ یا دوز دارو)، به مکان دقیق آن در متن اصلی اشاره دارد. این یعنی میتوان منشأ دقیق اطلاعات را بررسی کرد.
✅ فرمت خروجی قابلاعتماد و مشخص:
با استفاده از چند مثال و تعیین ساختار موردنظر، خروجی همیشه فرمتی منسجم و قابلپیشبینی دارد.
✅ پشتیبانی از متون بسیار طولانی:
متنها به بخشهایی تقسیم شده و بهصورت موازی پردازش میشوند. این باعث افزایش دقت و مقیاسپذیری در دادههای سنگین میشود.
✅ نمایش گرافیکی HTML:
با خروجی تعاملی HTML میتوانید هزاران برچسب استخراجشده را در متن بهصورت بصری بررسی کنید.
✅ سازگار با LLMهای مختلف:
گرچه توسط گوگل توسعه یافته، اما فقط محدود به Gemini نیست. میتوانید از مدلهای دیگر بهصورت محلی یا ابری استفاده کنید.
✅ قابلیت غنیسازی با دانش عمومی مدلها:
بعضی دادهها ممکن است از "دانش درونی" مدل استخراج شوند؛ مثلاً اطلاعاتی که صراحتاً در متن نیست اما مدل بر اساس دانش عمومی خود پیشنهاد میدهد.
🔬 کاربرد اصلی اولیه: تحلیل گزارشهای پزشکی گوگل در دمو RadExtract نشان داده که این ابزار چگونه میتواند از گزارشهای رادیولوژی، دادههای مهم را استخراج و ساختاردهی کند.
🧪 دمو آنلاین: RadExtract در Hugging Face
📚 توضیح رسمی: مقاله وبلاگ گوگل
💾 سورسکد: LangExtract در گیتهاب
🔖 لایسنس: Apache 2.0
@rss_ai_ir
#استخراج_اطلاعات #هوش_مصنوعی #Google #LangExtract #LLM #پردازش_زبان_طبیعی
❤2👍1🙏1
📊 چطور یک جزئیات قدیمی در قوانین رأیگیری، بازار پیشبینی را برای Google برنده کرد؟
@rss_ai_ir
در بازار پیشبینی Polymarket، سؤال این بود که «کدام شرکت تا پایان آگوست بهترین مدل هوش مصنوعی را خواهد داشت؟»
تا قبل از دیروز، شانس پیروزی در این بازار با OpenAI بود. اما ناگهان پس از انتشار نتایج LMArena**، کفه ترازو بهطور کامل به نفع Google سنگین شد — و این ربطی به کیفیت واقعی مدلها در ارائه GPT-5 نداشت.
---
🔍 **چرا این اتفاق افتاد؟
❇️معیار «بهترین مدل» در این بازار بر اساس امتیاز LMArena تعیین میشود، جایی که کاربران بین پاسخ دو مدل، یکی را انتخاب میکنند.
❇️نکته مهم: در این بازار از نسخه بدون Style Control استفاده میشود. یعنی مدلها بابت پاسخهای طولانی، فرمتبندیشده و با بولد/لیست جریمه نمیشوند.
❇️ در این حالت، امتیاز Gemini 2.5 Pro گوگل و GPT-5 تقریباً برابر شد (۱۴۷۱ در برابر ۱۴۶۲ — اختلاف آماری ناچیز).
❇️طبق قوانین، در صورت مساوی شدن امتیاز، نام شرکت برنده به ترتیب الفبا انتخاب میشود. Google قبل از OpenAI قرار میگیرد.
---
📈 نتیجه:
بازار عملاً به این سؤال تقلیل یافت: «آیا OpenAI میتواند در ۲۳ روز آینده آپدیتی بدهد که در نسخه بدون Style Control از Gemini جلو بزند؟»
اگر جواب «نه» باشد، Google برنده است — حتی اگر در ارزیابی پیشفرض (با Style Control) OpenAI جلوتر باشد.
---
💡 این نمونهای جالب است از اینکه در بازارهای پیشبینی، جزئیات قوانین و روش ارزیابی میتواند از کیفیت واقعی محصول مهمتر باشد.
#هوش_مصنوعی #بازار_پیشبینی #Google #OpenAI #LMArena
@rss_ai_ir
@rss_ai_ir
در بازار پیشبینی Polymarket، سؤال این بود که «کدام شرکت تا پایان آگوست بهترین مدل هوش مصنوعی را خواهد داشت؟»
تا قبل از دیروز، شانس پیروزی در این بازار با OpenAI بود. اما ناگهان پس از انتشار نتایج LMArena**، کفه ترازو بهطور کامل به نفع Google سنگین شد — و این ربطی به کیفیت واقعی مدلها در ارائه GPT-5 نداشت.
---
🔍 **چرا این اتفاق افتاد؟
❇️معیار «بهترین مدل» در این بازار بر اساس امتیاز LMArena تعیین میشود، جایی که کاربران بین پاسخ دو مدل، یکی را انتخاب میکنند.
❇️نکته مهم: در این بازار از نسخه بدون Style Control استفاده میشود. یعنی مدلها بابت پاسخهای طولانی، فرمتبندیشده و با بولد/لیست جریمه نمیشوند.
❇️ در این حالت، امتیاز Gemini 2.5 Pro گوگل و GPT-5 تقریباً برابر شد (۱۴۷۱ در برابر ۱۴۶۲ — اختلاف آماری ناچیز).
❇️طبق قوانین، در صورت مساوی شدن امتیاز، نام شرکت برنده به ترتیب الفبا انتخاب میشود. Google قبل از OpenAI قرار میگیرد.
---
📈 نتیجه:
بازار عملاً به این سؤال تقلیل یافت: «آیا OpenAI میتواند در ۲۳ روز آینده آپدیتی بدهد که در نسخه بدون Style Control از Gemini جلو بزند؟»
اگر جواب «نه» باشد، Google برنده است — حتی اگر در ارزیابی پیشفرض (با Style Control) OpenAI جلوتر باشد.
---
💡 این نمونهای جالب است از اینکه در بازارهای پیشبینی، جزئیات قوانین و روش ارزیابی میتواند از کیفیت واقعی محصول مهمتر باشد.
#هوش_مصنوعی #بازار_پیشبینی #Google #OpenAI #LMArena
@rss_ai_ir
😁12❤5👍5🔥5🎉3🥰2👏2🙏1
📢 مدل جدید گوگل: Gemma 3 270M
مدل فشردهای با ۲۷۰ میلیون پارامتر (۱۷۰M برای embedding و ۱۰۰M برای بلاکهای ترنسفورمر) معرفی شد که توانایی بالایی در دنبالکردن دستورها از همان ابتدا دارد.
🔹 ویژگیها
♻️پشتیبانی از ۲۵۶k توکن
♻️بهرهوری انرژی: نسخه INT4 روی Pixel 9 Pro تنها ۰.۷۵٪ باتری را برای ۲۵ دیالوگ مصرف میکند
♻️ارائهی نسخههای Pretrained و Instruction-tuned
♻️پشتیبانی از Quantization-Aware Training (QAT) برای اجرای INT4 بدون افت محسوس کیفیت
💼 موارد استفاده
✳️وظایف مشخص و پرحجم مانند تحلیل احساسات، استخراج موجودیتها، پردازش متن و چکهای انطباقی
✳️کاهش هزینه و تاخیر، قابلیت اجرا مستقیم روی دستگاه
✳️آزمایش و فاینتیون سریع
✳️حفظ کامل حریم خصوصی با پردازش لوکال
✳️ساخت یک ناوگان مدلهای تخصصی کوچک برای وظایف مختلف
📊 در یک نمونه، Adaptive ML و SK Telecom مدل Gemma 3 4B را برای مدیریت محتوای چندزبانه فاینتیون کردند و از مدلهای اختصاصی بزرگتر عملکرد بهتری گرفتند.
👉 مدل Gemma 3 270M انتخابی عالی برای کاربردهای سریع، کمهزینه و رویدستگاهی است.
🟠 جزییات: Google Blog
🟠 HuggingFace: Gemma
@rss_ai_ir
#خبر #هوش_مصنوعی #یادگیری_عمیق #Gemma #Google
مدل فشردهای با ۲۷۰ میلیون پارامتر (۱۷۰M برای embedding و ۱۰۰M برای بلاکهای ترنسفورمر) معرفی شد که توانایی بالایی در دنبالکردن دستورها از همان ابتدا دارد.
🔹 ویژگیها
♻️پشتیبانی از ۲۵۶k توکن
♻️بهرهوری انرژی: نسخه INT4 روی Pixel 9 Pro تنها ۰.۷۵٪ باتری را برای ۲۵ دیالوگ مصرف میکند
♻️ارائهی نسخههای Pretrained و Instruction-tuned
♻️پشتیبانی از Quantization-Aware Training (QAT) برای اجرای INT4 بدون افت محسوس کیفیت
💼 موارد استفاده
✳️وظایف مشخص و پرحجم مانند تحلیل احساسات، استخراج موجودیتها، پردازش متن و چکهای انطباقی
✳️کاهش هزینه و تاخیر، قابلیت اجرا مستقیم روی دستگاه
✳️آزمایش و فاینتیون سریع
✳️حفظ کامل حریم خصوصی با پردازش لوکال
✳️ساخت یک ناوگان مدلهای تخصصی کوچک برای وظایف مختلف
📊 در یک نمونه، Adaptive ML و SK Telecom مدل Gemma 3 4B را برای مدیریت محتوای چندزبانه فاینتیون کردند و از مدلهای اختصاصی بزرگتر عملکرد بهتری گرفتند.
👉 مدل Gemma 3 270M انتخابی عالی برای کاربردهای سریع، کمهزینه و رویدستگاهی است.
🟠 جزییات: Google Blog
🟠 HuggingFace: Gemma
@rss_ai_ir
#خبر #هوش_مصنوعی #یادگیری_عمیق #Gemma #Google
😁9🎉8🔥7👍6❤3
🌌 ناسا و گوگل در حال آزمایش پزشک فضایی مبتنی بر هوش مصنوعی 🚀
در مریخ، پرسیدن از پزشک یعنی ۴۰ دقیقه انتظار رفت و برگشت برای پاسخ! حالا پروژهی CMO-DA ناسا و گوگل آمده تا در نبود پزشک، درمان فوری انجام دهد.
🧠 اجرا روی Google Vertex AI با پشتیبانی از صدا، متن و تصویر
📊 دقت آزمایشها: ۸۸٪ در تشخیص آسیب مچ پا، ۸۰٪ برای گوشدرد، ۷۴٪ برای درد پهلو
🩺 گام بعدی: اتصال به تجهیزات پزشکی و آموزش شرایط خاص فضایی
🌍 کاربرد بالقوه روی زمین برای تلهمدیسین و مناطق دورافتاده
در اعماق فضا، دیگر خبری از «ویزیت خانگی» نیست!
@rss_ai_ir
#هوش_مصنوعی #فضا #پزشکی #NASA #Google
در مریخ، پرسیدن از پزشک یعنی ۴۰ دقیقه انتظار رفت و برگشت برای پاسخ! حالا پروژهی CMO-DA ناسا و گوگل آمده تا در نبود پزشک، درمان فوری انجام دهد.
🧠 اجرا روی Google Vertex AI با پشتیبانی از صدا، متن و تصویر
📊 دقت آزمایشها: ۸۸٪ در تشخیص آسیب مچ پا، ۸۰٪ برای گوشدرد، ۷۴٪ برای درد پهلو
🩺 گام بعدی: اتصال به تجهیزات پزشکی و آموزش شرایط خاص فضایی
🌍 کاربرد بالقوه روی زمین برای تلهمدیسین و مناطق دورافتاده
در اعماق فضا، دیگر خبری از «ویزیت خانگی» نیست!
@rss_ai_ir
#هوش_مصنوعی #فضا #پزشکی #NASA #Google
👍11🔥10🎉9😁7❤2