DeepMind AI Expert
14.1K subscribers
1.17K photos
328 videos
111 files
2.07K links
مقالات کاربردی هوش مصنوعی در پایتون، علوم پزشکی، علوم انسانی، علوم اعصاب و...
دوره های آموزشی از دانشگاه های بزرگ و موسسات انلاین

پژوهشگران هوش مصنوعی ایران

تبادلات پیام بدید
加入频道
پیرو این پست کانال، توی این بلاگ پست از شرکت EvidentlyAI اومدن دیزاین سیستم ۴۵۰ پروژه‌ی یادگیری ماشین-نرم‌افزاری از ۱۰۰ شرکت بزرگ رو بررسی کردن و لینک‌ها رو هم گذاشتن که بتونید به داک‌ها و جزئیاتشون دسترسی داشته باشید.

توصیه می‌کنم حتما نگاه کنید بهتون دید خیلی خوبی از سیستم‌های بزرگی که از ماشین لرنینگ و نرم افزار استفاده می‌کنن می‌ده.

توضیحات مطلب:

How do companies like Netflix, Airbnb, and Doordash apply machine learning to improve their products and processes? We put together a database of 450 case studies from 100+ companies that share practical ML use cases and learnings from designing ML systems.

#systemDesign
#ML
#software
#LLM
👍4🔥21
🤖 راه تعامل و ارتباط با سیستم های Gen AI از جمله LLM ها برای کاربرها و دولوپرها از طریق پرامپت و prompt engineering هست. با وجود این که prompting مفهومی گسترده است و به شدت مورد تحقیق قرار گرفته، اما به دلیل تازگی این حوزه، اصطلاحات متناقض و درک ضعیفی از آنچه که یک پرامپت را تشکیل می‌ده، وجود داره.

💡 حالا محقق های کلی دانشگاه و کمپانی از جمله Stanford و OpenAI و Microsoft اومدن و یک مقاله ۷۶ صفحه ای از ۵۸ تکنیک برای پرامپت نوشتن متنی و ۴۰ تکنیک برای modality های دیگه دادن که با فاصله بهترین منبع برای یادگیری نوشتن پرامپت به حساب میاد. از خوندنش لذت می‌برید (برای من که اینطور بود).

💡این تکنینک‌ها زبان‌های دیگه را هم شامل می‌شه(multilingual).با نگاه به سرفصل‌های این کتابچه خودتون دستتون میاد. حالا این یک طرف، و از طرف دیگه، یک لایبرری اومده که همه این ۵۸ تا تکنیک را پیاده سازی کرده. فقط کافیه تکنیکی که می‌خواهید را روی پرامپتتون اجرا کنید تا پرامپت با کیفیت بگیرید.

📝 لینک مقاله

🖥 لینک گیت‌هاب ابزار

✍️ لینک توئیت

#LLM
#Prompt
#ML
#paper
#github

@LifeAsAService
👌8👍31
🧵#رشتو

آقامون یان لکون می‌گه حداقل تا ۱۰سال آینده خبری از AGI نیست. و بر این باوره که اگر هم ساخته بشه، از دل LLM و معماری Transformer بیرون نمیاد.
خودش داره روی JEPA کار می‌کنه. این مدل می‌تونه درک انتراعی (Abstract) خوبی از بُعد فیزیکی و مفهومی پدیده‌ها داشته باشه.
حالا مشکل LLM چیه؟
(لینک توئیت و تمام منابع داخل لینک هستش)

https://telegra.ph/JEPA-07-15

#LLM
#ML

@LifeAsAService
👍143👎1👌1
👎49😁26👍15
Self-Taught Evaluators
🔄 Self-Taught Evaluators

This research paper explores the development of self-taught language model evaluators. Instead of relying on costly human annotations, this approach utilizes synthetic data generated by the model itself. The method iteratively trains an LLM-as-a-Judge by creating contrasting response pairs, generating reasoning traces, and fine-tuning the model on this synthetic data. The research demonstrates that this method significantly improves the accuracy of the evaluator on benchmarks like RewardBench, achieving performance comparable to reward models trained with labeled examples. The authors also explore various data sources, ablations, and analyses to understand the effectiveness of the proposed approach.

📎 Link to paper
🌐 Link to their tweet

#LLM_Evaluation #Syntethic_Data #Reward_Model

@LlamaCast
👍4👌1
فرصت همکاری با آزمایشگاه ملی هوش مصنوعی 🚀


درباره ما
آزمایشگاه ملی هوش مصنوعی، به عنوان مرکز پیشرو در توسعه و تحقیقات هوش مصنوعی در کشور، در راستای تکمیل تیم تحقیقاتی خود به دنبال جذب نیروهای متخصص و مستعد است.


درباره موقعیت شغلی
ما به دنبال یک پژوهشگر مشتاق و با انگیزه در حوزه هوش مصنوعی برای پیوستن به تیم نوآور خود در دپارتمان توسعه هستیم.
عنوان شغلی: پژوهشگر هوش مصنوعی (AI Researcher)
واحد سازمانی: LWM
نوع همکاری: تمام وقت
محل کار: تهران

شرح وظایف
مطالعه و بررسی گسترده متون علمی در زمینه Large World Models و موضوعات مرتبط با هوش مصنوعی
مطالعه، تحلیل و خلاصه‌سازی مقالات پژوهشی از کنفرانس‌ها و ژورنال‌های معتبر حوزه هوش مصنوعی
ارائه یافته‌های پیچیده پژوهشی به صورت واضح و مختصر برای مخاطبان فنی و غیرفنی
شناسایی روندها و پیشرفت‌های کلیدی در تحقیقات Large World Models
همکاری با تیم توسعه برای کاربردی کردن یافته‌های پژوهشی در پروژه‌های جاری
مشارکت در توسعه پایگاه دانش و جهت‌گیری پژوهشی سازمان

مهارت‌های مورد نیاز
تحصیلات دکتری یا ارشد در رشته‌های علوم کامپیوتر، یادگیری ماشین یا رشته‌های مرتبط با تمرکز بر مدل‌های زبانی بزرگ یا World Models
پیشینه قوی در پردازش و درک زبان طبیعی
مهارت‌های پژوهشی عالی و توانایی اثبات شده در ترکیب اطلاعات پیچیده
مهارت‌های ارتباطی عالی (کتبی و شفاهی)
تجربه در ارائه مفاهیم فنی به مخاطبان مختلف
آشنایی با پیشرفت‌های اخیر در Large World Models (مانند سری GPT، PaLM، CLIP)
تجربه برنامه‌نویسی با Python و آشنایی با فریم‌ورک‌های یادگیری عمیق (مانند PyTorch، TensorFlow)

مزیت‌های اضافی
تجربه کار با سیستم‌های هوش مصنوعی چندوجهی (multi-modal)
پیشینه تحصیلی در علوم شناختی یا رشته‌های مرتبط
سابقه انتشار مقاله در کنفرانس‌ها یا ژورنال‌های هوش مصنوعی

مزایا
فرصت کار در یک محیط پویا و نوآورانه
امکان یادگیری و رشد حرفه‌ای
همکاری با تیمی متخصص و باتجربه
مشارکت در پروژه‌های ملی و پیشرو در حوزه هوش مصنوعی

نحوه درخواست
علاقه‌مندان می‌توانند رزومه خود را به همراه انگیزه‌نامه به آدرس زیر ارسال نمایند:
ایمیل: [email protected]

آدرس محل کار
تهران- خیابان ملاصدرا- سازمان ملی هوش مصنوعی - طبقه سوم

#استخدام #هوش_مصنوعی #فرصت_شغلی #AI #MachineLearning #آزمایشگاه_ملی_هوش_مصنوعی #NAIO #DeepLearning #LWM #LLM
👍10👎72👌1🕊1
🖇 یه مقاله‌ی باحال اومده که اومدن توش بررسی کردن که آیا دادن شخصیت(Persona) به هوش مصنوعی می‌تونه توی عملکرد اون تاثیر بذاره؟
من توی یه توئیت خلاصه‌ی اون رو خوندم و اینجا براتون گذاشتمش.

#llm
#paper
#tweet

🆔 @lifeAsAService
👍113
این مقاله الف تا یای مدل‌های زبانی رو توی خودش جا داده. از جمع آوری و آماده‌سازی داده گرفته تا آموزش مدل و فاین‌تیون کردن و دیپلوی کردن روی پروداکشن و بهبود پرفورمنس. پیشنهاد می‌کنم یه نگاه چشمی هم شده بهش بندازید.

🖇 لینک مقاله

#LLM
#Generative_AI
#paper

🆔 @lifeAsAService
11👌3👍1
کمپانی HuggingFace یک سری مدل کوچیک به اسم SmolLM2 که تا سقف ۲ میلیارد پرامتر دارند، معرفی کرده که برای خیلی از کارها از جمله بازنویسی متن (rewriting)، خلاصه کردن متن (summarization)، و function calling میتونید راحت به صورت لوکال با سرعت خیلی بالا ازشون استفاده کنید.

HuggingFace link


#LLM
#ml
🆔@lifeAsAService
👍9
برای مقایسه #مدل_زبانی_بزرگ از این لینک استفاده کنید.

▪️ AI Model Comparison

#llm #nlp
#پردازش_زبان_طبیعی

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
👍31👎1
معرفی AgoraBench، معیاری برای ارزیابی قابلیت های تولید داده از مدلهای LM ها.
این کار مقایسه مستقیم LM های مختلف به عنوان یک تولید کننده داده را دشوار می کند.

درAgoraBench، این شکاف را با ارائه 9 تنظیمات یکپارچه که سه حوزه (ریاضی، کد، دنبال کردن دستورالعمل ها) و سه روش تولید داده را پوشش می دهد

1️⃣تولید نمونه: مشابه Self-Instruct، تولیدکننده داده مشروط به نمایش های درون متنی است و نمونه های جدیدی تولید می کند.

2️⃣تولید پاسخ: با توجه به مجموعه ای ثابت از دستورالعمل ها، مولد داده برای هر دستورالعمل پاسخ هایی تولید می کند.

3️⃣افزایش کیفیت: با توجه به مقادیر زیاد داده های با کیفیت پایین، تولید کننده داده کیفیت داده ها را افزایش می دهد.

▪️ Evaluating Language Models as Synthetic Data Generators

#llm #nlp
#پردازش_زبان_طبیعی #مقاله #ایده_جذاب

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
🔸 @AI_Person
👍4
Forwarded from Recommender system (MehriMah Amiri)
LLM.pdf
8 MB
Quick Start Guide to Large Language Models

راهنمای سریع:

مقدمه‌ای بر مدل‌های زبانی بزرگ (Large Language Models) ارائه می‌دهد.
راهبردها و بهترین شیوه‌های استفاده از LLMها مانند ChatGPT را معرفی می‌کند.
مناسب برای توسعه‌دهندگان، محققان داده، و علاقه‌مندان به هوش مصنوعی و کاربردهای مدل‌های زبانی است.
به عنوان مرجعی برای یادگیری نحوه استقرار و مدیریت LLMها مورد استفاده قرار می‌گیرد.

#LLM #LargeLanguageModels #ChatGPT
#Book
👍4👎1🔥1
تا الان فکر کردین اگه بخواید یه سیستم رو که الان با نیروی انسانی در حال کار کردن هستش به هوش مصنوعی مهاجرت بدید چه هزینه‌هایی رو باید در نظر بگیرید؟

من یه مطلب نوشتم که تجربه‌ی خودم رو توش تا یه حد کوچولویی گفتم، خوشحال می‌شم بخونید.

🔗 لینک مطلب


#LLM
#product
#solution
#GPT

🆔 @lifeAsAService
7
Forwarded from Metis Ai
1738386173145.pdf
25.4 MB
چطور می‌تونیم بفهمیم که یک مدل زبانی Fine-tune شده؟🤔
۱- Response Consistency
۲- Hold-out Data
۳- Token Attribution
۴- Benchmarking
توی این هندبوک در مورد راه‌هایی که می‌شه تشخیص داد یک مدل Fine-tune شده صحبت شده.

#آموزش
#LLM
#مستندات

ما رو دنبال کنید:

📱 @metis_ai_news
🔗 metisai.ir
📺 کانال آپارات ما: aparat.com/metis_ai
👍13👎4🔥21
Forwarded from LLM Club
🔔 اعلام برنامه جلسه‌ی چهاردهم ژورنال‌کلاب مدل‌های زبانی بزرگ

📚 موضوع: نحوه‌ی ساخت و آموزش مدل‌های زبانی چندزبانه و به طور خاص مدل Aya-expanse
👤 سخنران مهمان: دکتر مرضیه فدایی، پژوهشگر ارشد هوش مصنوعی در شرکت Cohere
🗓 زمان: یک‌شنبه ۱۴۰۳/۱۱/۲۸، ساعت ۱۹:۳۰ تا ۲۱:٠٠
مکان برگزاری: vc.sharif.edu/ch/mjafari
🔍 مدل زبانی آیا-اکسپنس یک مدل چندزبانه بزرگ است که توسط تیم Cohere For AI توسعه یافته و از ۲۳ زبان مختلف از جمله فارسی پشتیبانی می‌کند. این مدل با استفاده از تکنیک‌های پیشرفته‌ای مانند داوری داده، آموزش با ترجیح چندزبانه، تنظیمات ایمنی و ترکیب مدل‌ها، عملکرد بالایی را در پردازش زبان‌های مختلف ارائه می‌دهد. هدف از توسعه ایا-اکسپنس، ارائه یک مدل چندزبانه با کیفیت بالا برای استفاده پژوهشگران در سراسر جهان است. طبق معیارها و سنجه‌های مختلف (از جمله این سنجه) مدل آیا-اکسپنس کیفیت خوبی بر روی زبان فارسی نیز دارد.

لینک یوتیوب ژورنال‌کلاب ‌(ویدئو و اسلاید جلسه‌ها)
افزودن رویداد به تقویم گوگل‌

از همه‌ی شما دعوت می‌کنیم که در این جلسه شرکت کنید.
#LLM #LLM_JC #LLM_Club #INL_Lab #Aya_Expanse
@LLM_JC
4
Forwarded from Alireza
🚀 Excited to Share WaterCrawl!

Looking for a robust, open-source tool for web scraping and preparing data for Large Language Models (LLMs)? Check out WaterCrawl — a powerful web application that leverages Python, Django, Scrapy, and Celery to efficiently crawl websites and extract relevant data across different languages and formats! 📊🌐

💡 What makes WaterCrawl unique?

Seamlessly scrapes websites of various types.

Transforms scraped data into LLM-ready output, perfect for natural language processing tasks.

Designed to work across multiple languages and diverse web domains.

🌟 Open Source: We're constantly improving, and contributions from the community are highly welcome! If you're excited about working with cutting-edge scraping and data extraction tools, take a look! 👇

👉 GitHub: https://github.com/watercrawl/WaterCrawl

Feel free to explore, contribute, or reach out if you're interested in collaborating. Let's build something incredible together! 💻

#opensource #webscraping #python #AI #LLM #data #tech
1👍1🔥1👌1
Forwarded from .AI _in _Healthcare. (Zeinab Habibi)
بررسی تحول LLM در رادیولوژی: Radiology-Llama2! 🩺

مدل Radiology-Llama2 به عنوان یک ابزار در حوزه رادیولوژی شناخته می‌شد که به پزشکان کمک می‌کند تا گزارش‌های دقیق‌تری تهیه کنند.
این مدل با بر داده‌های پایگاه MIMIC می‌تواند تصاویر بالینی را به تشخیص‌های پزشکی تبدیل کند

🔍از سال 2024 تا حالا
: Radiology-Llama2 توانایی‌هایش را بهبود داده و در حال حاضر می‌تواند خروجی‌های بسیار دقیق و قابل اعتمادی تولید کند.
🔍توجه بیشتری به ایمنی و کیفیت پاسخ‌ها شده است، به‌گونه‌ای که پزشکان به این اطلاعات بیشتر اعتماد می‌کنند.

💥اطلاعات بیشتر
- مقاله اول: (https://pubmed.ncbi.nlm.nih.gov/39779926/)
- مقاله دوم: (https://arxiv.org/abs/2305.09617)

#Radiology #LLM
#AIinHealthCare
#MedicalAI
👍4👌21
Audio
#پادکست تولید شده توسط NotebookLM برای فایل pdf پست زیر:

Top 50 LLM Interview Questions


#NotebookLM
#Podcast
#LLM_Interview

🔸 مطالب بیشتر 👇👇

@AI_DeepMind
6🔥1