🧠✨ بازسازی تصاویر ذهنی با سیگنال EEG و یادگیری عمیق!
به دنیای آینده خوش آمدید: پروژه [EEGStyleGAN-ADA](https://github.com/prajwalsingh/EEGStyleGAN-ADA) یکی از جدیدترین دستاوردهای هوش مصنوعی است که با استفاده از سیگنال مغزی (EEG)، تصاویری که افراد تصور میکنند را بازسازی میکند!
🔬 این پروژه چگونه کار میکند؟
1. استخراج ویژگی از سیگنال EEG:
ابتدا سیگنالهای مغزی وارد شبکههای عمیق (LSTM, CNN با یادگیری contrastive) میشوند تا بازنماییهای قوی و قابل تفکیکی از فکر فرد به دست آید.
2. تولید تصویر با StyleGAN-ADA:
ویژگیهای استخراجشده به فضای latent مدل StyleGAN-ADA نگاشت میشوند تا تصویر ذهنی فرد روی بوم دیجیتال (واقعاً!) نقاشی شود.
📈 دستاوردها و نقاط قوت:
- امتیاز بالای Inception Score روی دیتاستهای تخصصی مثل EEGCVPR40 و Thoughtviz (بهبود چشمگیر نسبت به روشهای قبلی)
- استخراج نمایههای مغزی مستقل از سوژه (Generalizable)
- ارائه checkpoints و کد باز برای استفاده پژوهشگران
🥽 کاربردها:
- رابط مغز و کامپیوتر (BCI) و کمک به افراد با محدودیت حرکتی یا گفتاری
- درک بهتر رمزگذاری اطلاعات بصری در مغز انسان
آینده تعامل با مغز انسان را جدی بگیرید...
منبع کد و توضیحات بیشتر:
🔗 https://github.com/prajwalsingh/EEGStyleGAN-ADA
🔗 [مقاله علمی arXiv:2310.16532](https://arxiv.org/abs/2310.16532)
---
❤️ برای اطلاعات بیشتر و پروژههای مشابه، ما را دنبال کنید!
#BCI #EEG #DeepLearning #AI #NeuroAI
به دنیای آینده خوش آمدید: پروژه [EEGStyleGAN-ADA](https://github.com/prajwalsingh/EEGStyleGAN-ADA) یکی از جدیدترین دستاوردهای هوش مصنوعی است که با استفاده از سیگنال مغزی (EEG)، تصاویری که افراد تصور میکنند را بازسازی میکند!
🔬 این پروژه چگونه کار میکند؟
1. استخراج ویژگی از سیگنال EEG:
ابتدا سیگنالهای مغزی وارد شبکههای عمیق (LSTM, CNN با یادگیری contrastive) میشوند تا بازنماییهای قوی و قابل تفکیکی از فکر فرد به دست آید.
2. تولید تصویر با StyleGAN-ADA:
ویژگیهای استخراجشده به فضای latent مدل StyleGAN-ADA نگاشت میشوند تا تصویر ذهنی فرد روی بوم دیجیتال (واقعاً!) نقاشی شود.
📈 دستاوردها و نقاط قوت:
- امتیاز بالای Inception Score روی دیتاستهای تخصصی مثل EEGCVPR40 و Thoughtviz (بهبود چشمگیر نسبت به روشهای قبلی)
- استخراج نمایههای مغزی مستقل از سوژه (Generalizable)
- ارائه checkpoints و کد باز برای استفاده پژوهشگران
🥽 کاربردها:
- رابط مغز و کامپیوتر (BCI) و کمک به افراد با محدودیت حرکتی یا گفتاری
- درک بهتر رمزگذاری اطلاعات بصری در مغز انسان
آینده تعامل با مغز انسان را جدی بگیرید...
منبع کد و توضیحات بیشتر:
🔗 https://github.com/prajwalsingh/EEGStyleGAN-ADA
🔗 [مقاله علمی arXiv:2310.16532](https://arxiv.org/abs/2310.16532)
---
❤️ برای اطلاعات بیشتر و پروژههای مشابه، ما را دنبال کنید!
#BCI #EEG #DeepLearning #AI #NeuroAI
GitHub
GitHub - prajwalsingh/EEGStyleGAN-ADA: Pytorch code of paper "Learning Robust Deep Visual Representations from EEG Brain Recordings".…
Pytorch code of paper "Learning Robust Deep Visual Representations from EEG Brain Recordings". [WACV 2024] - prajwalsingh/EEGStyleGAN-ADA
🎉20🔥17👏17🥰16😁16❤15👍8
تیم MetaAI موفق شد در رقابت بینالمللی Algonauts 2025 مقام اول را کسب کند 🏆🧠 — این مسابقه بزرگترین چالش جهانی در زمینه مدلسازی واکنش مغز انسان است.
---
🎯 هدف رقابت
ساخت مدلی که بتواند پاسخ fMRI مغز را هنگام تماشای فیلمهای چندرسانهای (تصویر، صدا و متن) پیشبینی کند — یعنی شبیهسازی دقیق واکنش مغز به ترکیب پیچیدهای از ورودیهای حسی.
---
🛠 راهکار MetaAI — مدل TRIBE (Trimodal Brain Encoder)
🟡 مدل سبک با تنها ۱ میلیارد پارامتر و اولین معماری عصبی اختصاصی برای مدلسازی fMRI.
🖼 انکودر جداگانه برای هر مدالیته:
* متن → Llama-3.2-3B
* ویدئو → Video-JEPA 2
* صدا → Wav2Vec2-BERT-2.0
* همه امبدینگها به نرخ ۲ هرتز همگام میشوند تا با fMRI هماهنگ شوند.
🧩 بخش مرکزی: ترنسفورمر ۸ لایه برای پردازش توالی امبدینگها. خروجی آن به توالی fMRI در بازه زمانی مورد نظر نگاشت میشود، شامل ۱۰۰۰ پارسل مغزی (تمام نواحی مغز).
---
📊 نتایج رکوردشکن
* ضریب همبستگی میانگین بین پیشبینی و داده واقعی: ۰.۲۲ (SOTA معمولاً ≤ ۰.۲).
* برای برخی شرکتکنندگان: بیش از ۰.۳.
* مدل توانایی خوبی در ژنرالایز روی دادههای خارج از توزیع دارد.
* نمودارها نشان میدهند که با دادههای بیشتر، دقت بالاتری قابل دستیابی است.
---
💶 جایزه قهرمانی: ۹۰۰۰ یورو
📄 [مقاله](https://arxiv.org/abs/2507.22229) | 💻 [کد](https://github.com/facebookresearch/algonauts-2025)
#هوش_مصنوعی 🤖 #NeuroAI 🧠 #MetaAI 🏢 #fMRI 📈 #ترنسفورمر 🕸 #بینایی_ماشین 👁 #پردازش_صوت 🔊
---
🎯 هدف رقابت
ساخت مدلی که بتواند پاسخ fMRI مغز را هنگام تماشای فیلمهای چندرسانهای (تصویر، صدا و متن) پیشبینی کند — یعنی شبیهسازی دقیق واکنش مغز به ترکیب پیچیدهای از ورودیهای حسی.
---
🛠 راهکار MetaAI — مدل TRIBE (Trimodal Brain Encoder)
🟡 مدل سبک با تنها ۱ میلیارد پارامتر و اولین معماری عصبی اختصاصی برای مدلسازی fMRI.
🖼 انکودر جداگانه برای هر مدالیته:
* متن → Llama-3.2-3B
* ویدئو → Video-JEPA 2
* صدا → Wav2Vec2-BERT-2.0
* همه امبدینگها به نرخ ۲ هرتز همگام میشوند تا با fMRI هماهنگ شوند.
🧩 بخش مرکزی: ترنسفورمر ۸ لایه برای پردازش توالی امبدینگها. خروجی آن به توالی fMRI در بازه زمانی مورد نظر نگاشت میشود، شامل ۱۰۰۰ پارسل مغزی (تمام نواحی مغز).
---
📊 نتایج رکوردشکن
* ضریب همبستگی میانگین بین پیشبینی و داده واقعی: ۰.۲۲ (SOTA معمولاً ≤ ۰.۲).
* برای برخی شرکتکنندگان: بیش از ۰.۳.
* مدل توانایی خوبی در ژنرالایز روی دادههای خارج از توزیع دارد.
* نمودارها نشان میدهند که با دادههای بیشتر، دقت بالاتری قابل دستیابی است.
---
💶 جایزه قهرمانی: ۹۰۰۰ یورو
📄 [مقاله](https://arxiv.org/abs/2507.22229) | 💻 [کد](https://github.com/facebookresearch/algonauts-2025)
#هوش_مصنوعی 🤖 #NeuroAI 🧠 #MetaAI 🏢 #fMRI 📈 #ترنسفورمر 🕸 #بینایی_ماشین 👁 #پردازش_صوت 🔊
🔥16👍13🎉13❤8😁6