یادگیری ماشین
3.42K subscribers
21 photos
2 videos
26 files
138 links
加入频道
دانشگاه CMU در پاییز ۲۰۱۸، برای نخستین بار دوره‌ی کارشناسی هوش مصنوعی را ارائه می‌دهد. برنامه‌ی تحصیلی و دروس این دوره در لینک زیر قابل مشاهده است:
https://www.cs.cmu.edu/bs-in-artificial-intelligence/curriculum
شبکه‌های عصبی مصنوعی علیرغم دستاوردهای شگرفی که کسب کرده‌اند، از یک مشکل اساسی رنج می‌برند: عدم توانایی برون‌یابی. بعنوان مثال، اگر شبکه برای داده‌هایی در بازه‌ی ۵- تا ۵ آموزش دیده باشد، در این بازه بسیار خوب عمل می‌کند، ولی برای داده‌های خارج این بازه می‌تواند خطای قابل توجهی ایجاد کند. اخیراً مقاله‌ای توسط محققین گوگل دیپ‌مایند ارائه شده است که برای حل این مشکل، دو نوع سلول عصبی جدید معرفی کرده‌اند. خواندن این مقاله‌ی شیرین و مهم را از دست ندهید:
https://arxiv.org/pdf/1808.00508.pdf
در وب‌سایت زیر، بسیاری از مسائل پردازش زبان‌های طبیعی به همراه بهترین نتیجه‌ی منتشر شده برای آنها گردآوری شده است:
https://nlpprogress.com
👍1
موضوع بازنمایی جملات (sentence representation) در ادامه‌ی موفقیت‌های حاصل شده برای بازنمایی کلمات (word representation) به موضوعی داغ تبدیل شده است. هدف از بازنمایی جملات، تبدیل یک جمله به یک بردار عددی است بطوری‌که این بردار اطلاعات معنایی و ساختاری جمله را شامل شود و جملات مشابه به نقاطی نزدیک در این فضای برداری نگاشت شوند. همچنین، یک بازنمایی مناسب قابلیت انتقال دارد، یعنی می‌توان آن را برای مسائل مختلف پردازش زبان طبیعی بکار برد و خاص یک مسئله‌ی مشخص نمی‌باشد.
اخیراً دو تن از محققان تیم هوش مصنوعی فیسبوک برای ساده کردن و یکنواخت‌سازی مقایسه‌ی بین روش‌های مختلف بازنمایی جملات، ابزار SentEval را توسعه داده و در اختیار عموم قرار داده‌اند. این ابزار تا کنون شامل ۱۷ مسئله‌ی مختلف است و چند روش بازنمایی موجود (مانند روش Google USE و Facebook InferSent) را هم بعنوان مثال شامل می‌شود. در لینک زیر، مقالات و کدهای مربوط به تعدادی از روش‌های بازنمایی جملات به همراه ابزار SentEval قرار داده شده است:
https://github.com/h-amirkhani/NLP-must-read/blob/master/sentence_representation.md
کنفرانس‌های CoNLL و EMNLP دو کنفرانس معتبر حوزه‌ی "پردازش زبان‌های طبیعی"، امسال در یک زمان (از فردا به مدت ۵ روز) در شهر بروکسل برگزار خواهند شد. دو مقاله‌ی زیر، به‌ترتیب برنده‌ی جایزه‌ی بهترین مقاله و جایزه‌ی ویژه‌ی کنفرانس CoNLL شده‌اند:
http://aclweb.org/anthology/K18-1028
http://aclweb.org/anthology/K18-1030
👍1
تأثیر مجموعه داده‌ی ImageNet بر نسل جدید هوش مصنوعی و نقش آن در ایجاد موج "یادگیری عمیق" بر کسی پوشیده نیست. از منظر کاربردهای عملی بینایی ماشین نیز استفاده از مدل‌های پیش‌آموزش داده شده روی ImageNet و انجام "یادگیری انتقالی" بعنوان ابزار اصلی بسیاری از پروژه‌های این حوزه مورد استفاده بوده است.
در حوزه‌ی پردازش زبان‌های طبیعی، برخی از محققین معتقدند "لحظه‌ی ImageNet" با ظهور مدل‌های عمیق پیش‌اموزش داده شده در مسئله‌ی "مدل‌سازی زبانی" فرا رسیده است. پست زیر را برای آگاهی بیشتر با این موضوع مطالعه کنید:
http://ruder.io/nlp-imagenet/
مصاحبه با ۲۵ محقق عمدتا به‌نام حوزه‌ی پردازش زبان‌های طبیعی. از هر نفر چهار سوال پرسیده شده است:
سه مورد از بزرگ‌ترین مسائل حل نشده‌ی حوزه‌ی پردازش زبان‌های طبیعی؟
مؤثرترین کار انجام شده در دهه‌ی گذشته؟
موردی که باعث انحراف این حوزه شده است (درصورت وجود)؟
توصیه به دانشجویانی که می‌خواهند در این حوزه تحقیقات را شروع کنند؟
👇