یادگیری ماشین
3.42K subscribers
21 photos
2 videos
26 files
138 links
加入频道
بیش از ۶۰ درصد مقالات کنفرانسی مربوط به یادگیری ماشین دارای نسخه‌ای در سرویس آرکایو می‌باشند. همچنین، رشد انتشار مقالات در آرکایو مربوط به حوزه‌های بینایی ماشین و پردازش زبان طبیعی، چشمگیر بوده است.
بهترین نرم‌افزارهای متن‌باز مربوط به یادگیری ماشین سال ۲۰۱۷ به انتخاب InfoWorld:
Synaptic
Scikit-learn
Caffe2
H2O
PyTorch
CatBoost
XGBoost
GNU Octave
TensorFlow
Microsoft Cognitive Toolkit
Apache MXNet
Apple Core ML
منبع:
https://www.infoworld.com/article/3228224/machine-learning/bossie-awards-2017-the-best-machine-learning-tools.html
https://www.youtube.com/playlist?list=PLievC1UeaSOD3EBaJaHstTKIXS51Sfjwo

لینک فوق شامل سی ویدئو راجع به آموزش یادگیری سریع‌تر و بهتر توسط خانم دکتر باربارا اوکلی استاد دانشگاه اوکلند می‌باشد. هر ویدئو معمولاً کمتر از ۱۰ دقیقه است.
پانوشت: این ویدئوها بدلیل اهمیت شناخت دقیق‌تر فرآیند یادگیری انسانی در کانال معرفی شده‌اند و در آنها بحثی از یادگیری ماشین نمی‌شود. شناخت فرآیند یادگیری انسانی کمک می‌کند در هر زمینه‌ای، بتوانیم بهتر از پتانسیل مغزمان استفاده نماییم.
موفقیت دیگری برای شبکه‌های عصبی:
طی دو ماه اخیر، رقابتی در سایت کگل با عنوان Porto Seguro’s Safe Driver Prediction توسط یک شرکت بیمه‌ی برزیلی با هدف پیش‌بینی این‌که آیا یک راننده در سال آینده برای گرفتن خسارت به بیمه مراجعه می‌کند یا نه برگزار شد. این رقابت از تاریخ ۲۹ سپتامبر (۷ مهر) لغایت ۳۰ نوامبر ۲۰۱۷ (۹ آذر ۱۳۹۶) برگزار شد و با استقبال قابل توجهی روبرو شد، بطوری‌که ۶۰۶۲ نفر در قالب ۵۳۵۵ تیم در این رقابت شرکت کردند. از آن‌جایی‌که جنس داده‌ی مورد استفاده در این رقابت از جنس داده‌های جدولی بود، از ابتدا چنین به نظر رسید که شبکه‌های عصبی در این رقابت نمی‌توانند موفق باشند و کسانی هم که از این رویکرد برای حل مسئله استفاده می‌کردند، موفقیت قابل توجهی را گزارش نکردند. درعوض، روش‌های مبتنی بر بوستینگ درخت‌های تصمیم (مانند XGBoost و LightGBM) بسیار مورد توجه قرار گرفتند و تا پایان رقابت تصور می‌شد که مناسب‌ترین روش برای حل چنین مسائلی، استفاده از این ابزارها می‌باشد. با پایان یافتن رقابت و مشخص شدن جایگاه افراد مختلف شرکت‌کننده، نفر اول رقابت در قالب پستی، رویکرد مورد استفاده‌ی خود برای حل این مسئله را شرح داد که در لینک زیر می‌توانید مطالعه کنید (با آی‌پی غیر ایران وارد کگل شوید!). رویکرد مورد استفاده‌ی ایشان، استفاده از ۵ شبکه‌ی عصبی Denoising Autoencoder در کنار یک مدل LightGBM بود. این نتیجه نشان داد که شبکه‌های عصبی می‌توانند برای داده‌های جدولی نیز مفید باشند و استفاده از قدرت یادگیری بدون ناظر روش‌هایی مانند Autoencoderها می‌تواند کماکان در استخراج ویژگی‌های مفید در حل مسائل داده‌کاوی، مؤثر باشد.
https://www.kaggle.com/c/porto-seguro-safe-driver-prediction/discussion/44629
ارائه‌ای راجع به معرفی مختصر کتاب‌خانه‌های مفید پایتون در علوم داده‌ها. این سخنرانی در همایش PyData در شهر ورشو در اکتبر ۲۰۱۷ ایراد شده است و به دوستانی که قصد آشنایی مختصر با مهم‌ترین کتاب‌خانه‌های پایتون مربوط به علوم داده‌ها و یادگیری ماشین را دارند، توصیه می‌شود:
https://www.youtube.com/watch?v=EBgUiuFXE3E
سخنرانی آقای علی رحیمی در کنفرانس NIPS 2017. علاوه بر جذابیت این‌که یک ایرانی جایزه‌ی test of time را در کنفرانس NIPS کسب کرده است، ده دقیقه‌ی پایانی صحبت ایشان که وضعیت فعلی یادگیری ماشین را به کیمیاگری تشبیه می‌کند جالب است. ایشان جامعه‌ی علمی را به تمرکز بر شناخت اصول حاکم بر مدل‌های توسعه‌داده‌شده به‌جای پیچیده‌تر کردن و غیرقابل‌فهم‌تر کردن مدل‌ها تشویق می‌کنند.
https://www.youtube.com/watch?v=Qi1Yry33TQE
بهترین ایده‌ی مطرح شده در یادگیری ماشین طی ده سال گذشته از نظر آقای Yann LeCun (مدیر بخش تحقیقات هوش مصنوعی فیسبوک و مبدع آموزش شبکه‌های عصبی کانولوشنی)، ایده‌ی adversarial training است که در Generative Adversarial Networks معرفی شده است. این نظر در دقیقه‌ی ۲۹ سخنرانی زیر در دانشگاه ام‌آی‌تی بیان شده است.
https://www.youtube.com/watch?v=0tEhw5t6rhc
کراس (Keras) برای دوستانی که با یادگیری عمیق آشنایی دارند، کتابخانه‌ی آشنایی است. این کتابخانه که به سادگی استفاده مشهور است، از لحاظ سرعت رشد جزء برترین‌ها در بین چارچوب‌های یادگیری عمیق می‌باشد. اخیراً خالق کراس (آقای Chollet) کتابی را با عنوان "یادگیری عمیق در پایتون" منتشر کرده است که بطور پایه‌ای و با زبان ساده به معرفی مفاهیم یادگیری عمیق و استفاده از کتابخانه‌ی کراس می‌پردازد. این کتاب را می‌توانید در پست بعد دریافت نمایید.
دکا عنوان رقابتی داخلی و آنلاین است که از اول دی ماه شروع شده است و به مدت دو ماه ادامه دارد. هدف این رقابت که شبیه رقابت‌های موجود در Kaggle می‌باشد، پیش‌بینی احتمال کلیک کاربر روی یک اعلان تبلیغاتی ارسال شده بر روی گوش تلفن همراه است. برای دوستان علاقه‌مند به داده‌کاوی، شرکت در این رقابت توصیه می‌شود. در ویدئوی زیر با این رقابت بیشتر آشنا می‌شوید:
http://deca.pushe.co/blog/live/
پلت‌فرم آموزشی سایت کگل برای آموزش مفاهیم و روش‌های مرتبط با یادگیری ماشین:
https://www.kaggle.com/learn/overview
نکته‌ای راجع به بیش‌برازش به همراه یک نمونه
با توجه به ماهیت حوزه‌ی هوش مصنوعی، افرادی که با مباحث مرتبط با هوش طبیعی موجود در طبیعت (شامل هوش انسانی) آشنا باشند، می‌توانند درک جامع‌تری نسبت به این حوزه داشته باشند. در همین راستا، درس علوم شناختی که به رایگان در سایت مکتبخونه قرار گرفته است، می‌تواند در سطح کلان مفید باشد. از مزایای این درس این است که توسط سه استاد از حوزه‌های مختلف مرتبط با علوم شناختی تدریس می‌شود:
https://maktabkhooneh.org/course/335/مبانی-علوم-شناختی/
درس یادگیری عمیق در پایتون در ترم جاری برای گروه مهندسی فناوری اطلاعات دانشگاه قم برگزار می‌شود. هدف این درس، آشنایی با مفاهیم شبکه‌های عصبی عمیق و نحوه‌ی پیاده‌سازی آنها ازطریق کتابخانه‌ی کراس می‌باشد. ویدئوهای مربوطه همزمان با ارائه‌ی درس در این کانال قرار خواهند گرفت.