بهترین نرمافزارهای متنباز مربوط به یادگیری ماشین سال ۲۰۱۷ به انتخاب InfoWorld:
Synaptic
Scikit-learn
Caffe2
H2O
PyTorch
CatBoost
XGBoost
GNU Octave
TensorFlow
Microsoft Cognitive Toolkit
Apache MXNet
Apple Core ML
منبع:
https://www.infoworld.com/article/3228224/machine-learning/bossie-awards-2017-the-best-machine-learning-tools.html
Synaptic
Scikit-learn
Caffe2
H2O
PyTorch
CatBoost
XGBoost
GNU Octave
TensorFlow
Microsoft Cognitive Toolkit
Apache MXNet
Apple Core ML
منبع:
https://www.infoworld.com/article/3228224/machine-learning/bossie-awards-2017-the-best-machine-learning-tools.html
InfoWorld
Best of open source: The best machine learning tools
InfoWorld picks the best open source software for machine learning and deep learning
معرفی مفاهیم یادگیری ماشین به بیان بسیار ساده، بطوریکه برای دانشآموزان نیز قابل درک باشد:
http://blog.stephenwolfram.com/2017/05/machine-learning-for-middle-schoolers/
http://blog.stephenwolfram.com/2017/05/machine-learning-for-middle-schoolers/
Stephenwolfram
Machine Learning for Middle Schoolers—Stephen Wolfram Writings
How machine learning works and real-world examples of where it can be used are highlighted in the new edition of Stephen Wolfram’s programming book.
https://www.youtube.com/playlist?list=PLievC1UeaSOD3EBaJaHstTKIXS51Sfjwo
لینک فوق شامل سی ویدئو راجع به آموزش یادگیری سریعتر و بهتر توسط خانم دکتر باربارا اوکلی استاد دانشگاه اوکلند میباشد. هر ویدئو معمولاً کمتر از ۱۰ دقیقه است.
پانوشت: این ویدئوها بدلیل اهمیت شناخت دقیقتر فرآیند یادگیری انسانی در کانال معرفی شدهاند و در آنها بحثی از یادگیری ماشین نمیشود. شناخت فرآیند یادگیری انسانی کمک میکند در هر زمینهای، بتوانیم بهتر از پتانسیل مغزمان استفاده نماییم.
لینک فوق شامل سی ویدئو راجع به آموزش یادگیری سریعتر و بهتر توسط خانم دکتر باربارا اوکلی استاد دانشگاه اوکلند میباشد. هر ویدئو معمولاً کمتر از ۱۰ دقیقه است.
پانوشت: این ویدئوها بدلیل اهمیت شناخت دقیقتر فرآیند یادگیری انسانی در کانال معرفی شدهاند و در آنها بحثی از یادگیری ماشین نمیشود. شناخت فرآیند یادگیری انسانی کمک میکند در هر زمینهای، بتوانیم بهتر از پتانسیل مغزمان استفاده نماییم.
YouTube
- YouTube
موفقیت دیگری برای شبکههای عصبی:
طی دو ماه اخیر، رقابتی در سایت کگل با عنوان Porto Seguro’s Safe Driver Prediction توسط یک شرکت بیمهی برزیلی با هدف پیشبینی اینکه آیا یک راننده در سال آینده برای گرفتن خسارت به بیمه مراجعه میکند یا نه برگزار شد. این رقابت از تاریخ ۲۹ سپتامبر (۷ مهر) لغایت ۳۰ نوامبر ۲۰۱۷ (۹ آذر ۱۳۹۶) برگزار شد و با استقبال قابل توجهی روبرو شد، بطوریکه ۶۰۶۲ نفر در قالب ۵۳۵۵ تیم در این رقابت شرکت کردند. از آنجاییکه جنس دادهی مورد استفاده در این رقابت از جنس دادههای جدولی بود، از ابتدا چنین به نظر رسید که شبکههای عصبی در این رقابت نمیتوانند موفق باشند و کسانی هم که از این رویکرد برای حل مسئله استفاده میکردند، موفقیت قابل توجهی را گزارش نکردند. درعوض، روشهای مبتنی بر بوستینگ درختهای تصمیم (مانند XGBoost و LightGBM) بسیار مورد توجه قرار گرفتند و تا پایان رقابت تصور میشد که مناسبترین روش برای حل چنین مسائلی، استفاده از این ابزارها میباشد. با پایان یافتن رقابت و مشخص شدن جایگاه افراد مختلف شرکتکننده، نفر اول رقابت در قالب پستی، رویکرد مورد استفادهی خود برای حل این مسئله را شرح داد که در لینک زیر میتوانید مطالعه کنید (با آیپی غیر ایران وارد کگل شوید!). رویکرد مورد استفادهی ایشان، استفاده از ۵ شبکهی عصبی Denoising Autoencoder در کنار یک مدل LightGBM بود. این نتیجه نشان داد که شبکههای عصبی میتوانند برای دادههای جدولی نیز مفید باشند و استفاده از قدرت یادگیری بدون ناظر روشهایی مانند Autoencoderها میتواند کماکان در استخراج ویژگیهای مفید در حل مسائل دادهکاوی، مؤثر باشد.
https://www.kaggle.com/c/porto-seguro-safe-driver-prediction/discussion/44629
طی دو ماه اخیر، رقابتی در سایت کگل با عنوان Porto Seguro’s Safe Driver Prediction توسط یک شرکت بیمهی برزیلی با هدف پیشبینی اینکه آیا یک راننده در سال آینده برای گرفتن خسارت به بیمه مراجعه میکند یا نه برگزار شد. این رقابت از تاریخ ۲۹ سپتامبر (۷ مهر) لغایت ۳۰ نوامبر ۲۰۱۷ (۹ آذر ۱۳۹۶) برگزار شد و با استقبال قابل توجهی روبرو شد، بطوریکه ۶۰۶۲ نفر در قالب ۵۳۵۵ تیم در این رقابت شرکت کردند. از آنجاییکه جنس دادهی مورد استفاده در این رقابت از جنس دادههای جدولی بود، از ابتدا چنین به نظر رسید که شبکههای عصبی در این رقابت نمیتوانند موفق باشند و کسانی هم که از این رویکرد برای حل مسئله استفاده میکردند، موفقیت قابل توجهی را گزارش نکردند. درعوض، روشهای مبتنی بر بوستینگ درختهای تصمیم (مانند XGBoost و LightGBM) بسیار مورد توجه قرار گرفتند و تا پایان رقابت تصور میشد که مناسبترین روش برای حل چنین مسائلی، استفاده از این ابزارها میباشد. با پایان یافتن رقابت و مشخص شدن جایگاه افراد مختلف شرکتکننده، نفر اول رقابت در قالب پستی، رویکرد مورد استفادهی خود برای حل این مسئله را شرح داد که در لینک زیر میتوانید مطالعه کنید (با آیپی غیر ایران وارد کگل شوید!). رویکرد مورد استفادهی ایشان، استفاده از ۵ شبکهی عصبی Denoising Autoencoder در کنار یک مدل LightGBM بود. این نتیجه نشان داد که شبکههای عصبی میتوانند برای دادههای جدولی نیز مفید باشند و استفاده از قدرت یادگیری بدون ناظر روشهایی مانند Autoencoderها میتواند کماکان در استخراج ویژگیهای مفید در حل مسائل دادهکاوی، مؤثر باشد.
https://www.kaggle.com/c/porto-seguro-safe-driver-prediction/discussion/44629
Kaggle
Porto Seguro’s Safe Driver Prediction
Predict if a driver will file an insurance claim next year.
ارائهای راجع به معرفی مختصر کتابخانههای مفید پایتون در علوم دادهها. این سخنرانی در همایش PyData در شهر ورشو در اکتبر ۲۰۱۷ ایراد شده است و به دوستانی که قصد آشنایی مختصر با مهمترین کتابخانههای پایتون مربوط به علوم دادهها و یادگیری ماشین را دارند، توصیه میشود:
https://www.youtube.com/watch?v=EBgUiuFXE3E
https://www.youtube.com/watch?v=EBgUiuFXE3E
YouTube
The Python ecosystem for Data Science: A guided tour - Christian Staudt
Description
Pythonistas have access to an extensive collection of tools for data analysis. The space of tools is best understood as an ecosystem: Libraries build upon each other, and a good library fills an ecological niche by doing certain jobs well. This…
Pythonistas have access to an extensive collection of tools for data analysis. The space of tools is best understood as an ecosystem: Libraries build upon each other, and a good library fills an ecological niche by doing certain jobs well. This…
سخنرانی آقای علی رحیمی در کنفرانس NIPS 2017. علاوه بر جذابیت اینکه یک ایرانی جایزهی test of time را در کنفرانس NIPS کسب کرده است، ده دقیقهی پایانی صحبت ایشان که وضعیت فعلی یادگیری ماشین را به کیمیاگری تشبیه میکند جالب است. ایشان جامعهی علمی را به تمرکز بر شناخت اصول حاکم بر مدلهای توسعهدادهشده بهجای پیچیدهتر کردن و غیرقابلفهمتر کردن مدلها تشویق میکنند.
https://www.youtube.com/watch?v=Qi1Yry33TQE
https://www.youtube.com/watch?v=Qi1Yry33TQE
YouTube
Ali Rahimi's talk at NIPS(NIPS 2017 Test-of-time award presentation)
بهترین ایدهی مطرح شده در یادگیری ماشین طی ده سال گذشته از نظر آقای Yann LeCun (مدیر بخش تحقیقات هوش مصنوعی فیسبوک و مبدع آموزش شبکههای عصبی کانولوشنی)، ایدهی adversarial training است که در Generative Adversarial Networks معرفی شده است. این نظر در دقیقهی ۲۹ سخنرانی زیر در دانشگاه امآیتی بیان شده است.
https://www.youtube.com/watch?v=0tEhw5t6rhc
https://www.youtube.com/watch?v=0tEhw5t6rhc
YouTube
Yann LeCun - Power & Limits of Deep Learning
Yann LeCun is Director of AI Research at Facebook, and Silver Professor of Dara Science, Computer Science, Neural Science, and Electrical Engineering at New York University, affiliated with the NYU Center for Data Science, the Courant Institute of Mathematical…
کراس (Keras) برای دوستانی که با یادگیری عمیق آشنایی دارند، کتابخانهی آشنایی است. این کتابخانه که به سادگی استفاده مشهور است، از لحاظ سرعت رشد جزء برترینها در بین چارچوبهای یادگیری عمیق میباشد. اخیراً خالق کراس (آقای Chollet) کتابی را با عنوان "یادگیری عمیق در پایتون" منتشر کرده است که بطور پایهای و با زبان ساده به معرفی مفاهیم یادگیری عمیق و استفاده از کتابخانهی کراس میپردازد. این کتاب را میتوانید در پست بعد دریافت نمایید.
دکا عنوان رقابتی داخلی و آنلاین است که از اول دی ماه شروع شده است و به مدت دو ماه ادامه دارد. هدف این رقابت که شبیه رقابتهای موجود در Kaggle میباشد، پیشبینی احتمال کلیک کاربر روی یک اعلان تبلیغاتی ارسال شده بر روی گوش تلفن همراه است. برای دوستان علاقهمند به دادهکاوی، شرکت در این رقابت توصیه میشود. در ویدئوی زیر با این رقابت بیشتر آشنا میشوید:
http://deca.pushe.co/blog/live/
http://deca.pushe.co/blog/live/
پلتفرم آموزشی سایت کگل برای آموزش مفاهیم و روشهای مرتبط با یادگیری ماشین:
https://www.kaggle.com/learn/overview
https://www.kaggle.com/learn/overview
یادگیری ماشین
ارائهی خانم فِی فِی لی (از پژوهشگران برجستهی حوزهی بینایی ماشین و دانشیار دانشگاه استنفورد) در کنفرانس TED که در تاریخ ۳ فروردین ۹۴ در وبسایت TED بارگذاری شده است. ایشان از اعضای اصلی تیم جمعآوری کنندهی مجموعه دادهی Imagenet هستند که این مجموعه، نقش…
سخنرانی خانم فِی فِی لی در کنفرانس تد اخیراً به زبان فارسی ترجمه و صداگذاری شده است:
https://www.aparat.com/v/dBkqm
https://www.aparat.com/v/dBkqm
آپارات - سرویس اشتراک ویدیو
صحبت های خانم Fei-Fei Li . فهماندن تصاویر به رایانه ها
چگونه به رایانه ها فهمیدن تصاویر را میآموزیم.بیشتر https://alisterta.github.io/2017-12-24/%D8%B5%D8%AD%D8%A8%D8%AA-%D9%87%D8%A7%DB%8C-%D8%AE%D8%A7%D9%86%D9%85-Fei-Fei-Li-%D8%AF%D8%B1-%D9%85%D9%88%D8%B1%D8%AF-%D9%87%D9%88%D8%B4-%D9%85%D8%B5%D9%86%D9%88%D8%B9%DB%8C…
با توجه به ماهیت حوزهی هوش مصنوعی، افرادی که با مباحث مرتبط با هوش طبیعی موجود در طبیعت (شامل هوش انسانی) آشنا باشند، میتوانند درک جامعتری نسبت به این حوزه داشته باشند. در همین راستا، درس علوم شناختی که به رایگان در سایت مکتبخونه قرار گرفته است، میتواند در سطح کلان مفید باشد. از مزایای این درس این است که توسط سه استاد از حوزههای مختلف مرتبط با علوم شناختی تدریس میشود:
https://maktabkhooneh.org/course/335/مبانی-علوم-شناختی/
https://maktabkhooneh.org/course/335/مبانی-علوم-شناختی/
مکتبخونه
آموزش درس مبانی علوم شناختی - مکتب خونه
آموزش درس مبانی علوم شناختی ، توسط اساتید برجسته پژوهشکده علوم شناختی
توصیههای ارزشمند دکتر آندره اِنگ برای کسانیکه قصد استفاده از یادگیری ماشین در صنایع را دارند:
https://www.youtube.com/watch?v=NKpuX_yzdYs
https://www.youtube.com/watch?v=NKpuX_yzdYs
YouTube
Andrew Ng - The State of Artificial Intelligence
Professor Andrew Ng is the former chief scientist at Baidu, where he led the company's Artificial Intelligence Group. He is an adjunct professor at Stanford University. In 2011 he led the development of Stanford University’s main MOOC (Massive Open Online…
درس یادگیری عمیق در پایتون در ترم جاری برای گروه مهندسی فناوری اطلاعات دانشگاه قم برگزار میشود. هدف این درس، آشنایی با مفاهیم شبکههای عصبی عمیق و نحوهی پیادهسازی آنها ازطریق کتابخانهی کراس میباشد. ویدئوهای مربوطه همزمان با ارائهی درس در این کانال قرار خواهند گرفت.