The Debugging Diaries
88 subscribers
63 photos
47 videos
33 files
73 links
گوشه‌ای برای یادداشت و ثبت مطالب مربوط به پایتون، یادگیری عمیق و هوش و هر چی که مربوط به تکنولوژی باشه.
加入频道
07_کوییز_آزمایشگاه_سیستم_های_توصیه_گر_مبتنی_بر_همکاری.rar
383.9 KB
✴️ دوره یادگیری ماشین با جادی

🔰 فصل پنجم (سیستم های توصیه گر)

7 - کوییز آزمایشگاه سیستم های توصیه گر مبتنی بر همکاری
08 - پروژه تلفن همراه پیشنهادی.rar
7.1 MB
✴️ دوره یادگیری ماشین با جادی

🔰 فصل پنجم (سیستم های توصیه گر)

8 - پروژه تلفن همراه پیشنهادی
06 - Files.rar
25.5 MB
🔰 فایل های این دوره در صورت نیاز
#ML
persian machine learning book @DataPlusScience.pdf
17.2 MB
یادگیری ماشین و علم داده: مبانی، مفاهیم، الگوریتم‌ها و ابزارها
تالیف و گردآوری: میلاد وزان

نسخه الکترونیک کتاب توسط مولف به صورت رایگان منتشر شده است.

فهرست مطالب:
فصل اول: علم داده
فصل دوم: مقدمه‌ای بر پایتون
فصل سوم: داده
فصل چهارم: مقدمه‌ای بر یادگیری ماشین
فصل پنجم: انتخاب و ارزیابی مدل
فصل ششم: یادگیری با نظارت
فصل هفتم: یادگیری عمیق
فصل هشتم: یادگیری غیرنظارتی
فصل نهم: مباحث منتخب
#Book
#ML
تفاوتها کراس،پایتورچ ، تنسرفلو
#python
Power Query VS SQL vs Python
Confusion Matrix.pdf
3 MB
خلاصه ای از Confusion Matrix
#ML
Data Prep and Cleaning for Machine Learning @DataPlusScience.pdf
3.9 MB
پیش پردازش داده‌ها در پروژه‌های علوم داده

این فایل به صورت مختصر به بیان 8 گام مرسوم پیش‌پردازش داده‌ها در پروژه‌های علوم داده پرداخته است.
#ML
چن تا از مهم ترین توابع تو پانداز که هرکدوممون باید بلد باشیم
#python
Pandas in 8 Pages.pdf
828 KB
🔖Pandas in 8 Pages
#python
MACHINE LEARNING CHEET SHEET .pdf
1.3 MB
یک cheat sheet با کیفیت و کامل

#منابع #یادگیری_ماشین
#ML
Understanding AI vs. ML.pdf
964.2 KB
فایل هوش مصنوعی، یادگیری ماشین و یادگیری عمیق و تفاوت آن ها
#ML
DeepLearning @DataPlusScience.pdf
10.9 MB
#کتاب_فارسی

یادگیری عمیق: از اصول اولیه تا ساخت شبکه‌های عصبی عمیق با پایتون

نگارنده: میلاد وزان


سرفصل‌ها:
مقدمه‌ای بر یادگیری عمیق
شبکه‌های عصبی پیش‌خور
شبکه‌های عصبی کانولوشنی
شبکه‌های عصبی بازگشتی
شبکه متخاصم مولد

این کتاب به رایگان و توسط نگارنده منتشر شده است.
#Book
#ML
Forwarded from آرمان بهنام
Python Regex Cheat Sheet.pdf
495 KB
🧾آموزش عبارات با قاعده یا regex در پایتون

عبارات با قاعده یا همان Regular Expression ها روشی جهت پردازش داده های متنی و استخراج اطلاعات مورد نظر از آن است. با Regex ها می توان الگوهای مثلا ایمیل، شماره تلفن، اسامی و ... را از متن استخراج کرد. در این آموزش خیلی ساده این رویکرد در زبان پایتون بررسی شده است. البته Regex ها رو در هر زبانی می توان استفاده کرد حتی توی اکسل هم وجود دارند.

با تشکر از علی نظری زاده

📍این مطلب را با علاقمندان به پایتون به اشتراک بگذاریم.
_______________________
📚 @ArmanbehnamAI
Forwarded from DLeX: AI Python (NaviD DariYa)
حتمن با الگوریتم BPE که به منظور توکنایزیشن LLM استفاده می شه آشنایی دارید. این الگوریتم byte-level که اولین بار بعد از انتشار مقاله Language Models are Unsupervided Multitask Learners مشهور شد. GPT-2 Paper
@ai_python
این مهم هم زمان با انتشار GPT-2 بود.
امروزه همه LLM های مدرن مثل GPT ، Llama و Mistral از این الگوریتم برای Train کردن Tokenizer هاشون استفاده می کنن.
@ai_python
ریپازیتوری که در ادامه قصد معرفی آن در DLeX را داریم، در واقع حاوی کد 2 توکنایزر است که بر اساس BPE هستند.

آخرین کامیتش هم در زمان نوشتن این پست در DLeX مربوط به 51 دقیقه پیش هست :

https://github.com/karpathy/minbpe
Forwarded from Tensorflow(@CVision) ((◕‿◕))
مدل Gemma مدلی سبک از گوگل که بسیار شبیه مدل‌های جدید جِمی‌نای (Gemini) ساخته شده با این تفاوت که‌ اوپن سورس هست و برای استفاده عمومی منتشر شده.
نسخه‌های این مدل ۲ و ۷ میلیارد پارامتری هست و توی تقریبا همه فریم‌ورک‌های معروف کدش رو منتشر کردند.

لینک بلاگ:

https://blog.google/technology/developers/gemma-open-models/?utm_source=tw&utm_medium=social&utm_campaign=gemini24&utm_content=&utm_term=

لینک کگل:
https://www.kaggle.com/models/google/gemma?utm_medium=social&utm_source=twitter&utm_campaign=models-gemmalaunch
Forwarded from School of AI
چگونه از Tensorboard در Google Colab استفاده کنیم؟!

همون‌طور که می‌دونید، Tensorboard ابزاری‌ست که برای به‌تصویرکشیدن متریک‌هایی مثل loss و accuracy در حین آموزش مدل در TensorFlow (و البته PyTorch) و چند مورد دیگه استفاده می‌شه.

برای این کار، هنگام آموزش مدل در تنسورفلو، یک callback به نام tf.keras.callbacks.TensorBoard را به متد train پاس می‌دیم و در پایتورچ، از torch.utils.tensorboard.SummaryWriter استفاده می‌کنیم. اطلاعات لازم در یک پوشه (مثلا /runs/. در پایتورچ) لاگ می‌شن. سپس سرویس TensorBoard که یک نرم‌افزار تحت وب جدا‌ست رو با اجرای دستور tensorboard در ترمینال اجرا کرده و از طریق مرورگر وب (http://localhost:6006) به آن متصل می‌شیم.

اما زمانی که از Google Colab استفاده می‌کنیم، مرورگر ما به ماشین مجازی‌ای که کد روی اون در حال اجراست، دسترسی نداره و چون اون ماشین مجازی، IP معتبر و اختصاصی روی اینترنت نداره، در حالت عادی نمی‌تونیم به سرویس TensorBoard روی اون متصل شیم.

پس راه‌حل چیست؟
پاسخ: باز کردن یک تونل از یک آدرس معتبر اینترنتی به داخل ماشین مجازی و سرویس تنسوربورد

اگه یه دامنه‌ی اختصاصی برای خودتون دارید می‌تونید روی سایت Cloudflare یه اکانت بسازید و اونجا از یک آدرس معتبر یه تونل به ماشینی که می‌خواید باز کنید.
ولی اگه دامین خودتون رو ندارید می‌تونید از Ngrok استفاده کنید.

برای استفاده از Ngrok داخل نوت‌بوک خود در گوگل کولب، اول دو دستور زیر رو اجرا کنید تا Ngrok دانلود و extract شه:

!wget https://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip
!unzip -o ngrok-stable-linux-amd64.zip

بعد سرویس تنسوربورد رو با دستور زیر روی پورت ۶۰۰۶ اجرا کنید:

LOGDIR = '/tmp/log'
get_ipython().system_raw(
'tensorboard --logdir {} --host 0.0.0.0 --port 6006 &'
.format(LOG_DIR)
)

بعد Ngrok رو اجرا کرده و سر تونل رو به پورت ۶۰۰۶ ماشین مجازی وصل کنید

get_ipython().system_raw('./ngrok http 6006 &')

تونل شما آماده‌ست. با اجرای دستور زیر آدرس عمومی دسترسی به تونل رو پیدا کنید و ازون طریق تنسوربورد رو باز کنید:

!curl -s http://localhost:4040/api/tunnels | python3 -c \
"import sys, json; print(json.load(sys.stdin)['tunnels'][0]['public_url'])"
Forwarded from DLeX: AI Python (NaviD DariYa)
لانگ فیوز، یکی از پلت فرم های LLM Engineering است که شامل قابلیت های زیر برای LLM Application ها هست :

👨‍💻 Traces

👨‍💻 Evals

👨‍💻 Prompt Management

👨‍💻 Metrics

حال، به تازگی، این پلت فرم اپن سورس با Llama Index هم Integrate شده.
@ai_python

جهت اطلاعات بیش تر به این پست مراجعه کنید.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from DLeX: AI Python (NaviD DariYa)
یک رشته توییت عالی که تغییرات معماری ترانسفورمرها رو از سال ۲۰۱۷ تا الان بررسی کرده.
@ai_python

لینک مقاله های آرکایو در رشته توییت قرار داده شده است :

https://twitter.com/Muhtasham9/status/1772469982485438485?t=120YmOd_4f2HS-FnYib3qA&s=19
آقای Andrew Ng جدیدا یک ویدیویی رو منتشر کردن که راجع به Agent ها و Agentic workflow ها صحبت میکنه.Agent ها یکی از مهمترین trend هاست. پیشنهاد میکنم حتما ویدئو را ببینید.

لینک ویدیو

https://youtu.be/sal78ACtGTc

🆔 @data_science_python_and_r