ترکیب دیتافریم ها با یکدیگر (بخش دوم)
فرض کنید داده های مربوط به کاربران شامل نام و میزان کمیسیون فروش آنها را در یک جدول به نام users ذخیره کرده ایم. در جدول دیگری به نام sales میزان فروش کاربران را ذخیره کرده ایم.
با استفاده از تابع join و مشخص کردن شیوه ترکیب توسط پارامتر how می توانید ادغام را انجام دهید.
#ترکیب
#دیتافریم
#merge
#join
#Pandas
#data_science
پایتون برای مالی در تلگرام
🆔 https://yangx.top/joinchat/AAAAAFGMkouqbsb86Vfzug
فرض کنید داده های مربوط به کاربران شامل نام و میزان کمیسیون فروش آنها را در یک جدول به نام users ذخیره کرده ایم. در جدول دیگری به نام sales میزان فروش کاربران را ذخیره کرده ایم.
با استفاده از تابع join و مشخص کردن شیوه ترکیب توسط پارامتر how می توانید ادغام را انجام دهید.
#ترکیب
#دیتافریم
#merge
#join
#Pandas
#data_science
پایتون برای مالی در تلگرام
🆔 https://yangx.top/joinchat/AAAAAFGMkouqbsb86Vfzug
❤18
plotting_with_pandas.pdf
877.7 KB
دانلود فایل رسم انواع نمودارها با Pandas
رسم نمودارها همیشه یکی از مهمترین کارهای یک دانشمند داده است. قبلا در پست های زیادی در خصوص انواع #نمودار با هم صحبت کرده بودیم. در این فایل نمودارهای اصلی پانداس بررسی و شیوه ترسیم آنها ذکر می شود.
#پانداس
#نمودار
#pandas
پایتون برای مالی در تلگرام
https://yangx.top/joinchat/AAAAAFGMkouqbsb86Vfzug
رسم نمودارها همیشه یکی از مهمترین کارهای یک دانشمند داده است. قبلا در پست های زیادی در خصوص انواع #نمودار با هم صحبت کرده بودیم. در این فایل نمودارهای اصلی پانداس بررسی و شیوه ترسیم آنها ذکر می شود.
#پانداس
#نمودار
#pandas
پایتون برای مالی در تلگرام
https://yangx.top/joinchat/AAAAAFGMkouqbsb86Vfzug
❤23
رفع مشکل pandas_datareader
ماژول pandas_datareader یکی از بهترین و متداولترین ماژولها برای دریافت داده ها از yahoo finance است، یا بهتر بود بگویم بود! چند وقتی است که این ماژول دچار مشکل شده است و متاسفانه توسعه دهندگان آن به روز رسانی جدیدی را برای آن ارائه نکرده اند و البته (تا جایی که من بررسی کردم) راه حل استانداری برای حل مشکل آن ارائه نشده است.
یکی از سوالات کاربران، راه حل این موضوع بود که البته yfinance بهترین جایگزین برای این موضوع است. اما اگر در پروژه هایتان قبلا از pandas_datareader استفاده کرده اید و نمی خواهید همه کدها را تغییر دهید می توانید با استفاده از yfinance از راه حل زیر برای حل موضوع استفاده کنید.
#pandas_datareader
#yfianance
پایتون برای مالی
🆔 t.me/python4finance
🆔 ble.ir/python4finance
ماژول pandas_datareader یکی از بهترین و متداولترین ماژولها برای دریافت داده ها از yahoo finance است، یا بهتر بود بگویم بود! چند وقتی است که این ماژول دچار مشکل شده است و متاسفانه توسعه دهندگان آن به روز رسانی جدیدی را برای آن ارائه نکرده اند و البته (تا جایی که من بررسی کردم) راه حل استانداری برای حل مشکل آن ارائه نشده است.
یکی از سوالات کاربران، راه حل این موضوع بود که البته yfinance بهترین جایگزین برای این موضوع است. اما اگر در پروژه هایتان قبلا از pandas_datareader استفاده کرده اید و نمی خواهید همه کدها را تغییر دهید می توانید با استفاده از yfinance از راه حل زیر برای حل موضوع استفاده کنید.
#pandas_datareader
#yfianance
پایتون برای مالی
🆔 t.me/python4finance
🆔 ble.ir/python4finance
❤19
ایجاد نقشه حرارتی در دیتافریم
بسیاری از اوقات می خواهیم با یک نگاه رابطه بین متغیرها رو بررسی کنیم. یکی از بهترین نماگرها برای این موضوع، نقشه حرارتی است. به کمک پانداس به راحتی می توان نقشه حرارتی را تشکیل داد.
در مثال این پست، رابطه همبستگی بین بازدهی سهام چند شرکت از ابتدای 2024 بررسی و نقشه حرارتی آنها نیز مشخص می شود.
#پانداس
#همبستگی
#نقشه حرارتی
#pandas
#heatmaps
🆔 t.me/python4finance
بسیاری از اوقات می خواهیم با یک نگاه رابطه بین متغیرها رو بررسی کنیم. یکی از بهترین نماگرها برای این موضوع، نقشه حرارتی است. به کمک پانداس به راحتی می توان نقشه حرارتی را تشکیل داد.
در مثال این پست، رابطه همبستگی بین بازدهی سهام چند شرکت از ابتدای 2024 بررسی و نقشه حرارتی آنها نیز مشخص می شود.
import pandas as pd
import yfinance as yf
df=yf.download(["GOOG","META","MSFT","AMZN","AAPL"],start="2024-01-01")["Adj Close"].pct_change().corr()
df.sort_values("AAPL",axis=0).style.format().background_gradient()
#پانداس
#همبستگی
#نقشه حرارتی
#pandas
#heatmaps
🆔 t.me/python4finance
❤33
کار با مقادیر از دست رفته در پایتون، ماژول Pandas - بخش ششم (توابع جدید)
قبلا در این پست در خصوص تمیز کردن داده ها و کار با مقادیر از دست رفته (None و NAN) صحبت کرده بودیم. در به روزرسانی های اخیر پانداس، توابع ffill و bfill جایگزین fillna(method='ffill') و fillna(method='bfill') شده اند و از نسخه 2.1.0 این تغییر اتفاق افتاده است. در صورتی که در کدهای خود از این توابع استفاده کرده اید، هر چه سریعتر نسبت به بروزرسانی اقدام نمایید.
#pandas
#fillna
#bfill
#ffill
پایتون برای مالی
🆔 t.me/python4finance
🆔 ble.ir/python4finance
قبلا در این پست در خصوص تمیز کردن داده ها و کار با مقادیر از دست رفته (None و NAN) صحبت کرده بودیم. در به روزرسانی های اخیر پانداس، توابع ffill و bfill جایگزین fillna(method='ffill') و fillna(method='bfill') شده اند و از نسخه 2.1.0 این تغییر اتفاق افتاده است. در صورتی که در کدهای خود از این توابع استفاده کرده اید، هر چه سریعتر نسبت به بروزرسانی اقدام نمایید.
#pandas
#fillna
#bfill
#ffill
پایتون برای مالی
🆔 t.me/python4finance
🆔 ble.ir/python4finance
❤22
اختصاصی سازی مقادیر نمایش داده شده در pandas
یکی از ویژگی های جالب پانداس، امکانات بسیار خوبی است که برای اختصاصی سازی داده ها به کاربر می دهد. برای مثال فرض کنید می خواهیم به جای داده های Nan عبارت خالی را نمایش دهیم. یا می خواهیم داده ها را به صورت سه رقم سه رقم نمایش دهیم. برای این کار به آسانی می توانیم از style.format استفاده کنیم.
در مثال این پست، اختصاصی سازی داده ها برای مقادیر مختلف نمایش داده می شود.
#پایتون_مالی
#پانداس
#pandas
عضویت در کانال پایتون برای مالی👇👇👇
🆔 t.me/python4finance
🆔 ble.ir/python4finance
یکی از ویژگی های جالب پانداس، امکانات بسیار خوبی است که برای اختصاصی سازی داده ها به کاربر می دهد. برای مثال فرض کنید می خواهیم به جای داده های Nan عبارت خالی را نمایش دهیم. یا می خواهیم داده ها را به صورت سه رقم سه رقم نمایش دهیم. برای این کار به آسانی می توانیم از style.format استفاده کنیم.
در مثال این پست، اختصاصی سازی داده ها برای مقادیر مختلف نمایش داده می شود.
import pandas as pd
df = pd.DataFrame([[np.nan, 1234567, np.nan], [2.0, 'A' , 3.0]])
df.style.format(thousands=",", precision=2 , decimal="/", na_rep='خالی')
#پایتون_مالی
#پانداس
#pandas
عضویت در کانال پایتون برای مالی👇👇👇
🆔 t.me/python4finance
🆔 ble.ir/python4finance
❤30
خلاصه بندی OHLC داده ها با resample
یکی از توابع بسیار کاربردی pandas تابع resample است. به کمک این تابع می توانیم تناوب داده ها را تغییر دهیم. مثلا داده های ساعتی را به داده های روزانه تبدیل کنیم یا داده های روزانه را به هفتگی، ماهانه و سالانه.
یکی از بخش های قشنگ این ماژل تبدیل داده ها به فرمت OHLC است. یعنی داده های مربوط به بازشدن، بالاترین داده، کمترین داده و داده بسته شده. (البته برای بچه های بازار سرمایه این فرمت آشناست، اما برای سایر رشته ها شاید کمی عجیب به نظر برسد)
فرض کنید داده های ساعتی هواشناسی را داریم. می خواهیم دمای هوا در ابتدا و انتهای روز و نیز بالاترین دما و پایین ترین دما را مشخص و رسم کنیم.
با استفاده از resample به راحتی قابل انجام است.
#پانداس
#pandas
#resample
پایتون برای مالی
🆔 @python4finance
یکی از توابع بسیار کاربردی pandas تابع resample است. به کمک این تابع می توانیم تناوب داده ها را تغییر دهیم. مثلا داده های ساعتی را به داده های روزانه تبدیل کنیم یا داده های روزانه را به هفتگی، ماهانه و سالانه.
یکی از بخش های قشنگ این ماژل تبدیل داده ها به فرمت OHLC است. یعنی داده های مربوط به بازشدن، بالاترین داده، کمترین داده و داده بسته شده. (البته برای بچه های بازار سرمایه این فرمت آشناست، اما برای سایر رشته ها شاید کمی عجیب به نظر برسد)
فرض کنید داده های ساعتی هواشناسی را داریم. می خواهیم دمای هوا در ابتدا و انتهای روز و نیز بالاترین دما و پایین ترین دما را مشخص و رسم کنیم.
با استفاده از resample به راحتی قابل انجام است.
import pandas as pd
import mplfinance as mpf
url="https://python4finance.ir/datafolder/WeatherData.csv"
df=pd.read_csv(url,index_col="Date/Time" , parse_dates=True)
mpf.plot(df.loc["01/01/2012 00:00":"05/01/2012 00:00"]["Temp_C"].resample("D").ohlc(),type="candle",figsize=(16,6),mav=(10))
#پانداس
#pandas
#resample
پایتون برای مالی
🆔 @python4finance
❤35