Python-相關係數矩陣實作(python-correlation matrix )

相關係數被用來用於度量兩個變數X和Y之間的相關程度(線性相依),其值介於-1與1之間。在自然科學領域中,該係數廣泛用於度量兩個變數之間的線性相依程度。

再資料科學中,前處理步驟可先用來觀察參數間的關係,可幫助找到對目標參數影響較大的變數。
下面就用python實作係數矩陣視覺化。



import pandas as pd
import matplotlib.pyplot as mp, seaborn

#讀資料
xls_file = pd.ExcelFile('A.xlsx')
df = xls_file.parse('sheet1')
data=df

print(df)

#視覺化
df_corr = df.corr()
seaborn.heatmap(df_corr, center=0, annot=True)

mp.show()

dataframe長這樣

相關係數矩陣

留言

這個網誌中的熱門文章

ASP.NET-後端將值傳給javascript

ASP.NET-FileUpload上傳後自動觸發button click(FileUpload upload auto trigger button click)