Python-相關係數矩陣實作(python-correlation matrix )
相關係數被用來用於度量兩個變數X和Y之間的相關程度(線性相依),其值介於-1與1之間。在自然科學領域中,該係數廣泛用於度量兩個變數之間的線性相依程度。
再資料科學中,前處理步驟可先用來觀察參數間的關係,可幫助找到對目標參數影響較大的變數。
下面就用python實作係數矩陣視覺化。
import pandas as pd
import matplotlib.pyplot as mp, seaborn
#讀資料
xls_file = pd.ExcelFile('A.xlsx')
df = xls_file.parse('sheet1')
data=df
print(df)
#視覺化
df_corr = df.corr()
seaborn.heatmap(df_corr, center=0, annot=True)
mp.show()
再資料科學中,前處理步驟可先用來觀察參數間的關係,可幫助找到對目標參數影響較大的變數。
下面就用python實作係數矩陣視覺化。
import pandas as pd
import matplotlib.pyplot as mp, seaborn
#讀資料
xls_file = pd.ExcelFile('A.xlsx')
df = xls_file.parse('sheet1')
data=df
print(df)
#視覺化
df_corr = df.corr()
seaborn.heatmap(df_corr, center=0, annot=True)
mp.show()
dataframe長這樣
相關係數矩陣
留言
張貼留言