相關係數被用來 用於度量兩個變數X和Y之間的相關 程度(線性相依),其值介於-1與1之間。在自然科學領域中,該係數廣泛用於度量兩個變數之間的線性相依程度。 再資料科學中,前處理步驟可先用來觀察參數間的關係,可幫助找到對目標參數影響較大的變數。 下面就用python實作係數矩陣視覺化。 import pandas as pd import matplotlib.pyplot as mp, seaborn #讀資料 xls_file = pd.ExcelFile('A.xlsx') df = xls_file.parse('sheet1') data=df print(df) #視覺化 df_corr = df.corr() seaborn.heatmap(df_corr, center=0, annot=True) mp.show() dataframe長這樣 相關係數矩陣
留言
張貼留言