變量標準化可能是為了調整資料的 scale,這樣比較好看出來相對資料中間部分的趨勢
至於特徵向量那些東西,是建構出主成分分析會用到的
主成分分析的一般形式可以表示成以下圖片中最佳化的問題
此圖片節自我過去的專題的一小部分,有簡要的闡述過程
完整的理論與推導,我是參照 Johnson, Wichern, Applied Multivariate Statistical Analysis 6ed 的第8章之內容
此最佳化問題可以用拉格朗日乘數法來處理,配合一些矩陣微分
解得的結果會很自然地跟特徵向量、特徵值等有直接的關係,這也是應用上主成分分析的來源