訓練模型就似煮餸:有時煮極都冇味(唔識抓重點)=偏差高;有時又落鹽落到咸死人,每鑊味道都唔同(捉唔到穩定火候)=變異高。如果唔先搞清楚自己係邊種問題,隨時愈調愈離譜。
喺下面嘅互動區域中,你可以調整模型複雜度同埋噪音水平,觀察點樣影響偏差同變異。
--
--
當模型複雜度增加,偏差下降但變異上升。要搵一個平衡點,先至可以得到最低嘅總誤差。
偏差高 = 煮極都冇味,唔識抓重點
變異高 = 每鑊味道都唔同,捉唔到穩定火候
完美平衡 = 識得調火候,煮出穩定又好味嘅菜式
偏差高即係模型太簡單,學唔到資料入面嘅規律。好似攞直尺描山路,點描都唔貼。
特徵:訓練誤差同驗證誤差都高 → 欠擬合。
變異高即係模型太複雜,連雜聲都背埋。考試轉少少字眼就唔識答----過擬合。
特徵:訓練誤差好低,驗證誤差高好多。
情況 | Train Error | Val Error | 結論 |
---|---|---|---|
欠擬合 | 高 | 高 | 偏差問題 |
過擬合 | 低 | 高 | 變異問題 |
兩邊都高 | 高 | 高 | 數據/模型設計有事 |
兩邊都低 | 低 | 低 | OK,可上線 |
‣ 偏差高:淨睇片長度 → 準確率低。
‣ 解法:加演員、導演、協同過濾。
‣ 變異高:節日大額刷卡全當詐騙。
‣ 解法:拉歷史數據三年,加「節假日」特徵。
‣ 偏差高:淨睇車流量,忽略行人 → 尖峰期照塞。
‣ 解法:加行人感測器,時間窗 CNN 重新訓練。