李宏毅機器學習hw3 Boss baseline的實現策略和關鍵點如下:
基線實現層次:
初始簡單基線:準確率為0.63733,基于理解問題后的簡單模型構建。
中等基線:準確率為0.70000,引入了圖像數據增強策略,顯著提升識別性能。
訓練優化策略:
調整DataLoader并發數量:Train用4~8個并發,persistent_workers=True,Test用2個并發,顯著縮短訓練時間至9秒一輪,同時滿載CPU核,支持并行訓練。
更高層次基線策略:采用復雜策略,如使用預定義CNN模型、加入dropout、增加訓練輪數、提高數據變換復雜度等,提升模型泛化能力。
關鍵優化技巧:
在全連接層加入dropout并加深一層:從0.75提升至0.77。
增加訓練輪數:從0.77提升至0.82。
提高數據變換復雜度:從0.77提升至0.82。
使用預定義的CNN模型,結合dropout和更深網絡結構。
數據增強與模型性能:
增加圖像增強復雜度:引入BatchNormalization層,提升模型性能至0.844。
優化器選擇:Adam優化器訓練模型性能達到0.828,SGD優化器雖稍遜但仍有提升空間。
集成學習策略:
選擇多個模型組合:使用不同網格結構、合并數據集、調整學習率衰減策略、引入歸一化、使用測試時增強等,實現boss baseline準確率0.87400。
測試時增強方法:作為數據增強策略,結合多個結果的眾數,進一步優化模型性能。
總結關鍵點:
并發加載:提升訓練效率。
數據復雜性與訓練輪數:合理調整以提升模型性能。
模型優化中的trick:如dropout、加深網絡結構等。
ensemble策略:優缺點并存,但能有效提升模型準確率。
驗證集不足時策略:直接合并到訓練集。
通過逐步優化基線模型,結合合理的策略調整,最終實現了較高準確率的boss baseline。