挤公交忘穿内裤被挺进,國產日韓亞洲精品AV,午夜漫画,china中国gary廖男男

李宏毅機器學習hw3 Boss baseline(2023)

本文討論的是一個圖像識別分類問題,主要介紹了在學習過程中遇到的基線代碼和最終實現的高分策略。首先,我們引入的是基于圖像識別的機器學習項目,具體信息可參閱2023年ML課程網站(ntu.edu.tw)及提供的基線代碼(google.com)。

通過運行基線代碼,我們觀察到了不同層次的基線實現。初始的簡單基線(0.63733)在理解問題的基礎上進行簡單的模型構建。接著,中等基線(0.70000)引入了圖像數據增強,這一策略在識別性能上有顯著提升。具體而言,未進行數據增強的訓練準確性圖表明,圖像數據增強是提高模型表現的關鍵因素。

進一步,優化策略中包含了一個有趣的技巧:通過調整DataLoader的并發數量(Train用4~8個并發,persistent_workers=True,Test用2個并發),可以將訓練時間顯著縮短至9秒一輪,同時CPU核的使用率達到滿載,支持多個訓練任務并行執行,從而加快了實驗進程。

在更高層次的基線(0.81400)中,采用了更復雜的策略,如使用預定義的CNN模型(如resnet)并加入dropout、增加訓練輪數、提高數據變換復雜度等。在深度學習實踐中,這些策略有助于模型的泛化能力。值得注意的是,雖然使用res50模型在一段時間內效果良好,但隨著訓練輪數的增加,模型的增益速度減緩,考慮到時間成本,最終選擇在500次epoch后停止訓練。

總結而言,有效的策略包括但不限于:

1. 在全連接層加入dropout(0.5)并加深一層(0.75-->0.77)。

2. 增加訓練輪數(0.77-->0.82)。

3. 提高數據變換復雜度(0.77-->0.82)。

4. 在網格訓練過程中,從200個epoch左右開始達到0.805,至300個epoch時達到0.82的最優結果。

5. 使用預定義的CNN模型,結合dropout和更深的網絡結構。

6. 加大訓練量,以實現更好的泛化能力(0.82-->0.82)。

在進一步的數據增強中,通過增加圖像增強的復雜度和引入BatchNormalization層,模型的性能得到了提升,最終達到0.844的準確率。經過Adam優化器的訓練,模型性能達到了0.828,使用SGD優化器的性能雖稍遜,但在特定調整下,依然有提升空間。

在集成學習(ensemble)策略上,通過選擇多個模型進行組合,最終的boss baseline(0.87400)成績得以實現。策略包括使用不同的網格結構、合并數據集、調整學習率衰減策略、引入歸一化、使用測試時增強(TTA)等。在測試時應用增強方法作為數據增強策略,通過結合多個結果的眾數,模型的性能得以進一步優化。

總結的幾個關鍵點包括并發加載、數據復雜性與訓練輪數的關系、trick在模型優化中的應用、ensemble策略的優缺點,以及在驗證集不足時直接合并到訓練集的策略。整體而言,本文通過逐步優化基線模型,最終達到了較高準確率的boss baseline,雖然過程復雜且時間成本較高,但通過合理的策略調整,有效提升了模型性能。

本文的代碼和相關文件已開源,具體路徑請參考百度網盤鏈接(pan.baidu.com/s/1kDSS9p... 提取碼:ncm3),或直接運行ensemble.py模塊集成最終結果。訓練.py、ensemble.py和TTA.py三個模塊的結構基本遵循原代碼框架,可調整路徑以適應不同的訓練需求。

主站蜘蛛池模板: 凤冈县| 大安市| 衡阳县| 同德县| 新营市| 正阳县| 怀安县| 福海县| 洛阳市| 镇远县| 松江区| 卢湾区| 济源市| 若羌县| 桐城市| 榆林市| 阳信县| 安西县| 德保县| 安国市| 太和县| 南漳县| 海宁市| 读书| 普安县| 阳江市| 长顺县| 玛沁县| 来凤县| 大石桥市| 永年县| 安多县| 阜南县| 安新县| 壤塘县| 广水市| 泰顺县| 沾益县| 浮梁县| 墨竹工卡县| 长岛县|