聊聊我眼中愷明大神MAE的成功之處
科技

聊聊我眼中愷明大神MAE的成功之處

最後實驗下來,BERT在兩個資料集的平均表現比GPT差一點點(橙色):而且BERT因為mask的方式,存在訓練預測不一致的問題,OpenAI嘗試對測試資料隨機mask 5個token,最終ImageNet結果果然上升了一些(紅色)...