科技CV之後,純MLP架構又來搞NLP了,效能媲美預訓練大模型架構研究該研究對 pNLP-Mixer 模型進行了廣泛的架構探索,以確定不同超引數對下游效能的影響,研究範圍包括投影超引數和 MLP-Mixer 超引數...日期:2022-02-15TAG: MixerMLP投影模型pNLP