失效链接处理 |
适配器微调(Adapter-tuningQ篇 PDF 下蝲
相关截图Q?/strong>
![]() 主要内容Q?/strong>
一、ؓ什?需?适配器微调(Adapter-tuningQ?
1. 预训l模型参数量变多Q在特定d下进?/span>全量微调x贵又耗时Q?/span>
二、适配器微调(Adapter-tuningQ思\Q?/strong>
• 设计?/span>Adapterl构Q首先是一?/span>down-project层将高维度特征映到低维特征Q然后过一个非UŞ层之后,
再用一?/span>up-projectl构低l特征映回原来的高l特征;同时也设计了skip-connectionl构Q确保了在最
差的情况下能够退化ؓidentityQ,q将其嵌?/span>Transformer的结构里面;
• 在训l时Q固定住原来预训l模型的参数不变Q只Ҏ(gu)增的Adapterl构q行微调。同时ؓ了保证训l的高效
性(也就是尽可能的引入更多参数Q?/span>
三?适配器微调(Adapter-tuningQ特Ҏ(gu)什么?
• 特点Q?/span>
• 通过?/span>Transformer层中嵌入Adapterl构Q在推理时会额外增加推理旉?/span>
四?/strong>AdapterFusion 思\ 是什么?
|