失效链接处理 |
如何使用 PEFT??LoRAQ?PDF 下蝲
相关截图Q?/strong>
![]() 主要内容Q?/strong>
三、模?加入PEFT{略
3.1 模型加蝲 {略有哪些?
模型加蝲虽然很简单,q里涉及(qing)?/span>2个时间换I间的大模型昑֭压羃技?/strong>Q主要说?/span>load_in_8bit?/span>
prepare_model_for_int8_training?/span>
3.2 模型昑֭占用的部分有哪些Q?/strong>
q里需要介l一?两个模型昑֭占用的部分:(x)
1. 静态显存基本由模型参数量军_Q?/span>
2. 动态显存在向前传播的过E中每个h的每个神l元都会(x)计算Ȁzdƈ存储Q用于向后传播时的梯度计,
q部分和batchsize以及(qing)参数量相关Q?/span>
3.3 模型昑֭占用 优化{略Q?/strong>
模型昑֭占用 有以下两U方式:(x)
1. 8bit量化优化。该方式只要用于优化 静态显存;
2. 梯度查优化。该方式只要用于优化 动态显存;
|