NEFTune,SFT训练阶段给Embedding加噪音
仿照CV里,数据增强的思路(给图像做旋转、反转、改变亮度等);NLP里,SFT训练数据较少时,也可往embedding上加噪音,来增加训练数据的丰富程度。进而提升最终训练效果。
前提假设:Embedding向量,其附近的向量,是语义相似的。
效果:
能提升10%左右。
实现:
仿照CV里,数据增强的思路(给图像做旋转、反转、改变亮度等);NLP里,SFT训练数据较少时,也可往embedding上加噪音,来增加训练数据的丰富程度。进而提升最终训练效果。
前提假设:Embedding向量,其附近的向量,是语义相似的。
效果:
能提升10%左右。
实现: