通过定向刺激提示引导大型语言模型

Zekun Li,Baolin Peng,Pengcheng He,Michel Galley,Jianfeng Gao,Xifeng Yan
我们引入了一种新的框架,即方向激励求助,该框架使用调谐语言模型(LM)为下流任务提供指导。与以前的工作不同,我们训练了一个政策LM来生成每个输入的隐式标记作为目标输入的指示或提示。然后将其与原始输入相结合并将其注释到LM,以引导其生成。这种方法可以从(1)监督学习;(2)从...

用户分享观点: