语言模型的可接受性判断并不总是对上下文具有鲁棒性

Koustuv Sinha ,Jon Gauthier , Aaron Mueller, Kanishka Misra ,Keren Fuentes ,Roger Levy 以及 Adina Williams
语言模型的有针对性的句法评估询问模型是否对句法上可接受的内容表现出稳定的偏好,而不是最小对不可接受的输入。然而,我们最好的句法评估数据集提供的语言上下文比模型在预训练过程中收到的要少得多。这种不匹配提出了一个重要的问题:模型在不同上下文中的句法判断有多稳健?在...

用户分享观点: