论文阅读《Relation Extraction as Open-book Examination:Retrieval-enhanced Prompt Tuning》

news/2024/7/8 7:18:42

Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt Tuning

浙大基于prompt的关系抽取最新论文,刷新prompt方法的SOTA。

因为之前对prompt类关系抽取方法已经做了很多介绍,所以现在直接看方法。

BACKGROUND

对于难度较大的实例,PLMs通常不能很好地泛化,并且在训练过程中,由于模型嵌入中稀缺的数据或复杂的实例不容易记忆,导致PLMs在资源极低的环境下运行不稳定。

本文将RE视为一种开卷考试,提出了一种检索增强的半参数关系抽取提示调整范式。我们构建了一个open-book数据存储库,将基于提示的实例表示和对应关系标签作为记忆的键值对用于检索。在推理过程中,该模型通过将PLM的基本输出与数据存储上的非参数最近邻分布线性插值来推断关系。这样,我们的模型不仅可以通过训练时存储在权值中的知识来推断关系,而且可以通过在开卷数据存储中展开和查询示例来辅助决策。

过程示意

METHODOLOGY

用于检索的 Open-book Datastore

Open-book Datastore的构造主要包括基于提示的实例表示数据存储集合

采用[MASK]的隐藏向量作为基于提示的实例表示𝒉𝒄

 𝑷𝑳𝑴最后一层的[MASK] token的输出嵌入可以有效地利用在预训练期间学习到的显式知识。

利用训练集上基于提示的实例表示来构建数据存储

 𝒉𝒄𝒊是上一步计算的上下文嵌入,𝒓𝒊是关系。

检索增强的关系预测

采用欧氏距离计算𝒉𝒙𝒉𝒄𝒊的距离:

在负距离上应用𝒔𝒐𝒇𝒕𝒎𝒂𝒙函数来计算邻居的分布,形成对预定义关系的一个概率分布。

通过插值非参数𝑘最近邻分布𝑷𝒌𝑵𝑵与已经训练好的𝑷𝑳𝑴𝑴𝑳𝑴预测𝑷𝑴使用参数𝝀来生成关系的最终概率来重构𝑷(𝒓|𝒙 

EXPERIMENTS

少次学习


http://www.niftyadmin.cn/n/4411443.html

相关文章

the answer to life, the universe and everything

the answer to life, the universe and everything is "42",or is "6*7?" 之前只是被电影里无限的英式幽默与哲思所吸引,但当看到deep thought面对历经千辛万苦来到它面前的主角们关于终极问题的提问时,爱理不理地说出“我一直都在…

HTML 元素的 ondragenter 事件

ondragenter EventDHTML文档教程Fires on the target element when the user drags the object to a valid drop target.dhtml语法Inline HTML<ELEMENT ondragenter "handler" ... >All platformsEvent propertyobject.ondragenter handlerJScript onlyobjec…

论文阅读《PTR: Prompt Tuning with Rules for Text Classification》

PTR: Prompt Tuning with Rules for Text Classification 提出背景 Prompt-oriented fine-tuning加速收敛&#xff0c;对少次学习很友好 Prompt-tuning收敛变慢&#xff0c;因为参数变少 Prompt痛点 Hard prompt设计麻烦 Auto prompt 效率太低 Soft prompt 需要大模型来…

javascript 操作 cookies

javascript 操作 cookies Cookies&#xff0c;有些人喜欢它们&#xff0c;有些人憎恨它们。但是&#xff0c;很少有人真正知道如何使用它们。现在你可以成为少数人中的成员&#xff0d;可以自傲的Cookie 大师。 如果你象作者一样记性不好&#xff0c;那么你可能根本记不住人们…

论文阅读《Knowledgeable Prompt-tuning: Incorporating Knowledge into Prompt Verbalizer for Text Classific》

Knowledgeable Prompt-tuning: Incorporating Knowledge into Prompt Verbalizer for Text Classification 提出背景 提示学习&#xff08;prompt learning&#xff09;在预训练语言模型的利用中发挥重要作用 以主题分类为例&#xff1a;将输入句子包装到一个自然语言模板中…

基于一个多分类问题比较bert单任务训练和多任务训练

笔者在学习基于huggingface实现多分类问题时&#xff0c;使用了kaggle比赛中的Feedback Prize - Predicting Effective Arguments中的数据集。 Feedback Prize - Predicting Effective Arguments/Dataset 本次比赛的目标是将学生写作中的争论元素分类为“有效”、“充分”或“…

JS Array对象

JS入门之Array对象 每天一对象,今天我们也来new一个。没有系统的学过JS&#xff0c;没有特别的写过一个比较出色的类库&#xff0c;没有运用过一个很强的类库&#xff0c;prototype.js在进行着&#xff0c;慢慢的前进相信不久的将来就可以应用prototype.js来开发自己的应用程序…

C#对动态语言的支持

1&#xff0c;infoq上的一篇文章&#xff0c;好好参考一下。地址&#xff1a;http://www.infoq.com/cn/news/2007/06/java-dlr微软在动态语言支持上超越了Java&#xff1f;作者 Werner Schuster译者 李鑫 发布于 2007年6月30日 下午11时30分 当.NET 在2000/2001年第一次发布…