Re54：读论文 How Context Affects Language Models‘ Factual Predictions

互联网 1 年前 0 7

本文介绍: 论文阅读笔记：How Context Affec ts Langua ge Mod els‘ Fa ctual Predi ctions

诸神缄默不语-个人CSDN博文目录
 诸神缄默不语的论文阅读笔记和分类

论文名称：How Context Affec ts Langua ge Mod els’ Fa ctual Predi ctions

ArXiv网址：https://arxiv.org/abs/2005.04611

2020年AKBC论文，作者来自脸书和UCL。

本文主要关注zero-shot cloze-style question answerin g 任务，使用LM+无监督检索，考察需要检索出什么样的上下文。

用DrQA检索器（TF-IDF检索维基百科）检索的结果，LM在QA上的指标就能和无监督场景相媲美。

open–domain QA的传统做法是retriever+reader（生成回答）

文章 目录

1. 数据集
2. LM
3. baseline
4. 上下文设置
5. 主实验结果

1. 数据集

在这里插入图片描述

2. LM

BERT
RoBERTa（削减了LAMA数据集以使其全部在RoBERTa的词表中）

3. base line

DrQA：TF-IDF检索维基百科→抽取答案
将完形填空格式问题改成QA对："X was born in [Mask]" to "Where was X born?"

4. 上下文设置

在BERT中用不同的seg ment embed d ings区分问题（0）和上下文（1），中间再加个[SEP]
RoBERTa用EOS
后面的实验证明这个操作能提升效果。这可能是因为利用了BERT的NSP任务。

限长512

oracle上下文：Wikip edia snippet

Wikipedia Snippet 是从 Wikipedia 页面上提取的一小段文本，通常用于快速展示相关条目的主要内容或概述。这种摘要可以帮助用户快速了解某个主题的核心信息，无需阅读整个条目。在搜索引擎结果中，Wikipedia Snippet 常常出现，以便用户在点击进入 Wikipedia 网站之前，就能获得关键信息。例如，如果你搜索一个历史人物、科学概念或者任何其他主题，搜索引擎可能会显示来自 Wikipedia 的简短摘要，这就是所谓的 “Snippet”。

相关上下文：检索或生成
对抗上下文：信息不足版（从同关系别的问题的oracle上下文中随机抽取）

5. 主实验结果

在这里插入图片描述

在这里插入图片描述
a：结果token经常不出现在检索上下文中
b：结果token是否出现在上下文中，如何影响模型预测结果。确实影响

每种上下文相比无上下文的改变量，是否加separation的效果对比：
在这里插入图片描述

证明NSP起作用：
不同方案在不同数据集上的NSP率
在这里插入图片描述

LM概率的变化与NSP概率的关系
在这里插入图片描述
↑这个图的纵坐标差别这么大还画成这样，感觉不好。虽然我知道是为了表现趋势相似，但是纵坐标完全不在一个量级上啊！

案例分析：
在这里插入图片描述

原文地址:https://blog.csdn.net/PolarisRisingWar/article/details/134597273

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_3355.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

how 检索论文

相关文章

transformer剪枝论文汇总

transformer剪枝论文汇总

互联网 11 月前 4

2024数学建模美赛F题Reducing Illegal Wildlife Trade原创论文讲解（含完整python代码）

2024数学建模美赛F题Reducing Illegal Wildlife Trade原创论文讲解（含完整python代码）

python 11 月前 4

2024美赛数学建模C题完整论文教学（含十几个处理后数据表格及python代码）

2024美赛数学建模C题完整论文教学（含十几个处理后数据表格及python代码）

python 11 月前 4

【讲座分享】| 复旦大学张奇教授——《自然语言发表论文如何打怪升级？NLP顶会论文发表》

【讲座分享】| 复旦大学张奇教授——《自然语言发表论文如何打怪升级？NLP顶会论文发表》

互联网 11 月前 4

2024年美赛数学建模A题思路模型代码

2024年美赛数学建模A题思路模型代码

互联网 11 月前 3

How to install R in ubuntu 22.04

How to install R in ubuntu 22.04

互联网 11 月前 3

JVM之GC垃圾回收

互联网 11 月前 3

行为型设计模式—中介者模式

互联网 11 月前 4

发表回复取消回复