虚假新闻检测(MAC)《Hierarchical Multi-head Attentive Network for Evidence-aware Fake News Detection》

论文信息

论文标题:Hierarchical Multi-head Attentive Network for Evidence-aware Fake News Detection
论文作者:Nguyen Vo, Kyumin Lee
论文来源:2021 EACL
论文地址:download 
论文代码:download

1 Introduction

  现有的基于证据的虚假新闻检测要么关注与词级注意力,要么关注于证据级的注意力,这将导致一个次优的结果。本文提出了一个联合结合了多头词级注意和多头文档级注意,这有助于词级和证据级的解释。

  贡献:

    • 提出了一种新的层次多头注意网络,将词注意和证据注意联合用于证据感知假新闻检测;
    • 提出了一种新的多头注意机制来捕捉重要的单词和证据;

2 Problem Statement

  We denote an evidence-based fact-checking dataset  $\mathcal{C}$  as a collection of tuples  $(c, s, \mathcal{D}, \mathcal{P})$  where  $c$  is a textual claim originated from a speaker  $s$, $\mathcal{D}=   \left\{d_{i}\right\}_{i=1}^{k}$  is a collection of  $k$  documents  relevant to the claim  $c$  and  $\mathcal{P}=\left\{p_{i}\right\}_{i=1}^{k}$  is the corresponding publishers of documents in  $\mathcal{D}$ . Note,  $|\mathcal{D}|=|\mathcal{P}|$ . Our goal is to classify each tuple  $(c, s, \mathcal{D}, \mathcal{P})$  into a pre-defined class (i.e. true news/fake news).

3 Framework

框架:

  

  (1) embedding layer, (2)multi-head word attention layer, (3) multi-head document attention layer and (4) output layer.

3.1 Embedding Layer

  Each claim  $c$  is modeled as a sequence of  $n$  words  $\left[w_{1}^{c}, w_{2}^{c}, \ldots, w_{n}^{c}\right]$  and  $d_{i}$  is viewed as another sequence of  $m$  words  $\left[w_{1}^{d}, w_{2}^{d}, \ldots, w_{m}^{d}\right]$ . Each word  $w_{i}^{c}$  and  $w_{j}^{d}$  will be projected into D-dimensional vectors  $\mathbf{e}_{i}^{c}$  and  $\mathbf{e}_{j}^{d}$  respectively by an embedding matrix  $\mathbf{W}_{e} \in \mathbb{R}^{V \times D}$  where  $V$  is the vocabulary size. Each speaker  $s$  and publisher  $p_{i}$  modeled as one-hot vectors are transformed into dense vectors  $\mathbf{s} \in \mathbb{R}^{D_{1}}$  and  $\mathbf{p}_{i} \in \mathbb{R}^{D_{2}}$  respectively by using two matrices  $\mathbf{W}_{s} \in \mathbb{R}^{S \times D_{1}}$  and  $\mathbf{W}_{p} \in \mathbb{R}^{P \times D_{2}}$ , where  $S$  and  $P$  are the number of speakers and publishers in a training set respectively. Both  $\mathbf{W}_{s}$  and  $\mathbf{W}_{p}$  are uniformly initialized in  $[-0.2,0.2]$ . Note that, both matrices  $\mathbf{W}_{s}$  and  $\mathbf{W}_{p}$  are jointly learned with other parameters of our MAC.

3.2 Multi-head Word Attention Layer

  将 claim 的词嵌入 $\mathbf{e}_{i}^{c}$ 送入 BiLSTM,生成文本表示 $\mathbf{h}_{i}^{c}=\left[\overleftarrow{\mathbf{h}_{i}} ; \overrightarrow{\mathbf{h}_{i}}\right] \in \mathbb{R}^{2 H}$,将生成的文本表示做平均池化 :

    $\mathbf{c}=\frac{1}{n} \sum\limits _{i=1}^{n} \mathbf{h}_{i}^{c} \quad\quad(1)$

  对 Evidence 使用 BiLSTM,得到 $\mathbf{h}_{j}^{d} \in \mathbb{R}^{2 H}$,将其词嵌入表示为 矩阵形式 $\mathbf{H}=\left[\mathbf{h}_{1}^{d} \oplus \mathbf{h}_{2}^{d} \oplus \ldots \oplus \mathbf{h}_{m}^{d}\right] \in \mathbb{R}^{m \times 2 H}$。

  为了理解文档中的信息帮助我们对 Claim 进行事实核查,我们需要指导我们的模型关注文档中的关键字或短语。我们首先复制向量 $c $ ($Eq.1$) $m$ 次创建矩阵 $\mathbf{C}_{1} \in \mathbb{R}^{m \times 2 H}$,并提出一种注意机制,具体如下:

    $\mathbf{a}_{1}=\operatorname{softmax}\left(\tanh \left(\left[\mathbf{H} ; \mathbf{C}_{1}\right] \cdot \mathbf{W}_{1}\right) \cdot \mathbf{w}_{2}\right)\quad\quad(2)$

  其中,$\mathbf{w}_{2} \in \mathbb{R}^{a_{1}}$,$\mathbf{W}_{1} \in \mathbb{R}^{4 H \times a_{1}}$,$\mathbf{a}_{1} \in \mathbb{R}^{m}$ 是在 $m$ 个单词上的注意力分布。

  然而,文档的总体语义可能由文档的多个部分生成。因此,我们提出一个多头词注意机制,通过将向量 $w_2$ 扩展到矩阵 $\mathbf{W}_{2} \in \mathbb{R}^{a_{1} \times h_{1}}$ 来捕获不同的语义贡献,其中 $h_1$ 为 Figure 1 所示的注意头数。修改 $\text{Eq.2}$ 具体内容如下:

    $\mathbf{A}_{1}=\operatorname{softmax}_{c o l}\left(\tanh \left(\left[\mathbf{H} ; \mathbf{C}_{1}\right] \cdot \mathbf{W}_{1}\right) \cdot \mathbf{W}_{2}\right)\quad\quad(3)$

  其中,$\mathbf{A}_{1} \in \mathbb{R}^{m \times h_{1}}$,$\mathbf{A}_{1}$ 代表在文档 $d_i$ 中的 $m$ 个单词之上的 $h_1$ 不同的注意力分布,帮助我们捕获文档的不同方面。

  在计算了 $\mathbf{A}_{1}$ 后 ,我们推导出文档 $d_i$ 的表示方式如下:

    $\mathbf{d}_{i}=\operatorname{flatten}\left(\mathbf{A}_{1}^{T} \cdot \mathbf{H}\right)\quad\quad(4)$

  其中,$\mathbf{d}_{i} \in \mathbb{R}^{h_{1} 2 H}$。

3.3 Multi-head Document Attention Layer

Extending representations of claims

  spearker 有的时候非常重要,因此将其考虑入 claim :

    $\mathbf{c}^{e x t}=[\mathbf{c} ; \mathbf{s}] \in \mathbb{R}^{x}  \quad\quad(5)$

  其中,$x = 2 H+D_{1}$。

Extending representations of evidence

  同样 publisher 对于 Evidence 的真实性也有很大的帮助,所以:

    $\mathbf{d}_{i}^{e x t}=\left[\mathbf{d}_{i} ; \mathbf{p}_{i}\right] \in \mathbb{R}^{y} \quad\quad(6)$

  其中,$y= 2 h_{1} H+D_{2}$。

  从 $\text{Eq.6}$ 开始,我们可以生成 $k$ 个相关文章的表示,并堆栈,如 $\text{Eq.7}$ 所示:

    $\mathbf{D}=\left[\mathbf{d}_{1}^{e x t} \oplus \ldots \oplus \mathbf{d}_{k}^{e x t}\right] \in \mathbb{R}^{k \times y}\quad\quad(7)$

3.4 Multi-head Document Attention Mechanism

  即使选择了 $k$ 个最相关的文章来判别 claim $c$ 的真实性,但是实际上往往只有个别几篇文章被用于判断 claim $c$ 的真实性,所以本文再一次使用注意力机制来选择合适的 documnet。

  首先通过将 $\mathbf{c}^{e x t}$ 复制 $k$ 次,得到 $\mathbf{C}_{2} \in \mathbb{R}^{k \times x}$,然后将其与 $D$ ($\text{Eq.7}$) 拼接得到 $\left[\mathbf{D} ; \mathbf{C}_{2}\right] \in \mathbb{R}^{k \times(x+y)}$。

  我们提出的多头文档级注意机制应用了 $h_2$ 个不同的注意头,如 $\text{Eq.8}$ 所示:

    $\mathbf{A}_{2}=\operatorname{softmax}_{c o l}\left(\tanh \left(\left[\mathbf{D} ; \mathbf{C}_{2}\right] \cdot \mathbf{W}_{3}\right) \cdot \mathbf{W}_{4}\right)$

  其中,$\mathbf{W}_{3} \in \mathbb{R}^{(x+y) \times a_{2}}$、$\mathbf{W}_{4} \in \mathbb{R}^{a_{2} \times h_{2}}$、$\mathbf{A}_{2} \in \mathbb{R}^{k \times h_{2}}$ 。

  使用注意权重,我们可以生成  $k$ 个证据的参与表示,表示为 $\mathbf{d}^{r i c h} \in \mathbb{R}^{h_{2} y}$,如 $\text{Eq.9}$ 所示:

    $\mathbf{d}^{\text {rich }}=\operatorname{flatten}\left(\mathbf{A}_{2}^{T} \cdot \mathbf{D}\right)\quad\quad(9)$

3.5 Output Layer

  将 $ \left[\mathbf{c}^{e x t} ; \mathbf{d}^{\text {rich }}\right]$ 作为 MLP 的输入,计算 claim 真实性的概率:

    $\hat{y}=\sigma\left(\mathbf{W}_{6} \cdot\left(\mathbf{W}_{5} \cdot\left[\mathbf{c}^{\text {ext }} ; \mathbf{d}^{\text {rich }}\right]+\mathbf{b}_{5}\right)+\mathbf{b}_{6}\right)\quad\quad(10)$

  采用交叉熵优化模型:

    $\mathcal{L}_{\theta}(y, \hat{y})=-(y \log \hat{y}+(1-y) \log (1-\hat{y}))\quad\quad(11)$

4 Experiment

Datasets

  

  Note:Each Snopes claim was labeled as true or false while in Politifact, there were originally six labels: true, mostly true, half true, false, mostly false, pants on fire. Following (Popat et al., 2018), we merge true, mostly true and half true into true claims and the rest are into false claims.

Baselines

  Using only claims’ text:

    • BERT
    • LSTM-Last
    • LSTM-Avg
    • CNN

  Using both claims’ text and articles’ text

    • DeClare
    • HAN
    • NSMN

Performance of MAC and baselines

  

  

0 条评论
请不要发布违法违规有害信息,如发现请及时举报或反馈
还没有人评论呢,速度抢占沙发!
相关文章
  • 本文基于此: Flutter中文网 一、安装和运行Flutter的系统环境要求 想要安装并运行 Flutter,你的开发环境需要最低满足以下要求: 操作系统:macOS 磁盘空间:2.8 GB(不...

  • 一、背景 Istio 项目由 Google 和 IBM 的团队与 Lyft 的 Envoy 团队合作启动。它已经完全在 GitHub 上公开开发。目前已经是“Service Mesh服务网格”的实际领...

  • APPERK 软件信息 软件名称 ParallelsDesktop 版本号 18.1.1 软件类型 官网版 + 商业版 安装包大小 390MB 语言 中文 系统支持 mac...

  • 作为程序员,markdown是非常好用的文本编辑语言,而Typora是非常好用的一款markdown编辑工具。Typora提供读者和作家的无缝体验。它删除了预览窗口,模式切换器,降低源代码的语法符号以...

  • 为了调试我们的OpenGL Demo,可以尝试使用一个成熟的开源GUI插件imgui。 1,首先进入imgui在github上的地址。 在Release中下载最近的版本,可以得到一个Zip压缩包。 现...

  • Hi,欢迎大家在有空的时候做客【江涛学编程】,这里是2023年的第7篇原创文章,今天我们来聊一聊如何在mac电脑上配置命令行工具 老规矩,拍拍手👏,上菜。 同学,打开你的mac电脑,按住键盘上的“c...

  • MacOS远程windows 10操作系统背景众所周知,macOS的内存和运行空间非常昂贵,如果为了娱乐而在mac上堆很多性能会很没必要。本着勤俭节约的美好品德,就用想着之前的旧电脑来作为娱乐工具,在...

  • 亲测有效! Studio One 6 V6.0.1 音乐编曲工具  含win/mac版 记录、生产、混合、掌握和执行所有操作。从工作室到舞台,Studio One6以易用为核心,是您的创意合作伙伴。当...

  • carbon copy cloner 6 for Mac是一款支持数据同步和备份的磁盘克隆备份工具,Carbon Copy Cloner软件设计的初衷就是智能到让人忘记它的存在。界面简单、易于配置,但...

  • 下载 Flutter SDK flutter官网下载:https://flutter.io/sdk-archive/#macos 若上述链接无法访问,可通过GitHub下载 https://gith...

  • 最近给家里电脑重装系统,都重新安装了 nvm,就记录了一下,也方便大家避坑简介nvm 是什么?和 npm 是什么关系?npm:是 nodejs 包的管理工具,在安装 node 的时候,npm 也会自动...

  • 概述 使用 mac 的同学应该经常会使用 alfred 这个软件, 主要能随时能够通过一个快键键打开查询窗口, 方便的搜索或打开软件, 文件等等, 同时也可以集成脚本方便实现其它的功能. 在日常使用的...

  • 前言在维护 Jenkins Slave Node(这里指 macOS 构建机)的过程,不可避免地是你会遇到一些文件访问权限和进程常驻的问题。所以,如果要解决这些问题,就要求你了解 Linux 文件访问...

  • 解决MacOS13 Ventura 经常性的出现xxx软件不可用的问题 前提 型号:Macbook pro 14 (M1 pro) 问题:在更新MacOS13 Ventura系统经常会出现软件不可用...

  • 前言 Downie是Mac下一个简单的下载管理器,可以让您快速将不同的视频网站上的视频下载并保存到电脑磁盘里然后使用您的默认媒体播放器观看它们。 ![在这里插入图片描述](https://p3-jue...

  • 架构 在DK uwb测距服务中,测距设备角色基于那个设备开启了车距流程,并且对设置测距交换负责。 1、一个通过发送第一个uwb poll包,开启uwb测距包交换的实体,叫做initiator。在dke...

  • 在安装Mac电脑应用程序的时候,经常会遇到“xxx.app已损坏,打不开。您应该将它移到废纸篓“或”打不开的xxx.app,因为它来自身份不明的开发者”,如图: 遇到上述情况是不是真的要移动到...

  • 1. 什么是XAMPP XAMPP(Apache+MySQL+PHP+PERL) 2. XAMPP下载安装 XAMPP下载地址: apachefriends 双击下载打开的xxx.dmg,继续点击图标...

  • Emby for Mac(多媒体影音库)将您所有的个人媒体集中到一个地方从未如此简单!emby mac将您的个人视频,音乐和照片组合在一起,并将它们流式传输到您的设备。 Emby for Mac(多媒...

  • 背景 电脑的安全是非常重要的,特别是里面的敏感数据,若是被有心之人利用,那后果不堪设想。 所以我们部门定下了一个规矩,谁离开工位要是不锁屏,就可以在部门群发送一个消息:我请大家吃鸡翅。 oh,技术出身...