## 原创 | Attention Modeling for Targeted Sentiment

2017 年 11 月 5 日 黑龙江大学自然语言处理实验室 Guangyao Zhao

## 一、导读

• 如何去建立target实体和它上下文（context）的关系

• 三种不同的Attention模型的对比

• 如何用Pytorch实现该论文

## 二、问题

Targeted Sentiment Analysis是研究target实体的情感极性分类的问题。只根据target实体，我们没有办法判断出target实体的情感极性，所以我们要根据target实体的上下文来判断。那么，第一个要解决的问题就是：如何建立target实体和上下文之间的关系

She began to love [miley ray cyrus]1 since 2013 :)

## 三、注意力机制模型

target表示，的平均值。left_context就是right_context就是

### 1.Vanilla Attention Model (BILSTM-ATT)

α的公式：

β的值是由target和上下文单词共同决定的。从下面公式可以看出，每个词与target相连接，经过一个线性层与tanh激活函数，然后与张量U相乘得到一个标量。公式如下：

### 2.Contextualized Attention Model (BILSTM-ATT-C)

Contextualized Attention Model是在Vanilla Model的基础上衍生的一个模型。这个模型将上下文拆分成两部分，分别为left_contextright_context。然后对left_contextright_context分别做与Vanilla Attention Model一样的操作。即：

## 四、编码

Vanilla Model不用把句子分割成left_contextright_context。因此很容易实现batch_size > 1的设计。主要的层次有embedding层，dropout层，双向lstm层，线性层linear_2。linear_1层和参数u主要是为了计算的。

class Vanilla(nn.Module):        def __init__(self, embedding):
super(Vanilla, self).__init__()
self.embedding = nn.Embedding(embed_num, embed_dim)
self.embedding.weight.data.copy_(embedding)
self.dropout = nn.Dropout(dropout)
self.bilstm = nn.LSTM(embed_dim,hidden_size,dropout)
self.linear_1 = nn.Linear(hidden_size,attention_size,bias=True)
self.u = Parameter(torch.randn(1,attention_size),
self.linear_2 = nn.Linear(hidden_size,label_num,bias=True)       def forward():
pass

BILSTM-ATT-C和BILSTM-ATT-G模型需要把句子分割成left_contextright_context。编程上很难设计出很好的batch_size > 1的方法，因此使用的是batch_size = 1的方法。这两个模型是Vanilla Model的衍生，所以在代码上有所依赖，因此设计了一个Attention Class，作用是为了计算s。这个类是计算图的一部分，输入是context和target，输出是s

class Attention(nn.Module):
def __init__(self):
super(Attention, self).__init__()
self.linear = nn.Linear(input_size * 2, output_size, bias=True)
self.u = Parameter(torch.randn(output_size, 1))    def forward():
pass

BILSTM-ATT-C模型会用到Attention类。
BILSTM-ATT-G模型中的操作，使用softmax函数实现该操作。

# cat z_all, z_l, z_rz_all = torch.cat([z_all, z_l, z_r], 1)# softmaxz_all = F.softmax(z_all)

## 五、实验结果与结论

### 1.数据

Z-Dataset:

T-Dataset:

2.实验结果

Z-Dataset上的实验结果:

Z数据集精确度与宏平均F1值（%）

Z数据集F1值（%）

T-Dataset上的实验结果:

T数据集精确度与宏平均F1值（%）

T数据集F1值（%）

## 六、引用

