Transformer中的Decoder到linear然后softmax的细节到底是怎么的?

在机器翻译任务中,利用transformer模型,为了得到下一个词是什么,我有点不懂,麻烦帮助我理解一下。 transformer模型中Decoder…
关注者
10
被浏览
5,876
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

也就是说,decoder阶段,decoder的最底层的输入,每次就只有当前翻译结果的最后一个单词作为输入,对吗?