哪位大神讲解一下Transformer的Decoder的输入输出都是什么?能解释一下每个部分都是什么? 以翻译为例: 输入:我爱中国 输出: I Love China 因为输入(“我爱中国”)在Encoder中进行了编码,这里我们具体讨论Decoder的操作,也就是如何得到输出(“L Love China”)的过程。 Decoder执行步骤 Time Step 1 初始输入: 起始符< s> + Positional Encoding(位置编码) 中间输入:(我爱中国)Encoder Embedding