本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验...
小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语 文章。 题目描述 这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用 对应的中文含义来替换。对于每个英文单词,软件会先在内存中查找这 个单词的中文含义,如果内存中有,软件就会用它进行翻译;如果内存 中没有,软件就会在外存中的词典内...
机器翻译与自动文摘任务最后生成的目标内容是自然语言描述语句,因此只要是这样的输出结果(即自然语言描述语句)的任务,都可以使用这些评测指标,主要包含四种:BLEU, ROUGE,METEOR,CIDEr。 BLEU 是一种流行的机器翻译评价指标。一种基于精确度的相似性度量方法, 用于分析候选译文和参考译文中 元组共同出现的程度, 由IBM于2...
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。