本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验...
机器翻译中的损失函数 机器翻译常见错误类型,#include<bits/stdc++.h>usingnamespacestd;inta[2000];intmain(){//freopen("translate.in","r",stdin);//freopen("translate.out","w",stdout);ios::sync_with_stdio(false);in
机器翻译与自动文摘任务最后生成的目标内容是自然语言描述语句,因此只要是这样的输出结果(即自然语言描述语句)的任务,都可以使用这些评测指标,主要包含四种:BLEU, ROUGE,METEOR,CIDEr。 BLEU 是一种流行的机器翻译评价指标。一种基于精确度的相似性度量方法, 用于分析候选译文和参考译文中 元组共同出现的程度, 由IBM于2...
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。
本文提出了一个新的损失函数,混合交叉熵损失(Mixed CE),用于替代在机器翻译的两种训练方式(Teacher Forcing和 Scheduled Sampling)里常用的交叉熵损失函数(CE)。 Mixed CE实现简单,计算开销基本和标准的CE持平,并且在多个翻译数据的多种测试集上表现优于CE。这篇文章我们简要介绍Mixed CE的背景和一些主要的实验结果。