当然,你用大模型去做语种识别也行,但实践下来,也不是说很理想(GPT除外,有1说1,用以翻译服务为主去设计Prompt+语言生成模型,如果去专门训练/微调,就能解决源文本多语言混杂的问题(即分词器不依赖源语言的给定),但效果好不好,我也没尝试,暂时不清楚); 顺便聊一句,像百度翻译,如果你不指定待翻译文本的语言,他...
通过整合AI自动评分和人工评估,能够广泛量化翻译水平,便于提升整理的翻译质量。 为了让更多程序员和工程师们能够使用或完善NLLB,Meta开放了所有的评估基准(FLORES-200、NLLB-MD、Toxicity-200)、LID模型和训练代码,以及最终的NLLB-200模型和其小型提炼版本等。 Meta AI已将这些内容开源,就在fariseq仓库里面,感兴趣的...