可以看出,SoulChat模型在大多数指标上都表现得比其他模型更好。例如,在B-1至B-4、ROUGE和Conversation指标中,SoulChat模型的数值都比其他模型更高,说明其生成的回复与标准回复更相似和更优质。在Helpfulness和Safety指标中,各个模型的表现相对一致。 Conclusion and Future Work 这篇文章的结论部分总结了作者的研究工作...