使用BAAI/bge-large-zh模型,在domain数据集上效果已超越openai embedding。 郁闷的是,在domain数据集上finetune后,效果下降了。 使用reRank,可显著提升检索效果,前提还是bge-reranker-large效果比较好。笔者对比,阿里的通用reRank模型,效果比检索还差了。 检索的候选多了,效果上限会提高但ReRank效果可能会下降。 通过...