SimCSE在常见中文数据集上的测试,包含ATEC、BQ、LCQMC、PAWSX、STS-B共5个任务。 介绍 博客:https://kexue.fm/archives/8348 论文:《SimCSE: Simple Contrastive Learning of Sentence Embeddings》 官方:https://github.com/princeton-nlp/SimCSE 文件 - utils.py 工具函数 - eval.py 评测主文件 评测 命令格...
SimCSE-Chinese-Pytorch SimCSE在中文上的复现,无监督 + 有监督 最近看了SimCSE这篇论文,便对论文做了pytorch版的复现和评测 论文:https://arxiv.org/pdf/2104.08821.pdf 官方:https://github.com/princeton-nlp/SimCSE 2. 文件 >datasets 数据集文件夹>cnsd-snli>STS-B>pretrained_model 各种预训练模型文件夹>...
SimCSE(SimCSE: Similarity-based Contrastive Learning of Sentence Embeddings)是一种用于学习句子嵌入的模型,它通过最大化同一句子的相似性和最小化不同句子的相似性来进行对比学习。该模型的核心思想是通过相似性比较,使得相似的句子在嵌入空间中更加接近,从而提高句子的语义表示能力。SimCSE采用的是自监督学习的方式,...
MIT license SimCSE-Chinese-Pytorch SimCSE在中文上的复现,无监督 + 有监督 1. 背景 最近看了SimCSE这篇论文,便对论文做了pytorch版的复现和评测 论文:https://arxiv.org/pdf/2104.08821.pdf 官方:https://github.com/princeton-nlp/SimCSE 2. 文件 >datasets 数据集文件夹>cnsd-snli>STS-B>pretrained_model ...