评测脚本,具体参考 [MTEB-zh] (https://github.com/wangyuxinwhy/uniem/blob/main/mteb-zh) 数据集选择,选择开源在 HuggingFace 上的 6 种文本分类数据集,包括新闻、电商评论、股票评论、长文本等 评测方式,使用 MTEB 的方式进行评测,报告 Accuracy。
Contribute to lin-qian123/m3e-base development by creating an account on GitHub.
Contribute to DracoUnion/m3e-base-cl development by creating an account on GitHub.
GitHub is where people build software. More than 100 million people use GitHub to discover, fork, and contribute to over 420 million projects.
| 是| 否| 否| 是| https://github.com/CLUEbenchmark/SimCLUE | 是| | Chinese-SQuAD | 新闻| 76,449 | 机器阅读理解 | 问答| 优| junzeng-pluto | 中文机器阅读理解数据集,通过机器翻译加人工校正的方式从原始Squad转换而来 | 是| 否| 否| 是| https://github.com/pluto-junzeng/ChineseSquad ...
notebook链接:https://www.kaggle.com/code/tiansztianszs/moka-ai-m3e-base/notebook首先安装依赖包:!pip install uniem sentence_transformers接着加载数据集并预览:import pandas as pddf = pd.read_json('https://raw.githubusercontent.com/wangyuxinwhy/uniem/
*.h5 filter=lfs diff=lfs merge=lfs -text *.joblib filter=lfs diff=lfs merge=lfs -text *.lfs.* filter=lfs diff=lfs merge=lfs -text *.mlmodel filter=lfs diff=lfs merge=lfs -text *.model filter=lfs diff=lfs merge=lfs -text *.msgpack filter=lfs diff=lfs merge=lfs -text *.npy fi...
Open yanjian1978opened this issueMar 21, 2024· 1 comment Open opened this issueMar 21, 2024· 1 comment yanjian1978commentedMar 21, 2024
评测脚本,具体参考 [MTEB-zh] (https://github.com/wangyuxinwhy/uniem/blob/main/mteb-zh) 数据集选择,选择开源在 HuggingFace 上的 6 种文本分类数据集,包括新闻、电商评论、股票评论、长文本等 评测方式,使用 MTEB 的方式进行评测,报告 Accuracy。
评测脚本,具体参考 [MTEB-zh] (https://github.com/wangyuxinwhy/uniem/blob/main/mteb-zh) 数据集选择,选择开源在 HuggingFace 上的 6 种文本分类数据集,包括新闻、电商评论、股票评论、长文本等 评测方式,使用 MTEB 的方式进行评测,报告 Accuracy。