alpaca中文数据集

2025-06-14 01:47:13

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

心理学中文对话数据集-Alpaca_数据集-飞桨AI Studio星河社区

心理学中文对话数据集,Alpaca格式,使用 Deepseek V3 翻译王王ER子其他对话系统 0 5 2025-01-13 详情相关项目评论(0) 创建项目数据集介绍使用Deepseek V3 翻译,翻译开源项目:wangerzi/datasets-translator 源数据集:samhog/psychology-10k 文件列表 Psychology-10K-ZH.json Psychology-10K-ZH.json (4.91M) 下载 Alpaca 格式的中文对话数据集反...
...dataset: Alpaca Chinese Dataset -- 中文指令微调数据集

alpaca-chinese-52k.json analysis.py clean.py contributors.md main.py requirements.txt Alpaca Chinese Dataset 中文指令微调数据集【持续更新】更新记录 [2024/09/27] 对所有的翻译sample进行了质量评测,95%翻译准确,5%翻译不准确,给每一条sample附带了翻译的评分情况。使用时可以看情况过滤。
...carbonz0/alpaca-chinese-dataset: alpaca中文指令微调数据集

alpaca中文指令微调数据集 TODO 每份数据的生成方法待补充清洗关键词及规则待补充格式与原始alpaca数据json格式相同方法数据生成机器翻译 self-instruct 数据清洗样例 [ {"instruction":"根据给定的坐标确定最近的机场。","input":"40.728157, -73.794853","output":"距给定坐标最近的机场是纽约市的拉瓜迪亚机...
2万条中文ChatGPT指令Alpaca数据集_数据集-飞桨AI Studio星河社区

2万条中文ChatGPT指令Alpaca数据集喜爱 1 2万条中文ChatGPT指令Alpaca数据集:shibing624/alpaca-zh 木木洋 3枚 CC0 自然语言处理 0 5 2023-11-23 详情相关项目评论(0) 创建项目文件列表 alpaca_gpt4_data_zh.json alpaca_gpt4_data_zh.json (33.47M) 下载问题...
Alpaca中文指令微调数据集:持续更新的中... 来自爱可可-爱生活...

【Alpaca中文指令微调数据集:持续更新的中文指令微调数据集,支持双语微调和数据修正】'Alpaca Chinese Dataset' GitHub: http://t.cn/A6Tcxz1H #中文数据集# #微调# #双语#
...整理者才是短板。附上alpaca-CoT项目组群体整理的数据集地址:

中文数据质量差是中文的问题么? | 快速扫了一遍 sharegpt,alpaca,med等等数据。作为一个网络人口绝对值很高的语种。严格来说,不是从印刷时代历史积累下来的中文数据质量垃圾,而是搜集清洗整理中文数据的人太拉了。而这一点似乎才是中文科技工作者或者说科级领导不愿意承认的。说到数据质量反而是看到最近准备比赛的一...
...中英文token比例,比alpaca更强的中文数据集WizardLM - 知乎

我一直想翻译一下这个数据集因为这个工作声称在智能调整了alpaca的问题难度之后,可以生成一个更难的问答数据集,并且在这个数据集下,微调得到的语言模型会更强(特别是遇到更难的问题上) 细看了这个数据集之后,我发现里面的指令也确实要更难一些。对这个数据集,我们已经完成了翻译。发布在了silk-road/Wizard-LM-Chi...
alpaca中文指令微调数据集码农集市专业分享IT编程学习资源

alpaca中文指令微调数据集Tr**cy 上传2.72MB 文件格式 zip 数据集每份数据的生成方法待补充清洗关键词及规则待补充格式与原始alpaca数据json格式相同方法数据生成机器翻译 self-instruct 数据清洗样例 [ { "instruction": "根据给定的坐标确定最近的机场。", "input": "40.728157, -73.794853", "output"...
...XuhuiRen/alpaca_chinese_dataset: 人工精调的中文对话数据集

alpaca_chinese_dataset 鲁迅说过:有多少人工,才有多少智能当前的聊天对话模型数据集主要都是由英文构成,但是当前中文聊天模型构建的需求也较为迫切,因此我们将斯坦福的alpaca数据集进行中文翻译,并再制造一些对话数据,并开源提供。此翻译并非完全的chatgpt机翻,会进行人工校验,遇到英文特异性表达的时候会变为较为中文...
...Alpaca Chinese Dataset -- 中文指令微调数据集【人工+GPT4o...

会自动将你的修改更新到alpaca-chinese-52k.json中数据集说明本数据集包括中文和英文的混合数据集,方便双语微调,以及后续做持续的数据修正。原始的Alpaca英文数据集也存在不少的问题,个别的数学类的sample是错的,有少部分output字段需要修正,一些的标签没有对齐等。本数据集会对原始的数据集进行修改和修正。再此...

快搜汉语词典

alpaca中文数据集

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

心理学中文对话数据集-Alpaca_数据集-飞桨AI Studio星河社区

...dataset: Alpaca Chinese Dataset -- 中文指令微调数据集

...carbonz0/alpaca-chinese-dataset: alpaca中文指令微调数据集

2万条中文ChatGPT指令Alpaca数据集_数据集-飞桨AI Studio星河社区

Alpaca中文指令微调数据集:持续更新的中... 来自爱可可-爱生活...

...整理者才是短板。附上alpaca-CoT项目组群体整理的数据集地址:

...中英文token比例,比alpaca更强的中文数据集WizardLM - 知乎

alpaca中文指令微调数据集码农集市专业分享IT编程学习资源

...XuhuiRen/alpaca_chinese_dataset: 人工精调的中文对话数据集

...Alpaca Chinese Dataset -- 中文指令微调数据集【人工+GPT4o...

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

快搜汉语词典

alpaca中文数据集

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

心理学中文对话数据集-Alpaca_数据集-飞桨AI Studio星河社区

...dataset: Alpaca Chinese Dataset -- 中文指令微调数据集

...carbonz0/alpaca-chinese-dataset: alpaca中文指令微调数据集

2万条中文ChatGPT指令Alpaca数据集_数据集-飞桨AI Studio星河社区

Alpaca中文指令微调数据集:持续更新的中... 来自爱可可-爱生活...

...整理者才是短板。附上alpaca-CoT项目组群体整理的数据集地址:

...中英文token比例,比alpaca更强的中文数据集WizardLM - 知乎

alpaca中文指令微调数据集 码农集市专业分享IT编程学习资源

...XuhuiRen/alpaca_chinese_dataset: 人工精调的中文对话数据集

...Alpaca Chinese Dataset -- 中文指令微调数据集【人工+GPT4o...

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

alpaca中文指令微调数据集码农集市专业分享IT编程学习资源