alpaca_data_zh_51k_512这52K数据所对应的alpaca_data.json文件是一个字典列表,每个字典包含以下字段: 链接:https://pan.baidu.com/s/1kjVNjJbNjd7IVVqlT1Ud-w?pwd=kwgq提取码: kwgq 3.2、数据集介绍 Stanford Alpaca数据集格式如下: [ {"instruction" : ..., "input" : ..., "output" : ...}...
data alpaca_data_zh_51k.json 20 changes: 15 additions & 5 deletions20README.md Original file line numberDiff line numberDiff line change Expand Up@@ -57,10 +57,12 @@ Facebook官方发布的[LLaMA模型禁止商用](https://github.com/facebookrese ...
alpaca_zh_51k使用gpt-3.5翻译的Alpaca数据51K stem_zh_instruction使用gpt-3.5爬取的STEM数据,包含物理、化学、医学、生物学、地球科学256K ruozhiba_gpt4使用GPT-4o和GPT-4T获取的ruozhiba问答数据2449 请在提交Issue前务必先查看FAQ中是否已存在解决方案。具体问题和解答请参考本项目📖GitHub Wiki ...
在词表扩充时产出chinese_tokenizer_path=./scripts/merge_tokenizer/merged_tokenizer_hf# 预训练数据目录,会寻找该目录下的所有 .txt 格式文件dataset_dir=./data# 存放数据缓存文件的目录data_cache_dir=./data_cache
达奇AI论文写作平台,在校学生、职场精英都在用的AI论文辅助写作平台 《GPT 提示词大全》基础版(五) Ollama 安装指南:解决国内下载慢和安装卡住问题 Python Hash函数的使用详解 千集助理微信小程序评分在哪,如何评分 解决Pytorch 分布式并行DDP卡死挂起的问题 nginx代理服务地址时添加帐号密码认证 解决传统医学大模型难以...
alpaca_zh_51k 使用gpt-3.5翻译的Alpaca数据 51K stem_zh_instruction 使用gpt-3.5爬取的STEM数据,包含物理、化学、医学、生物学、地球科学 256K ruozhiba_gpt4 使用GPT-4o和GPT-4T获取的ruozhiba问答数据 2449 常见问题 请在提交Issue前务必先查看FAQ中是否已存在解决方案。具体问题和解答请参考本项目 📖GitHu...
Chinese-LLaMA-Alpaca alpaca_data_zh_51k ymcui(讯飞) 51k CN MT SI general instruct text-davinci-003 Luotuo-Chinese-LLM 骆驼 trans_chinese_alpaca_data LC1332(商汤) 52k CN MT SI general instruct text-davinci-003 Natural Instructions Allen AI 61 task|1.5k task Allen AI 5040134 ML MT COL ...
alpaca_zh_51k使用gpt-3.5翻译的Alpaca数据51K stem_zh_instruction使用gpt-3.5爬取的STEM数据,包含物理、化学、医学、生物学、地球科学256K ruozhiba_gpt4使用GPT-4o和GPT-4T获取的ruozhiba问答数据2449 请在提交Issue前务必先查看FAQ中是否已存在解决方案。具体问题和解答请参考本项目📖GitHub Wiki ...
alpaca_zh_51k 使用gpt-3.5翻译的Alpaca数据 51K stem_zh_instruction 使用gpt-3.5爬取的STEM数据,包含物理、化学、医学、生物学、地球科学 256K ruozhiba_gpt4_turbo 使用gpt-4-turbo-2024-04-09获取的ruozhiba问答数据 2449 常见问题 请在提交Issue前务必先查看FAQ中是否已存在解决方案。具体问题和解答请参考...
alpaca_zh_51k使用gpt-3.5翻译的Alpaca数据51K stem_zh_instruction使用gpt-3.5爬取的STEM数据,包含物理、化学、医学、生物学、地球科学256K ruozhiba_gpt4使用GPT-4o和GPT-4T获取的ruozhiba问答数据2449 常见问题 请在提交Issue前务必先查看FAQ中是否已存在解决方案。具体问题和解答请参考本项目📖GitHub Wiki ...