output_dir=output_dir validation_file=/root/autodl-tmp/autoDL_20240302/autoDL/Chinese-LLaMA-Alpaca-2-4.1/scripts/training/mydata/val/alpaca_data_val.json deepspeed_config_file=ds_zero2_no_offload.json torchrun --nnodes 1 --nproc_per_node 1 run_clm_sft_with_peft.py \ --deepspeed ${deeps...
data alpaca_data_zh_51k.json 20 changes: 15 additions & 5 deletions20README.md Original file line numberDiff line numberDiff line change Expand Up@@ -57,10 +57,12 @@ Facebook官方发布的[LLaMA模型禁止商用](https://github.com/facebookrese ...
在词表扩充时产出chinese_tokenizer_path=./scripts/merge_tokenizer/merged_tokenizer_hf# 预训练数据目录,会寻找该目录下的所有 .txt 格式文件dataset_dir=./data# 存放数据缓存文件的目录data_cache_dir=./data_cache
Chinese-LLaMA-Alpaca alpaca_data_zh_51k ymcui(讯飞) 51k CN MT SI general instruct text-davinci-003 Luotuo-Chinese-LLM 骆驼 trans_chinese_alpaca_data LC1332(商汤) 52k CN MT SI general instruct text-davinci-003 Natural Instructions Allen AI 61 task|1.5k task Allen AI 5040134 ML MT COL ...
达奇AI论文写作平台,在校学生、职场精英都在用的AI论文辅助写作平台 《GPT 提示词大全》基础版(五) Ollama 安装指南:解决国内下载慢和安装卡住问题 Python Hash函数的使用详解 千集助理微信小程序评分在哪,如何评分 解决Pytorch 分布式并行DDP卡死挂起的问题 nginx代理服务地址时添加帐号密码认证 解决传统医学大模型难以...
AlpacaDataCleanedyahma/alpaca-cleanedyahma52kENMTSIgeneral instructtext-davinci-003 Chinese-LLaMA-Alpacaalpaca_data_zh_51kymcui(讯飞)51kCNMTSIgeneral instructtext-davinci-003 Luotuo-Chinese-LLM骆驼trans_chinese_alpaca_dataLC1332(商汤)52kCNMTSIgeneral instructtext-davinci-003 ...