QWen1.5-0.5B + alpach_gpt4_zh freeze LLaMA-Factory是一个非常好用的开源微调大模型工具。 GitHub:github.com/hiyouga/LLaM LLaMA-Factory介绍 项目特色 多种模型:LLaMA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi 等等。 集成方法:(增量)预训练、指令监督微调、奖励模型训练、PPO 训练、...
# 示例:使用 QLoRA 微调 DeepSeek MoE 16B Base 模型llamafactory-cli train \ --stage sft \ --do_train \ --model_name_or_path deepseek-ai/deepseek-moe-16b-base \ --dataset alpaca_gpt4_zh \ --template deepseek \ --finetuning_type lora \ --quantization_bit 4 ...
--dataset alpaca_gpt4_zh,glaive_toolcall_100k,identity ^ --cutoff_len 1024 ^ --learning_rate 0.0002 ^ --num_train_epochs 5.0 ^ --max_samples 500 ^ --per_device_train_batch_size 4 ^ --gradient_accumulation_steps 4 ^ --lr_scheduler_type cosine ^ --max_grad_norm 1.0 ^ --logging_...
CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \--stage sft \--do_train \--model_name_or_path /media/codingma/LLM/llama3/Meta-Llama-3-8B-Instruct \--dataset alpaca_gpt4_zh,identity,adgen_local \--dataset_dir ./data \--template llama3 \--finetuning_type lora \--lora_target q_proj...
from llmtunerimportrun_exprun_exp(dict(stage="sft",do_train=True,model_name_or_path="Qwen/Qwen1.5-0.5B-Chat",dataset="identity,alpaca_gpt4_en,alpaca_gpt4_zh",template="qwen",finetuning_type="lora",lora_target="all",output_dir="test_identity",per_device_train_batch_size=4,gradient_...
比较常见的alpaca_gpt4_data_zh.json就是标准的alpaca格式,我们自己在界面能够顺利加载的原因在于,所有的数据文件,在LLaMA-Factory项目中均使用dataset_info.json进行定义和管理,其存储位置在LLaMA-Factory/data目录下: 在这个文件中,定义一个数据集的格式如下: ...
py \ --stage sft \ --do_train \ --model_name_or_path path_to_llama_model \ --dataset alpaca_gpt4_zh \ --template default \ --finetuning_type lora \ --lora_target q_proj,v_proj \ --output_dir path_to_sft_checkpoint \ --overwrite_cache \ --per_device_train_batch_size 4 ...
--dataset alpaca_gpt4_zh,identity,adgen_local \ --dataset_dir ./data \ --template llama3 \ --finetuning_type lora \ --output_dir ./saves/LLaMA3-8B/lora/sft \ --overwrite_cache \ --overwrite_output_dir \ --cutoff_len 1024 \ ...
微调数据,用的alpaca_gpt4_zh, 如果回答比较短的问题就能全部输出,如果回答比较长的问题,就出现截断。我试验了多次都是这种情况。 例子如下: 1.感冒能多喝热水吗 是的,感冒时多喝热水对健康有益。水能够帮助稀释痰液,舒缓咳嗽,并促进排汗和排尿,有助于将体内的病菌和毒素排出体外。此外,多喝水还能保持身体水分...
OpenO1-SFT (en&zh) Open-Thoughts (en) Open-R1-Math (en) Chinese-DeepSeek-R1-Distill (zh) LLaVA mixed (en&zh) Pokemon-gpt4o-captions (en&zh) Open Assistant (de) Dolly 15k (de) Alpaca GPT4 (de) OpenSchnabeltier (de) Evol Instruct (de) Dolphin (de) Booksum (de) Airoboros ...