编程大模型是大语言模型的一个非常重要的应用。刚刚,清华大学系创业企业智谱AI开源了最新的一个编程大模型,CodeGeeX2-6B。这是基于ChatGLM2-6B微调的针对编程领域的大模型。不过,需要注意的是,官方说CodeGeeX2-6B对学术研究完全开放,商用需要申请,可能是收费商用授权!
ModelScope将codegeeX2-6B微调出其他能力(比如代码注释生成、代码结构解析)应该如何组织数据集呢,另外如何导出单独的Lora权重࿱