ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第2代版本,引入新的特性包括更长的上下文(基于FlashAttention技术,将基座模型的上下文长度由ChatGLM-6B的2K扩展到了32K,并在对话阶段使用8K的上下文长度训练);更高效的推理(基于Multi-QueryAttention技术,ChatGLM2-6B有更高效的推理速度和更低的显存占用)。 1.环境安装...
New issue 更新对基于 langchain 的 ChatGLM 应用项目 langchain-chatglm 的介绍 #780 Merged duzx16 merged 1 commit into THUDM:main from imClumsyPanda:main Apr 25, 2023 +2 −1 Conversation 0 Commits 1 Checks 0 Files changed 2 Conversation Contributor imClumsyPanda commented Apr 23, 2023 ...
ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第2代版本,引入新的特性包括更长的上下文(基于FlashAttention技术,将基座模型的上下文长度由ChatGLM-6B的2K扩展到了32K,并在对话阶段使用8K的上下文长度训练);更高效的推理(基于Multi-QueryAttention技术,ChatGLM2-6B有更高效的推理速度和更低的显存占用)。 1....