快搜汉语词典

首页 > lora微调c代码

lora微调c代码

2024-11-07 18:40:03

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

港中文联合MIT提出超长上下文LongLoRA大模型微调算法|序列|代码...

本文介绍一篇来自CUHK和MIT合作完成的工作,本文结合LoRA方法提出了长上下文LLM微调框架LongLoRA,本文从两个方面对LLM的上下文窗口进行了优化,首先提出了shift short attention(S2-Attn)模块替代了原始模型推理过程中的密集全局注意力,可以节省大量的计算量,同时保持了与普通注意力微调相近的性能。此外作者重新审视了LLM上下文...

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

© 快搜词典

网上黑客追款大户黑客追款正规黑客业务