快搜汉语词典

首页 > 大语言模型量化裁剪

大语言模型量化裁剪

2024-12-26 11:51:28

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP...

模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言,模型量化显得更加重要。例如,GPT-3 模型的 175B 参数当使用 FP16 格式加载时,需消耗 350GB 的内存,需要至少 5 张 80GB 的 A100 GPU。但若是可以...

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

© 快搜词典

网上黑客追款大户黑客追款正规黑客业务