BTLM-3B 的准确度超过了 RedPajama-INCITE-7B-Base 、OpenLLaMA 7B 和 Stable-LM-7B,而训练计算量却减少了 71%。与 7B 模型相比,BTLM-3B 的内存占用减少了 58%,推理速度提高了 2 倍。这一成果将使 7B 模型的强大功能在易于部署的 3B软件包中得到更广泛的应用。 图4:BTLM-3B-8K 和 7B 模型系列的质...
用世界最大GPU训练性能出众btlm-3B-8k开源小模型 #小工蚁 #cerebras - 小工蚁于20231015发布在抖音,已经收获了20.7万个喜欢,来抖音,记录美好生活!