GPT4ALL,本地运行且无需联网的大模型客户端软件,它的特点是在低配如 4G~8G 内存的消费级电脑上也能跑,无 GPU 要求,模型文件的大小在 3G~8G 左右,都是经过定制微调的可插拔 LLMs,效果优于 GPT-3,媲美 GPT-3.5。 其实这样的模型非常多,基本思路跟斯坦福开源的 Alpaca 是一致的。Alpaca(网页链接)是一个基...
其实相比GPT-4o,我个人更期待GPT-5的出现,因为从GPT-5的能力能够评估我们目前阶段大模型的Scaling Law能达到什么状态。但是,ChatGPT发布已经一年半了,GPT-4在22年就训练好了,目前已经经过了一年半到两年时间,GPT-5还迟迟没有出来,只是发布了更偏向多模态产品形态的GPT-4o,这多少是有点不太正常的,我猜测这可能...
为了探索大型多模态模型的潜力,Qwen2-VL研究了大型视觉-语言模型的扩展规律。通过调整模型大小(2B、8B和72B参数版本)和训练数据量,Qwen2-VL系列取得了极具竞争力的表现。值得注意的是,Qwen2-VL-72B模型在各种多模态基准测试中取得了与领先模型(如GPT-4o和Claude3.5-Sonnet)可比的结果,胜过其他通用模型。
此外,Grok的特点包括:使用来自公开数据的数十亿个数据点进行训练,能够通过联网获取实时信息并浏览和使用X平台上的信息;SuperPrompt上下文窗口大小为25000个Tokens,知识库是886.03GB的“The Pile”的变种以及整个X平台;具有高响应时间,支持语音;可以跨多个领域生成高质量图像,呈现现实世界实体、文本、标志的精确视觉细节,并...