【新智元导读】就在刚刚,谷歌Gemma 3来了,1B、4B、12B和27B四种参数,一块GPU/TPU就能跑!而Gemma 3仅以27B就击败了DeepSeek 671B模型,成为仅次于DeepSeek R1最优开源模型。谷歌Gemma 3全家桶来了!刚刚,在巴黎开发者日上,开源Gemma系模型正式迭代到第三代,原生支持多模态,128k上下文。此次,Gemma 3一共...
当地时间3月12日,谷歌宣布推出Gemma 3,首次引入多模态能力,支持视觉-语言输入和文本输出。该模型可处理长达128k token的上下文窗口,理解140多种语言。Gemma 3提供四种参数规模(1B、4B、12B、27B),既包含可针对特定场景微调的预训练模型,也包含经过通用指令优化的版本。谷歌方面表示,该模型是可在单个GPU或TPU...
一、Gemma 3的核心突破:重新定义AI效率天花板 多模态能力:文本、图像、视频全场景打通 Gemma 3基于Gemini 2.0技术构建,支持文本、图像及短视频的联合分析。其定制版SigLIP视觉编码器可将图像转化为256个软标记,实现跨模态语义理解(如识别医疗影像中的异常结构)。开发者可借此构建智能客服、工业质检等复合型AI应...
Gemma 3包括一个10亿参数(1B)的仅文本小型语言模型(SLM)以及三个图像-文本模型,参数规模分别为40亿(4B)、120亿(12B)和270亿(27B)。这些模型在HuggingFace上可用,并且可以在NVIDIAAPI目录中试用1B模型的演示。 Gemma 3模型的特性 1B模型:优化为在设备应用程序或需要低内存使用的环境中高效运行,支持最多32K个令...
自首届Gemma发布以来,我们看到这些模型推动了许多对社会有益的应用,例如我们自己的ShieldGemma 2,这是一个使用Gemma 3构建的4B图像安全分类器,它为图像安全提供了现成的解决方案,针对危险内容、色情内容和暴力类别输出安全标签。 发布Gemma 3模型需要特别注意模型能力的变化,并密切监控现有多模态大型语言模型(LLM)不断...
适用场景:推荐用于多模态内容生成、轻量化边缘AI,而非高精度推理场景。 模型各量化版本(1B,4B,12B,27B)对比 逻辑推理能力 代码能力 多语言能力 多模态 Gemma 3的发布,标志着开源模型从“参数竞赛”转向“效率优先”的新阶段。其平衡性能与成本的特性,或将成为中小开发者进入多模态AI领域的首选工具。发布...
2025年3月12日,GoogleDeepMind推出了Gemma 3,包括1B, 4B, 12B 和 27B多个版本。这是Gemma系列模型的最新成员,不仅在规模上有所扩展,还引入了视觉理解能力、多语言支持和更长的上下文处理能力,一举超过DeepSeek-V3和Meta Llama3.1 405B等超大模型,登上LMArena榜单前10位。
全面的语言覆盖:支持超过140种全球语言,使用户能以母语进行自然交互,同时为开发者提供了AI应用的多语言扩展基础。灵活的模型规模选择:开发者可根据具体任务需求和可用算力资源,选择最适合的模型尺寸(1B、4B、12B、27B参数)及精度等级。参数规模与量化选项 Gemma 3系列提供4种不同参数规模和5种精度等级,精度范围...
10个月后的今天,Google开源了第三代Gemma 3系列大模型,版本范围增加到了4个,分别是1B、4B、12B和27B,并且从纯粹的大语言模型升级到了多模态大模型,即支持图片和视频的输入。 此次,Gemma 3的升级很大,总结如下: Gemma 3系列模型最高支持128K的上下文输入(10亿参数版本的Gemma 3-1B仅支持32K) ...
Gemma-3提供四种参数版本(1B、4B、12B、27B),用户可根据需求灵活选择。其中,27B参数版本仅需单张H100 GPU即可实现高效推理,算力需求仅为同类模型的10%,大幅降低了部署成本。1B参数版本,在低精度模式下内存占用不足1GB,适配手机、笔记本电脑等端侧设备。在三星Galaxy S24 Ultra上运行的性能:谷歌同步推出"...