百家乐正规平台官方版 120亿参数跑在16G札记本上, 谷歌Gemma 4新成员杀来了

机器之心剪辑部

不才载量冲破 1.5 亿次之际，谷歌 Gemma 4 系列模子迎来了新的眷属成员！

今天，谷歌认真推出 Gemma 4 12B，方案是把具备智能体才调的多模态智能，胜仗带到札记本电脑上。

字据先容，Gemma 4 12B 介于面向边际修复的 E4B 与才调更强的 26B 夹杂各人模子（MoE）之间，在更小的内存占用下提供了广阔的才调。

另外，Gemma 4 12B 亦然谷歌首个赈济原生音频输入的中等畛域模子。

谷歌 DeepMind 首创东说念主兼 CEO 哈萨比斯，「为庆祝 Gemma 4 下载量冲破 1.5 亿次这一遑急里程碑，谷歌发布了全新的 Gemma 4 12B 模子！关于这么一个小尺寸模子来说，它的才调特殊广阔；同期，它也亏本轻量，只需 16GB 显存，就能在札记本电脑上腹地驱动。」

环球不错用它构建了多样各类的诓骗，从用于物理援手的可衣着机器东说念主手臂，到企业级 AI 安全系统。谷歌也期待看到拓荒者用这款最新模子创造出更多可能。

这次，Gemma 4 12B 模子具有以下几大特点：

全新的融合架构：不再使用多模态编码器，视觉和音频输入不错胜仗参加 LLM 骨干齐集。

更强的推理才调：在基准测试中的发扬接近谷歌的 26B 模子，斗鱼体育app中国官网下载大要赈济广阔的多步推理和智能体职责流。

合适札记本腹地驱动：模子畛域亏本小，只需要 16GB 显存或融合内存即可在腹地驱动。

绽开且易于赢得：遴荐 Apache 2.0 许可证发布，并赈济豪迈的拓荒者生态。

6686体育官方网站入口

赈济草稿模子加快：Gemma 4 12B 配备了多 Token 推断（MTP）草稿模子，可用于镌汰延伸。

现在，用户不错通过 LM Studio、Ollama、Google AI Edge Gallery App、Google AI Edge Eloquent App 以及 LiteRT-LM CLI 等渠说念进行试用。

在 GPQA Diamond、BBEH、MMLU Pro、LiveCode Bench、DocVQA、InfoVQA、MMMU Pro 和 MRC v2.8 needle 128k（average）等一系列基准测试中，Gemma 4 12B 的发扬接近谷歌更大的 26B MoE 模子，但全体内存占用不到后者的一半。

况且，它的畛域亏本小，百家乐正规平台官方版不错在配备 16GB 内存的消耗级札记本电脑上腹地驱动，从而把广阔的多模态体验和智能体才调带到你的个东说念主修复上。

有东说念主在一张 RTX 4090 上腹地驱动了 Gemma 4 12B 和 Gemma 4 26B-A4B，并给它们顶住了团结个任务：在不使用任何库的情况下，用单个文献写出一个自包含的 HTML5 Canvas 动画，并加入信得过物理成果。测试包含三个场景：高尔顿板、两个方块与墙面碰撞，以及蒙眬三重摆。输出限度如下：

Gemma 4 26B-A4B：占用 15GB 显存，生成 6.9k tokens，速率 138 tokens/s

Gemma 4 12B：占用 9GB 显存，生成 8.9k tokens，速率 80 tokens/s

同属 Gemma 4 眷属，但 26B-A4B 在三个场景中都胜出，而且驱动速率快了约 1.7 倍，它的活跃参数目只好 4B。不外，12B 的发扬也特殊接近，同期显存占用实在只好一半。这也让它成为 16GB 札记本上的理念念腹地模子。

另外，Gemma 4 12B 最超越的场合在于，它贬责视觉和音频输入的神志愈加精简。

传统多模态模子频频依赖孤立编码器，先把图像和音频移动成模子可领略的暗示，再传递给话语模子。但这些诀别式编码器会带来特殊延伸，也会加多内存占用。因此，谷歌在考验 Gemma 4 12B 时遴荐了无编码器架构，让音频和视觉输入大要胜仗整合进模子。

Gemma 4 12B 原生贬责多模态输入的神志如下：

视觉：谷歌用一个轻量级镶嵌模块替代了 Gemma 4 的视觉编码器。这个模块由一次矩阵乘法、位置镶嵌和归一化构成，让 LLM 骨干齐集接受视觉贬责。

音频：音频贬责进一步简化。谷歌都备移除了音频编码器，并将原始音频信号投影到与文本 token 商量的维度空间中。

在 Google AI Edge Eloquent App 中，Gemma 4 12B 不错都备离线完谚语音输入的转录、法子整理和翻译。

百家乐正规平台官方版