谷歌最强开源大模型Gemma 4，支持多模态、离线运行

6次阅读

共计 1995 个字符，预计需要花费 5 分钟才能阅读完成。

2026 年 4 月 2 日凌晨，谷歌 DeepMind CEO Demis Hassabis 在 X 上发了四颗钻石 emoji，几个小时后，谜底揭晓——Gemma 4 全系列正式发布。

这次不是常规更新，而是开源大模型格局的彻底重写。31B Dense 版本直接冲到 Arena AI 排行榜全球第三，用不到十分之一的参数量就能跟 400 亿参数的巨无霸掰手腕。更关键的是，谷歌这次彻底放下姿态，全系列采用 Apache 2.0 开源协议，没有任何商业限制。

谷歌最强开源大模型 Gemma 4，支持多模态、离线运行

Gemma 4 是谷歌推出的一款 开源本地大模型 ，主要用于支持多模态数据处理和离线运行。该模型在人工智能领域具有重要的突破，尤其是在处理多种数据形式（如文本、图像、视频和语音）时的能力。它能够提供一种本地运行的解决方案，无需依赖持续的网络连接，适用于各种智能化应用场景。

Gemma 4 不是单一模型，而是一个完整的模型家族，从 2B 到 31B 全场景覆盖：

E2B（2.3B 有效参数）：专为手机、树莓派等端侧设备设计，内存占用可压至 1.5GB 以下，完全离线运行
E4B（4.5B 有效参数）：端侧旗舰，支持多模态输入，AIME 2026 数学测试达 42.5%
26B MoE：混合专家架构，总参数 260 亿，推理时仅激活 38 亿参数，速度接近 4B 模型
31B Dense：旗舰版本，Arena AI 排名全球第三，单张 H100 即可运行

谷歌最强开源大模型 Gemma 4，支持多模态、离线运行

Gemma 4 最让人震惊的，不是它有多大，而是它有多小却能打多强。

在 Arena AI 开源排行榜上，31B Dense 冲到全球第三，Elo 评分 1452。排在前面的 GLM- 5 和 Kimi K2.5，参数量分别是它的 20 倍和 30 倍。谷歌把这叫做 ” 每参数智能 ”——用更少的参数，达到更高的性能。

数学推理方面，AIME 2026 成绩从上一代的 21.2% 跃升至 89.2%，提升幅度高达 68 个百分点。这一成绩已经接近甚至超越部分闭源商业模型。

谷歌最强开源大模型 Gemma 4，支持多模态、离线运行

如果说性能是惊喜，那许可证的变化才是真正的重磅炸弹。

此前 Gemma 前三代产品用的都是谷歌自定义的开源协议，不仅有诸多商用限制，谷歌还能单方面修改规则。这次，Gemma 4 全系列采用 Apache 2.0 许可证，意味着：

✅ 可自由用于商业用途
✅ 可修改、分发、二次开发
✅ 专利授权明确，降低法律风险
✅ 与现有开源生态无缝兼容

Hugging Face 联合创始人 Clément Delangue 评价：” 这是开源 AI 领域的一个重大里程碑。”

Gemma 4 全系支持图像和视频输入，E2B 和 E4B 还额外支持原生音频输入，内置约 3 亿参数的音频编码器。这意味着开发者可以用 Gemma 4 构建真正的多模态 AI 应用。

Gemma 4 原生支持函数调用（Function Calling）和结构化 JSON 输出，内置 System Prompt 支持，可作为 Agent 的核心大脑，自主规划多步骤任务、调用外部工具。

所有 Gemma 4 模型均支持可开关的思考模式（Thinking Mode）。开启后，模型会先输出内部推理过程，再给出最终答案，适合复杂问题求解。

31B 和 26B 版本支持 256K 的超长上下文窗口，在同参数级别开源模型中属于顶级配置，可处理长文档、代码库分析等复杂任务。

安装 ollama，进入 https://ollama.com/ 先下载 ollama。

# 安装 Ollama（官网下载）
# 运行不同版本：

ollama run gemma4


ollama run gemma4:e2b    # 2B 端侧版 
ollama run gemma4:e4b    # 4B 端侧版 
ollama run gemma4:26b    # 26B MoE 版 
ollama run gemma4:31b    # 31B 旗舰版

# macOS 安装 
brew install llama.cpp --HEAD

# 运行 
llama-server -hf ggml-org/gemma-4-26B-A4B-it-GGUF:Q4_K_M

# 安装 
uv pip install -U mlx-vlm

# 运行（带 TurboQuant 优化）
uv run mlx_vlm.generate --model google/gemma-4-31b-it --kv-bits 3.5

E2B/E4B：8GB 内存即可，手机、树莓派都能跑
26B MoE：推荐 16GB+ 显存，消费级 GPU 工作站
31B Dense：推荐 24GB+ 显存，单张 H100 或 RTX 4090

Gemma 4 标志着谷歌在开源 AI 领域的战略转向：从 ” 提供替代品 ” 到 ” 争夺基础设施层 ”。Apache 2.0 许可证、原生 Agent 支持、多模态覆盖的组合，使其成为 2026 年最值得关注的开源模型发布之一。

正文完

星哥玩云-微信公众号

发表至：教程笔记

近一天内

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

Nginx反向代理搭建配置及搭建过程一些思考

CentOS下LAMP平台部署及应用

独立undo表空间在线回收

怎样用 WPScan，Nmap 和 Nikto 扫描和检查一个 WordPress 站点的安全性

重磅：利用麦当劳网站的漏洞获取用户密码

apache使用fcgi配置PHP环境的步骤

ORA-01410故障解决实例

Solr单机版的搭建

星哥带你玩飞牛NAS-22：飞牛NAS官方的Openclaw的安装与使用

谷歌最强开源大模型Gemma 4，支持多模态、离线运行

谷歌最强开源大模型 Gemma 4，支持多模态、离线运行

一、四款模型，覆盖全场景

二、小模型打出大牌面

三、Apache 2.0 协议

四、核心技术亮点

1. 多模态能力

2. Agent 原生支持

3. 思考模式

4. 超长上下文

五、部署教程

方式一：Ollama（最简单）

方式二：llama.cpp

方式三：Mac 用户（MLX）

硬件要求参考

六、总结

150元打造低成本NAS小钢炮，捡一块3865U工控板

星哥带你玩飞牛NAS-14：解锁公网自由！Lucky功能工具安装使用保姆级教程

浏览器自动化工具！开源 AI 浏览器助手让你效率翻倍

零成本上线！用 Hugging Face免费服务器+Docker 快速部署HertzBeat 监控平台

颠覆 AI 开发效率！开源工具一站式管控 30+大模型ApiKey，秘钥付费+负载均衡全搞定

欧洲无限速云盘免费10GB永久存储 + WebDAV部署+图床搭建，多平台联动一步到位！

告别臃肿！这款轻量 API 神器火了，开箱即用并且完全开源

仅2MB大小！开源硬件监控工具：Win11 无缝适配，CPU、GPU、网速全维度掌控

浏览器自动化工具！开源 AI 浏览器助手让你效率翻倍

350元就能玩转双路服务器？程序员绝对惊讶的低价神机

免费图片视频管理工具让灵感库告别混乱

最佳显示器，1600元搞定Studio Display完美替代，省下上万！

别再手动操作了！OpenClaw实例教程：腾讯云+阿里云，每天自动提醒，杜绝服务中断

别再花钱调APIKey了！2026最全免费大模型合集，国内外直连、不限额度都有

大龙虾OpenClaw的token不够吃了？用免费的 APIKey 续命

谷歌最强开源大模型Gemma 4，支持多模态、离线运行