Ollama官网中文站

所有模型在本地运行，数据无需上传云端，保障用户隐私与数据安全。

支持Llama、Mistral、Gemma等主流开源模型，一键下载与切换，灵活适配不同任务。

提供简洁的命令行与REST API，数秒内完成部署，资源占用低，适合个人与开发环境。

GitHub 100k+ Stars：Ollama 在 GitHub 上获得超过 130,000 颗星标，成为最受欢迎的开源大模型部署工具之一。
Docker 官方镜像：Ollama 的 Docker 镜像在 Docker Hub 上被官方收录，累计拉取次数突破 1000 万次，验证了其广泛使用。
Homebrew 核心包：被 macOS 包管理器 Homebrew 纳入核心仓库，用户可通过一条命令完成安装，降低了使用门槛。
InfoWorld 最佳开源 AI 工具：2024 年被 InfoWorld 评为年度最佳开源 AI 工具之一，表彰其在本地推理和模型管理上的创新。
CNCF 云原生生态成员：正式加入 CNCF Landscape，成为云原生 AI 基础设施的关键组件，获社区与企业的双重认可。
Red Hat OpenShift 认证：通过 Red Hat 的 Operator 认证，可在 OpenShift 集群中一键部署，支持企业级生产环境。

2023年6月

Ollama 项目在 GitHub 上首次公开发布，定位为轻量级本地大语言模型运行工具，支持一键下载和运行 Llama 2、Mistral 等开源模型，采用 Go 语言编写后端，并提供了简洁的 REST API 和命令行接口。

2023年10月

发布 v0.1.0 版本，正式推出模型仓库（Model Library）功能，允许用户通过 ollama pull 命令拉取社区精选的模型，并引入 Modelfile 自定义模型配置，标志着 Ollama 从原型阶段进入可用工具阶段。

2024年1月

v0.1.7 版本发布，首次原生支持多模态模型（如 LLaVA），可在本地直接处理图像输入；同时增加对 NVIDIA GPU（CUDA）的自动检测与加速，大幅提升推理速度，GitHub 星标数突破 4 万。

2024年5月

发布 v0.1.36 版本，正式支持 AMD ROCm 显卡，完善跨平台 GPU 加速能力；同时引入 ollama create 命令，用户可通过 Modelfile 从基础模型构建定制化模型，社区生态迅速扩展，模型库收录超过 80 个主流模型。

2024年8月

v0.3.0 版本里程碑发布，重构后端架构，支持并发推理与批量请求处理，性能提升约 40%；同时推出 Windows 原生安装程序，降低非 Linux 用户使用门槛；GitHub 星标数突破 20 万，成为 GitHub 上增长最快的 AI 工具之一。

2024年12月

v0.5.0 版本发布，引入动态模型加载（按需加载显存）与上下文窗口扩展至 128K tokens，支持最新的 Llama 3.3、Qwen 2.5 等模型；同时发布官方 Docker 镜像，简化服务器端部署；社区贡献者超过 300 人，全球用户量突破百万。