所有模型在本地运行,数据无需上传云端,保障用户隐私与数据安全。
支持Llama、Mistral、Gemma等主流开源模型,一键下载与切换,灵活适配不同任务。
提供简洁的命令行与REST API,数秒内完成部署,资源占用低,适合个人与开发环境。
Ollama 项目在 GitHub 上首次公开发布,定位为轻量级本地大语言模型运行工具,支持一键下载和运行 Llama 2、Mistral 等开源模型,采用 Go 语言编写后端,并提供了简洁的 REST API 和命令行接口。
发布 v0.1.0 版本,正式推出模型仓库(Model Library)功能,允许用户通过 ollama pull 命令拉取社区精选的模型,并引入 Modelfile 自定义模型配置,标志着 Ollama 从原型阶段进入可用工具阶段。
v0.1.7 版本发布,首次原生支持多模态模型(如 LLaVA),可在本地直接处理图像输入;同时增加对 NVIDIA GPU(CUDA)的自动检测与加速,大幅提升推理速度,GitHub 星标数突破 4 万。
发布 v0.1.36 版本,正式支持 AMD ROCm 显卡,完善跨平台 GPU 加速能力;同时引入 ollama create 命令,用户可通过 Modelfile 从基础模型构建定制化模型,社区生态迅速扩展,模型库收录超过 80 个主流模型。
v0.3.0 版本里程碑发布,重构后端架构,支持并发推理与批量请求处理,性能提升约 40%;同时推出 Windows 原生安装程序,降低非 Linux 用户使用门槛;GitHub 星标数突破 20 万,成为 GitHub 上增长最快的 AI 工具之一。
v0.5.0 版本发布,引入动态模型加载(按需加载显存)与上下文窗口扩展至 128K tokens,支持最新的 Llama 3.3、Qwen 2.5 等模型;同时发布官方 Docker 镜像,简化服务器端部署;社区贡献者超过 300 人,全球用户量突破百万。