Ollama

排序:

Ollama 0.5本地部署DeepSeek R1全攻略:6GB显卡畅玩671B大模型

Ollama 0.5版本本地部署DeepSeek R1教程,量化模型实测,6GB显存也能玩671B大模型

Ollama 模型量化指南:6 种量化方式实测对比,显存节省 70% 的秘密

Ollama 模型量化指南:6 种量化方式实测对比,显存节省 70% 的秘密 Ollama 支持多种量化方式,从 Q2_K 到 F16,不同量化等级对显存和性能影响巨大。这篇帮你搞懂怎么选,让 8GB 显存也能跑 70B 大模型。

DeepSeek R1 本地部署教程:免费开源 + 满血版 671B 模型,性能对标 GPT-4

DeepSeek R1 本地部署教程:免费开源 + 满血版 671B 模型,性能对标 GPT-4 DeepSeek R1 是国产大模型的黑马,推理能力直接对标 OpenAI o1,而且完全开源免费。今天教你在本地部署 DeepSeek R1。

Ollama 模型量化实战指南:在迷你主机上运行大模型

Ollama 模型量化实战指南:在迷你主机上运行大模型 随着 NUC 和迷你主机性能的提升,越来越多的用户开始探索在本地运行大语言模型。本文将详细介绍 Ollama 模型量化的技术方案,帮助你在有限硬件资源下获得最佳体验。

Ollama 模型量化指南:7B 模型 4GB 显存跑满血,性能损失仅 5%

Ollama 模型量化指南:7B 模型 4GB 显存跑满血,性能损失仅 5% 本地跑大模型显存不够?量化是最佳解决方案。今天实测 Ollama 量化技术,教你用 4GB 显存跑 7B 模型,性能损失仅 5%,速度提升 3 倍。

Ollama 模型量化指南:教你用 4GB 显存跑 70B 大模型

详细讲解Ollama模型量化原理,实测Q4_K_M、Q5_K_S、Q8_0等量化级别在RTX 3060/4060/4090上的性能表现,4GB显存也能跑70B大模型。

Ollama模型量化指南:教你把大模型塞进家用电脑,实测省显存50%

Ollama模型量化详细教程:什么是量化、怎么做、不同量化级别的性能对比,帮你用更少显存跑更强模型

本地 LLM 推理性能优化实战:从配置到实测提升 3 倍

本地大语言模型推理性能优化教程:批量推理、量化、GPU 加速、KV Cache 优化,实测数据告诉你如何让本地 AI 响应更快

本地AI知识库搭建教程:RAG系统实战指南

手把手教你用Ollama + LangChain搭建本地RAG知识库,支持PDF/Word/txt文档,隐私安全又免费

Ollama + OpenWebUI 本地部署:30 分钟搭建私人 AI 助手

Ollama 2026 最新版安装教程,配合 OpenWebUI 实现 ChatGPT 级体验。支持 DeepSeek R1、Qwen2.5、Llama3.1 等主流模型,完全离线运行,数据不出本地。

迷你主机跑本地大模型:Ollama部署Qwen2.5实测

迷你主机跑本地大模型:Ollama部署Qwen2.5实测 想用迷你主机跑本地大模型?没问题,今天手把手教你用 Ollama 部署 Qwen2.5,实测可用。 环境要求 迷你主机(推荐 AMD 8845HS 或 Intel Ultra 7 以上) 内存 32GB 以上(16GB 勉 …

Ollama本地部署大模型:零基础入门指南

用Ollama在本地部署大模型,无需显卡也能玩