🤖
Ollama 模型量化指南:教你用 4GB 显存跑 70B 大模型
详细讲解Ollama模型量化原理,实测Q4_K_M、Q5_K_S、Q8_0等量化级别在RTX 3060/4060/4090上的性能表现,4GB显存也能跑70B大模型。
🕐 2026-03-08
🏷️ Ollama
🤖
Ollama模型量化指南:教你把大模型塞进家用电脑,实测省显存50%
Ollama模型量化详细教程:什么是量化、怎么做、不同量化级别的性能对比,帮你用更少显存跑更强模型
🕐 2026-03-08
🏷️ Ollama
🤖
Stable Diffusion WebUI 本地部署教程:零刻 SER8 跑 AI 绘画实测
Stable Diffusion WebUI 本地部署教程:零刻 SER8 跑 AI 绘画实测 Stable Diffusion (SD) 是目前最流行的开源 AI 绘画模型。之前很多人觉得必须要有显 …
🕐 2026-03-08
🏷️ Stable Diffusion
🤖
Stable Diffusion WebUI 完整部署指南:AI 绘画本地化方案
使用 Docker 快速部署 Stable Diffusion WebUI,实现 AI 绘画本地化
🕐 2026-03-08
🏷️ Stable Diffusion
🤖
本地 LLM 推理性能优化实战:从配置到实测提升 3 倍
本地大语言模型推理性能优化教程:批量推理、量化、GPU 加速、KV Cache 优化,实测数据告诉你如何让本地 AI 响应更快
🕐 2026-03-08
🏷️ LLM
🤖
本地AI知识库搭建教程:RAG系统实战指南
手把手教你用Ollama + LangChain搭建本地RAG知识库,支持PDF/Word/txt文档,隐私安全又免费
🕐 2026-03-08
🏷️ AI知识库
🤖
AI 写作工具推荐:这些工具让效率翻倍
AI 写作工具推荐:这些工具让效率翻倍 AI 工具那么多,哪些真正值得用?
文本处理类:
Notion AI:笔记内直接调用 AI,摘要、改写、润色一键完成,月付 10 美元 Wordtune:浏览器 …
🕐 2026-03-07
🤖
ChatGPT 进阶使用技巧:如何写出高质量 Prompt?
ChatGPT 进阶使用技巧:如何写出高质量 Prompt? 同样的 ChatGPT,为什么别人用的比你好?关键在于 Prompt。
核心公式:
角色 + 任务 + 约束 + 格式 优质 Prompt …
🕐 2026-03-07
🤖
Ollama + OpenWebUI 本地部署:30 分钟搭建私人 AI 助手
Ollama 2026 最新版安装教程,配合 OpenWebUI 实现 ChatGPT 级体验。支持 DeepSeek R1、Qwen2.5、Llama3.1 等主流模型,完全离线运行,数据不出本地。
🕐 2026-03-07
🏷️ Ollama
🤖
Ollama 本地部署 DeepSeek R1:最低配置要求
Ollama 本地部署 DeepSeek R1:最低配置要求 DeepSeek R1 开源后,很多人想本地部署。最低配置到底是多少?
不同参数模型配置要求:
模型 量化版本 显存要求 内存要求 推荐设 …
🕐 2026-03-07
🤖
Ollama 本地部署教程:迷你主机/NAS 跑大模型完全指南
Ollama 本地部署教程:迷你主机/NAS 跑大模型完全指南 想在本地跑大模型?Ollama 是最简单的选择。一行命令安装,支持 Llama 3、DeepSeek R1、Qwen 等主流模型,完全离 …
🕐 2026-03-07
🤖
本地大模型性能优化:让 N100 也能跑 7B 模型
本地大模型性能优化:让 N100 也能跑 7B 模型 N100 性能弱,但用对方法,7B 模型也能跑起来。
优化技巧:
量化压缩
用 llama.cpp 量化到 Q4_K_M 显存占用减少 50%,速 …
🕐 2026-03-07