8845HS性能实测:能跑多大本地大模型
为什么用Mini PC跑大模型�?
相比动辄数万元的显卡�?845HS的Radeon 780M核显配合量化模型,可以实现:
- **低成�?:整�?000-5000�?- **低功�?:满载仅45W
- 静音:无需显卡风扇
- 省心:即开即用
8845HS硬件规格
| 参数 | 规格 |
|---|
| 架构 | Zen 4 |
| 核心/线程 | 8C/16T |
| 基础频率 | 3.8GHz |
| 睿频频率 | 5.1GHz |
| TDP | 45W |
| 核显 | Radeon 780M |
| 核显算力 | 8.9 TFLOPS |
| 内存支持 | DDR5-5600 |
量化模型参数对照�?
常见模型量化级别
| 量化级别 | 精度 | 文件大小 | 推荐显存 |
|---|
| FP16 | 16�? | 100% | 16GB+ |
| Q8 | 8�? | 50% | 8GB+ |
| Q6 | 6�? | 37.5% | 6GB+ |
| Q5 | 5�? | 31% | 5GB+ |
| Q4 | 4�? | 25% | 4GB+ |
| Q3 | 3�? | 19% | 3GB+ |
| Q2 | 2�? | 12.5% | 2GB+ |
内存带宽限制
8845HS的内存带宽是 76.8 GB/s(DDR5-5600),这限制了核显性能发挥。实际可用内存通常为分配给核显的部分�?
实测数据
llama.cpp 基准测试
| 模型 | 量化 | 内存需�? | Token/s |
|---|
| Llama 3.1 8B | Q4_K_M | 4.8GB | 15 |
| Llama 3.1 8B | Q5_K_M | 5.7GB | 12 |
| Llama 3 8B | Q4_K_M | 4.8GB | 16 |
| Qwen 2.5 7B | Q4_K_M | 4.3GB | 18 |
| Qwen 2.5 7B | Q5_K_M | 5.1GB | 14 |
| Mistral 7B | Q4_K_M | 4.8GB | 17 |
| Phi-3.5 3B | Q4_K_M | 2.1GB | 35 |
| Phi-4 4B | Q4_K_M | 2.7GB | 28 |
实际对话体验
| 模型 | 量化 | 启动时间 | 响应速度 | 可用�? |
|---|
| Qwen2.5-7B | Q4 | 5�? | 15 token/s | ⭐⭐⭐⭐�? |
| Llama3.1-8B | Q4 | 6�? | 12 token/s | ⭐⭐⭐⭐ |
| Mistral-7B | Q4 | 5�? | 17 token/s | ⭐⭐⭐⭐�? |
| Phi-4-4B | Q4 | 3�? | 28 token/s | ⭐⭐⭐⭐�? |
能跑多大的模型?
推荐配置
| 模型参数 | 量化级别 | 内存占用 | 实际体验 |
|---|
| 3B | Q4-Q6 | 2-3GB | 流畅 |
| 7B | Q4 | 4-5GB | 可用 |
| 8B | Q4 | 4.8GB | 可用 |
| 14B | Q2 | 3-4GB | 勉强 |
结论
*8845HS能流畅运�?B Q4级别模型�?4B模型需要更激进的量化才能运行�?
| 推荐�? | 模型 | 用�? |
|---|
| ⭐⭐⭐⭐�? | Phi-3.5/Qwen2.5-3B | 日常问答 |
| ⭐⭐⭐⭐�? | Qwen2.5-7B | 综合使用 |
| ⭐⭐⭐⭐ | Llama3.1-8B | 英文为主 |
| ⭐⭐�? | Mistral-7B | 代码能力 |
Ollama配置优化
建议设置
# 设置GPU层数(全部使用核显)
export OLLAMA_GPU_LAYERS=999
# 设置线程�?export OLLAMA_NUM_THREADS=8
# 内存相关
export OLLAMA_FLASH_ATTENTION=1
推荐模型列表
# 日常对话(推荐)
ollama pull qwen2.5:7b
ollama pull phi3.5:latest
# 代码能力
ollama pull codellama:7b
# 中文优化
ollama pull qwen2.5:7b-instruct-q5_K_M
# 轻量快�?ollama pull phi4:4b
与其他设备对�?
核显对比
| 设备 | 核显 | TFLOPS | 7B Q4速度 |
|---|
| 8845HS | 780M | 8.9 | 15 token/s |
| 锐龙7 7840HS | 780M | 8.9 | 15 token/s |
| Intel Ultra 7 155H | Arc 8 | 8.3 | 12 token/s |
| N100 | UHD 24 | 0.5 | 无法运行 |
与显卡对�?
| 设备 | 价格 | 7B Q4速度 | 功�? |
|---|
| 8845HS Mini PC | ¥4000 | 15 token/s | 45W |
| RTX 3060 12G | ¥1800 | 45 token/s | 170W |
| RTX 4060 Ti | ¥2800 | 60 token/s | 120W |
| Apple M4 Pro | ¥9000 | 30 token/s | 30W |
实际应用场景
推荐使用场景
- **个人知识�?*:RAG + Qwen2.5-7B
- 编程辅助:CodeLlama-7B
- 日常问答:Phi-3.5
- 文案创作:Qwen2.5-7B
不适合场景
- **13B+大模�?:即使量化也跑不�?2. 实时翻译:延迟较�?3. **长文本分�?:内存不�?4. **高并�?*:只能单用户
总结
8845HS�?目前性价比最高的本地大模型运行平�?�?B Q4模型可以流畅运行,响应速度15 token/s左右,完全满足个人使用需求�?
**下一步建�?*�?- 搭配16GB内存(双通道�?- 使用Qwen2.5-7B模型