📷

8845HS性能实测：能跑多大本地大模型

实测 AMD 8845HS 运行本地大语言模型能力，详解能跑多少参数的量化模型。

8.5 /10 综合评分

8845HS性能实测：能跑多大本地大模型

为什么用Mini PC跑大模型�?

相比动辄数万元的显卡�?845HS的Radeon 780M核显配合量化模型，可以实现：

**低成�?：整�?000-5000�?- **低功�?：满载仅45W
静音：无需显卡风扇
省心：即开即用

8845HS硬件规格

参数	规格
架构	Zen 4
核心/线程	8C/16T
基础频率	3.8GHz
睿频频率	5.1GHz
TDP	45W
核显	Radeon 780M
核显算力	8.9 TFLOPS
内存支持	DDR5-5600

量化模型参数对照�?

常见模型量化级别

量化级别	精度	文件大小	推荐显存
FP16	16�?	100%	16GB+
Q8	8�?	50%	8GB+
Q6	6�?	37.5%	6GB+
Q5	5�?	31%	5GB+
Q4	4�?	25%	4GB+
Q3	3�?	19%	3GB+
Q2	2�?	12.5%	2GB+

内存带宽限制

8845HS的内存带宽是 76.8 GB/s（DDR5-5600），这限制了核显性能发挥。实际可用内存通常为分配给核显的部分�?

实测数据

llama.cpp 基准测试

模型	量化	内存需�?	Token/s
Llama 3.1 8B	Q4_K_M	4.8GB	15
Llama 3.1 8B	Q5_K_M	5.7GB	12
Llama 3 8B	Q4_K_M	4.8GB	16
Qwen 2.5 7B	Q4_K_M	4.3GB	18
Qwen 2.5 7B	Q5_K_M	5.1GB	14
Mistral 7B	Q4_K_M	4.8GB	17
Phi-3.5 3B	Q4_K_M	2.1GB	35
Phi-4 4B	Q4_K_M	2.7GB	28

实际对话体验

模型	量化	启动时间	响应速度	可用�?
Qwen2.5-7B	Q4	5�?	15 token/s	⭐⭐⭐⭐�?
Llama3.1-8B	Q4	6�?	12 token/s	⭐⭐⭐⭐
Mistral-7B	Q4	5�?	17 token/s	⭐⭐⭐⭐�?
Phi-4-4B	Q4	3�?	28 token/s	⭐⭐⭐⭐�?

能跑多大的模型？

模型参数	量化级别	内存占用	实际体验
3B	Q4-Q6	2-3GB	流畅
7B	Q4	4-5GB	可用
8B	Q4	4.8GB	可用
14B	Q2	3-4GB	勉强

结论

*8845HS能流畅运�?B Q4级别模型�?4B模型需要更激进的量化才能运行�?

推荐�?	模型	用�?
⭐⭐⭐⭐�?	Phi-3.5/Qwen2.5-3B	日常问答
⭐⭐⭐⭐�?	Qwen2.5-7B	综合使用
⭐⭐⭐⭐	Llama3.1-8B	英文为主
⭐⭐�?	Mistral-7B	代码能力

Ollama配置优化

建议设置

# 设置GPU层数（全部使用核显）
export OLLAMA_GPU_LAYERS=999

# 设置线程�?export OLLAMA_NUM_THREADS=8

# 内存相关
export OLLAMA_FLASH_ATTENTION=1

与其他设备对�?

核显对比

设备	核显	TFLOPS	7B Q4速度
8845HS	780M	8.9	15 token/s
锐龙7 7840HS	780M	8.9	15 token/s
Intel Ultra 7 155H	Arc 8	8.3	12 token/s
N100	UHD 24	0.5	无法运行

与显卡对�?

设备	价格	7B Q4速度	功�?
8845HS Mini PC	¥4000	15 token/s	45W
RTX 3060 12G	¥1800	45 token/s	170W
RTX 4060 Ti	¥2800	60 token/s	120W
Apple M4 Pro	¥9000	30 token/s	30W

实际应用场景

不适合场景

**13B+大模�?：即使量化也跑不�?2. 实时翻译：延迟较�?3. **长文本分�?：内存不�?4. **高并�?*：只能单用户

总结

8845HS�?目前性价比最高的本地大模型运行平�?�?B Q4模型可以流畅运行，响应速度15 token/s左右，完全满足个人使用需求�? **下一步建�?*�?- 搭配16GB内存（双通道�?- 使用Qwen2.5-7B模型

配合OpenWebUI获得更好的交互体�? 相关文章�?- Mini PC处理器天梯图
Ollama本地部署指南

8845HS性能实测：能跑多大本地大模型

8845HS性能实测：能跑多大本地大模型

为什么用Mini PC跑大模型�?

8845HS硬件规格

量化模型参数对照�?

常见模型量化级别

内存带宽限制

实测数据

llama.cpp 基准测试

实际对话体验

能跑多大的模型？

推荐配置

结论

Ollama配置优化

建议设置

推荐模型列表

与其他设备对�?

核显对比

与显卡对�?

实际应用场景

推荐使用场景

不适合场景

总结