- 基于
llama.cpp源码构建local_llm.exe - 执行 smoke + bench + 性能 + 准确度测试
- 在
test_results/下输出完整报告与图表
- 在当前目录打开终端
- 运行:
./run_all.bat也可以在资源管理器中直接双击 run_all.bat。
- Windows 10/11 x64
- Git(已加入 PATH)
- CMake >= 3.14(已加入 PATH)
- Python 3.9+(已加入 PATH)
- Visual Studio 2022 C++ 工具链(推荐)
run_all.bat:一键执行完整流程CMakeLists.txt:构建入口(生成local_llm.exe)tests/:评测脚本data/appointment_cert_dataset.jsonl:200 条数据集docs/:编译、性能、准确度、技术总结文档lanucher/main.c:用于双击根目录下的local_llm.exe即可执行测试
运行后自动生成(已被 .gitignore 忽略):
llama.cpp/(脚本自动克隆)build/models/*.gguftest_results/
SKIP_BUILD=1:跳过编译SKIP_PERF_PY=1:跳过perf_smoke_test.pySKIP_PIP_MPL=1:不自动安装 matplotlibSKIP_ACCURACY=1:跳过准确度评测ACCURACY_LIMIT=20:只评测前 N 条ACC_N_PREDICT=16:准确度评测每条最大生成 token(默认 16)ACC_NGL=0:准确度评测ngl(有 GPU 可试999)SKIP_ROOT_LAUNCHER=1:跳过生成根目录启动器local_llm.exe
示例(快速调试):
set ACCURACY_LIMIT=20
set ACC_N_PREDICT=32
set ACC_NGL=0
run_all.bat每次运行会创建:
test_results/run_YYYYMMDD_HHMMSS/
常见文件:
test_report.txtperf_smoke_*.jsonperf_smoke_*.mdperf_smoke_*.png(安装 matplotlib 时)accuracy_full.jsonaccuracy_summary.txt
- 若 CMake 报错
nmake/CMAKE_C_COMPILER not set: 说明本机缺少或未加载 VS C++ 构建工具链,请安装/配置后重试。 - 若准确率相关指标偏低:
常见原因是模型能力或输出格式不稳定,可增大
ACC_N_PREDICT,或替换中文能力更强的 GGUF 模型。