安装 / pip
pip 安装时出现 SSL 或证书错误(企业代理 / QDC)
pip 安装时出现 SSL 或证书错误(企业代理 / QDC)
常见于启用了 TLS 检测的网络——包括 Qualcomm Developer Cloud(QDC)。预先下载 SDK 并把 pip 指向本地文件。完整 PowerShell 片段见 Python 安装。
Windows SmartScreen 拦截 CLI 安装包
Windows SmartScreen 拦截 CLI 安装包
.exe 尚未代码签名。在 SmartScreen 对话框中点击 More info → Run anyway。CLI
安装后 `geniex` 找不到
安装后 `geniex` 找不到
安装包不会自动加入
PATH。运行:`--compute cpu` 或 `--compute gpu` 在 Qualcomm AI Hub 模型上报错
`--compute cpu` 或 `--compute gpu` 在 Qualcomm AI Hub 模型上报错
Qualcomm AI Engine Direct 仅支持 NPU。请使用
--compute npu(或省略该标志——npu 是 qairt 的默认值)。如需在 CPU/GPU 上运行,改用 llama.cpp 运行环境的 GGUF 模型。服务器
`geniex serve` 返回 'model not found'
`geniex serve` 返回 'model not found'
服务器不会自动下载。先拉取模型:随后重启
geniex serve。Docker 容器看不到 NPU
Docker 容器看不到 NPU
NPU 访问必须带
--privileged 标志。确认你的 docker run 包含它,以及 /usr/lib 的卷挂载。详见 CLI 安装(Docker)。Linux
`docker pull` 报权限错误 / 未授权
`docker pull` 报权限错误 / 未授权
需要同时满足两点:
-
镜像仓库登录。 Docker Hub(
docker.io/qualcomm/geniex)是公开的,无需登录。Qualcomm Container Registry 则需先登录:出现bashLogin Succeeded即成功。 -
加入 docker 用户组。 若
docker pull返回permission denied while trying to connect to the docker API at unix:///var/run/docker.sock,说明当前用户不在docker组:然后重新执行拉取。bash
`geniex` install.sh 报缺少共享库
`geniex` install.sh 报缺少共享库
在全新的 Ubuntu 24.04 ARM64 主机(例如 IQ9075 EVK)上,2. 高通驱动包(来自
PPA(
install.sh——以及 Docker 场景下的预检脚本 check.sh / 容器入口脚本 entrypoint.sh——会检查 libCB.so.1、libOpenCL_adreno.so.1、libcdsprpc.so.1.0.0、libgsl.so.1、libllvm-*.so.1、libpropertyvault.so.0.0.0、libdmabufheap.so.0.0.0,以及 Debian 的 libatomic1 / libglib2.0-0 等库。请在宿主机上分两步安装——如果当前在 geniex 容器内,请先 exit。1. 标准 APT 包满足 geniex 安装器报告的 libatomic1 与 libglib2.0-0 依赖,并提供通用 OpenCL ICD loader:bash
ocl-icd-libopencl1 会在下一步被 qcom-adreno1 替换。ubuntu-qcom-iot PPA)提供 geniex 所需的高通专有库:| Missing library | Provided by |
|---|---|
libOpenCL_adreno.so.1, libCB.so.1, libadreno_utils.so.1, libgsl.so.1, libllvm-*.so.1 | qcom-adreno1 |
libdmabufheap.so.0.0.0 | qcom-libdmabufheap (auto-dep of qcom-adreno1) |
libpropertyvault.so.0.0.0 | qcom-property-vault (auto-dep of qcom-adreno1) |
libcdsprpc.so.1.0.0 | qcom-fastrpc1 |
bash
ppa:ubuntu-qcom-iot/qcom-ppa)在 IQ9075 EVK Ubuntu 镜像中已预配置。qcom-adreno1 会自动拉入 qcom-libdmabufheap 与 qcom-property-vault。完成后在裸机上重新运行 install.sh,或重启容器来验证;“Linking host NPU libraries” 步骤即可成功。若裸机上 libcdsprpc.so / libadsprpc.so 软链接仍缺失,请重新运行 install.sh 重建。容器内可加载模型但推理报 `Failed to create device: 14001`
容器内可加载模型但推理报 `Failed to create device: 14001`
容器无法访问 NPU。确认
docker run 带 --privileged 与 /usr/lib 挂载,并且主机已安装高通驱动包(qcom-adreno1、qcom-fastrpc1)——参见上面的缺少共享库条目。Android
模型可加载,但生成自我重复或无输出
模型可加载,但生成自我重复或无输出
demo(或你的代码)把原始用户文本传给了
generateStreamFlow,而非 chat template 化后的 prompt。Qualcomm AI Engine Direct 流水线把输入视为已格式化——请传 applyChatTemplate().formattedText,而不是原始用户消息。Qualcomm AI Hub 拉取报 `INVALID_INPUT`
Qualcomm AI Hub 拉取报 `INVALID_INPUT`
Android 上 Qualcomm AI Hub 拉取必须显式传
chipset——自动识别仅在骁龙 Windows 上生效。把 ModelPullInput.chipset 设为 "SM8750"(骁龙 8 至尊版)或 "SM8850"(骁龙 8 至尊版 Gen 5)。详见 Android API 参考 → ModelPullInput。Qualcomm AI Engine Direct 加载报 'unknown model name'
Qualcomm AI Engine Direct 加载报 'unknown model name'
Qualcomm AI Hub 返回的 model id 必须匹配 Qualcomm AI Engine Direct 运行环境注册表中的条目(
qwen3_4b_instruct_2507、qwen2_5_vl_7b_instruct 等)。新增 Qualcomm AI Hub 模型需先在 C++ 侧注册——见 third-party/geniex-qairt/models/{llm,vlm}_model_registry.h。Qualcomm AI Engine Direct 拒绝 `nGpuLayers` 或 `nCtx`
Qualcomm AI Engine Direct 拒绝 `nGpuLayers` 或 `nCtx`
Qualcomm AI Hub 模型在编译期固化了 KV 缓存与上下文长度。请保持
nGpuLayers 与 nCtx 为默认值,改用 max_tokens 与 enable_thinking 调节。仍有问题?
GitHub Issues
提交 bug、提需求或浏览开放的 Issue。
Slack
开发者协作。
Was this page helpful?