跳转到主要内容
选择与你所构建内容相匹配的接入方式。每条路径都能让你在几分钟内完成从安装到运行模型的全过程。

命令行

在 Windows ARM64 终端运行模型,或通过 Docker 在 Linux ARM64 上运行。最适合快速试用。

本地服务器

在 Windows ARM64 与 Linux ARM64 上提供兼容 OpenAI 协议的 API。

Python SDK

Hugging Face 风格的 API,适合脚本和 Notebook,支持 Windows ARM64 与 Linux ARM64。

Linux (Docker)

Linux ARM64 Docker 镜像,支持 NPU 访问。最适合跃龙 IoT 等平台。

Android SDK

通过 Maven Central 提供 Kotlin SDK,并附带骁龙 8 至尊版的预编译 demo APK。

开始之前

  • 平台与运行环境 —— 选择运行设备平台(Windows ARM64、Android、Linux ARM64)以及与你的模型匹配的运行环境。详见平台与运行环境
  • 模型 —— 了解各运行环境上经过验证的示例,详见模型
  • 使用自有模型 —— 已有 GGUF 或 AI Hub 模型包?详见运行本地模型