本篇将以两个简单的应用场景——验证码识别（图文输入）和视频理解（视频文本输入），向你介绍如何使用 Qwen 2.5 VL 模型。我们将会使用 vLLM 作为推理框架，使用示例则使用 Python 代码和 Cherry Studio。因此同时，本篇也将会简单介绍 vLLM 部署 Qwen 2.5 VL。

前言

这是昇腾推理系列文章的第一篇，在这个系列中我将会依次记录三个目前主流的大语言模型推理实现方式在昇腾环境下的部署过程，依次是 vLLM（针对非 GGUF 模型）、Llama Box(GPUStack，针对 GGUF 模型) 以及华为昇腾生态中的 MindIE 框架。

starwhisper92025年4月29日大约 4 分钟