华为云Flexus+DeepSeek征文|华为云快速搭建Dify-LLM平台并开发发票识别助手应用实战

发布于:2025-06-27 ⋅ 阅读:(12) ⋅ 点赞:(0)

目录

前言

1 华为云快速搭建 Dify-LLM 应用平台

1.1 简要介绍华为云一键部署 Dify 平台

1.2 通过四步进行部署

1.3设置管理员账号,登录 Dify 平台

2 接入华为云自定义 DeepSeek 的 LLM 模型

3 开发发票识别助手应用

3.1 开始

3.2 文档提取器

3.3 LLM

3.4 直接回复

4 运行与集成发票识别助手应用

4.1 预览

4.2 正式运行

4.3 嵌入网页

4.4 API 调用

5 使用体会与建议

结语


前言

在大模型应用逐渐深入各行各业的今天,如何快速搭建一个可自定义、易扩展的大模型应用平台成为了开发者关注的热点。Dify 是一个开源的 LLM 应用开发平台,支持图形化工作流设计、丰富的模型接入方式和完善的权限管理,能够极大地加快 LLM 应用的开发和部署效率。

本文将以华为云为基础环境,通过“一键部署”的方式快速搭建 Dify 平台,并详细演示如何接入自定义大模型(如 DeepSeek 模型),以及使用工作流创建一个实用的发票识别助手应用。最后,我们还将演示如何运行该应用并集成至网页或系统中,分享使用体验。

1 华为云快速搭建 Dify-LLM 应用平台

1.1 简要介绍华为云一键部署 Dify 平台

华为云提供了丰富的应用部署模板,开发者可以通过“一键部署”方式,快速完成包括 Dify 在内的多个开源项目的自动化部署。通过云市场或资源编排服务(HECS+ROS+CCE等组合),用户无需手动配置服务器、数据库、存储等资源,仅需填写少量参数即可完成整套系统的搭建,极大地降低了使用门槛。

Dify 的核心优势在于支持多模型接入、工作流式应用构建、知识库扩展、API集成等,适合中小型企业、独立开发者及AI创业团队构建自己的垂直大模型产品。

1.2 通过四步进行部署

在华为云部署 Dify 平台通常只需四个步骤。 选择部署模板 登录华为云控制台,搜索 Dify 应用模板,点击“下一步”。 配置部署参数 填写服务器规格、数据库密码、管理员信息等关键参数。 资源栈设置 确定资源栈名称、区域及是否自动创建VPC网络,建议新用户使用默认设置。 确认部署配置并创建资源栈 核对配置信息后,点击“部署”即可触发资源编排引擎自动创建并配置所有资源。

部署过程一般在 10~20 分钟内完成,视资源情况而定。

1.3设置管理员账号,登录 Dify 平台

部署成功后,通过访问 Dify Web 控制台地址(通常为绑定域名或IP+端口),即可进入初始页面。

首次登录时会提示创建管理员账号,设置完成后,即可进入完整的 Dify 管理后台。

2 接入华为云自定义 DeepSeek 的 LLM 模型

为了实现更高的定制化能力和满足企业对数据本地化处理的需求,我们可以通过 Dify 平台接入部署在华为云 ModelArts Studio 上的大模型,如 DeepSeek 等国产语言模型。ModelArts Studio 提供了便捷的大模型托管与推理服务,支持标准 API 接入,开发者只需在 Dify 中配置模型调用地址和鉴权信息,即可将私有模型无缝集成进应用工作流,构建专属的大模型智能服务。

在 Dify 后台,依次进入「模型与提供商」配置页。 点击「新增模型提供商」,选择“通用 API 模型”,填写以下信息:名称:DeepSeek 本地模型,模型地址:例如 http://your-deepseek-endpoint/v1/chat/completions,API Key 或 Token:根据实际服务设置,支持模型:如 deepseek-chat, deepseek-coder 等

配置成功后,在工作流节点中即可选择该模型完成推理调用。

3 开发发票识别助手应用

Dify 的工作流设计采用图形化拖拽方式,逻辑清晰,非常适合开发如发票识别、合同解析、报销辅助等结构化文本处理场景。我们以“发票识别助手”为例,构建如下工作流:

  • 开始(输入发票PDF)
  • 文档提取器(提取文本)
  • LLM(结构化识别)
  • 直接回复(返回JSON与原文件)

3.1 开始

该节点用于上传发票文件。一般来说,发票多为 PDF 格式,上传后将传递给下一个处理节点。

参数设置建议:

  • 支持格式:.pdf
  • 最大文件大小:5MB
  • 多文件支持:否(本例为单文件场景)

3.2 文档提取器

此节点将 PDF 文件转换为可解析的文本内容。内部使用了 OCR(若为扫描件)或 PDF 文本提取器模块,自动识别其中的文字内容。

你可以选择使用 Dify 内置的文档解析器,也可以连接自定义的文档处理服务。

3.3 LLM

该节点是识别流程的核心。我们使用接入的 DeepSeek 模型,通过 Prompt 编排的方式,让模型提取发票中关键字段并输出结构化数据。

示例提示词:

#任务
根据这张发票的内容{{#context#}},其中内容格式机器编号、发票代码、发票号码、开票日期、校验码、购买方名称、购买方纳税人识别号'、购买方地址、电话、开户行及账号、货物或应税劳务、服务名称、规格型号、单位、"数量、单价、金额、税率、税额、价税合计(大写)、价税合计(小写)’、销售方名称、销售方纳税人识别号、销售方地址、电话、销售方地址、电话、开户行及账号、"备注、"收款人、复核、开票人’字段返回信息。返回的结果信息以json格式返回

返回结果:

{
 "发票代码": "12345678",
 "发票号码": "98765432",
 "开票日期": "2025-06-25",
 "金额": "1234.56",
 "销方单位": "某某有限公司"
}

3.4 直接回复

最后,我们使用“直接回复”节点,将识别结果展示给用户,并可附带原始发票文件下载链接。

输出方式可选择“文本”、“JSON结构”、“表格”甚至“卡片样式”,提升可视化体验。

4 运行与集成发票识别助手应用

Dify 支持应用的多种运行方式,我们可以在平台内运行、分享链接或通过 API 集成到外部系统中。

4.1 预览

在应用详情页点击「预览」,可以进入简洁的 Web UI 页面,模拟终端用户的操作流程。上传发票后,系统将自动执行工作流,展示识别结果。

4.2 正式运行

点击「发布」,即可将应用标记为可运行状态,并生成唯一访问地址,供终端用户或测试人员使用。

4.3 嵌入网页

Dify 自动生成一个 iframe 嵌入代码,开发者可将其嵌入到公司官网、后台管理系统或 CRM 系统中,实现无缝集成。

嵌入代码示例:

<iframe
src="http://121.36.58.29/chatbot/4YmZLRDKOdH5A1mC"
style="width: 100%; height: 100%; min-height: 700px"
frameborder="0"
allow="microphone">
</iframe>

4.4 API 调用

Dify 为每个应用提供独立的 API 接口,支持 POST 请求上传文件并返回结构化结果,方便与业务系统进行对接。

以下是接口使用示例:

  • 接口地址:https://your-dify-domain/api/v1/apps/xxx/run
  • 请求方式:POST(multipart/form-data)
  • 返回格式:JSON

5 使用体会与建议

通过本次实践,我们对 Dify 的能力与华为云平台的协同部署有了较为全面的认识。总结如下:

项目

优点

建议

一键部署

快速、稳定,适合企业初次使用

建议提前规划资源规格

模型接入

支持本地/私有化部署模型

推荐使用 DeepSeek 等国产模型

工作流构建

图形化、模块化,开发门槛低

可扩展更多预处理节点

应用集成

支持 Web、嵌入、API 三种模式

建议使用 API 与业务深度结合

总体而言,Dify 在企业级 LLM 应用场景中具备非常强的落地能力,而华为云作为部署基础,则提供了安全、弹性、成本可控的运行环境。

结语

通过本文的介绍,相信你已经掌握了如何在华为云快速搭建 Dify 平台,并基于工作流构建出一个结构化文本处理应用——发票识别助手。未来还可扩展到合同审核、身份证提取、财务对账等多个垂直领域,打造专属于你的 AI 产品。


网站公告

今日签到

点亮在社区的每一天
去签到