基于RK3588+FPGA+AI YOLO全国产化的无人船目标检测系统(二)平台设计

发布于:2025-04-22 ⋅ 阅读:(10) ⋅ 点赞:(0)

基于项目需求确定国产 AI
平台的总体架构设计,完成硬件单元的选择和搭建以及开发工具链的配置工作。
4.1 国产 AI 平台总体架构
本文设计了一套灵活高效的国产 AI 平台总体架构,设计方法是在嵌入式平
台上使用串行总线( Peripheral Component Interconnect express PCIe )或者 RJ45
以太网口,采集 1080P 大小的图像数据流,再通过相关硬件单元和软件环境的协
同工作,实现对目标检测算法的前向推理和检测效果的实时显示。因此设计了如
4-1 所示的处理流程架构。
从上图可以看出处理的主要流程为:
1 )通过上位机完成算法开发工作,将程序烧写至计算处理模块上;
2 )视频采集模块通过摄像头获取实时检测画面。通过基于 FPGA 的图像
采集设备将数据经过 PCIe 接口传送至计算处理模块,或者通过网络摄像头直接
传送至计算处理模块中的视频处理芯片;
3 )计算处理模块中的 CPU 控制视频处理芯片的编解码实现,将满足模型
格式需求的像素值传送至 NPU 进行前向计算,将推理完成的结果送至 CPU 进行
后处理,在 GPU 上进行图像界面和相应功能的显示;
4 )完成图像检测结果的存储并在结果显示模块上实时输出。
4.2 国产 AI 平台硬件方案
在完成国产 AI 平台的总体架构设计后,需要进行计算平台、采集卡和摄像
头的选型工作。选择合适的硬件设备可以确保国产化、实时检测以及性能稳定性。
首先,计算处理模块的选型需要结合平台的实时检测需求和性能要求,它负
责对采集到的视频数据进行实时的目标检测和分析,因此需要选择性能稳定、计
算能力强大的设备,以确保平台能够实时响应并准确识别目标。
其次,采集卡的性能直接影响到视频数据的传输速度和稳定性,因此需要根
据平台的需求选择适当的采集卡,确保其能够满足高速数据采集和稳定传输的要
求。
最后,对于摄像头的选型,需要考虑到拍摄画质、视野范围、光线条件以及
防护等因素。选择适合的摄像头可以确保平台获得高质量的视频输入,从而有利
于后续的目标检测和分析。
4.2.1 国产 AI 芯片选型
根据在网络中的位置, AI 芯片可以分为云端、边缘和终端三大类 [63] 。云端
AI 芯片主要用于数据中心或云计算平台,用于处理大规模的数据和复杂的计算
任务。边缘 AI 芯片在接近数据源的地方进行实时数据处理和分析,通常具有较
低的功耗和较小的尺寸,能够在资源有限的环境中执行深度学习推理任务。终端
AI 芯片是专门为物联网设备和嵌入式系统设计的,以实现本地的智能感知和决
策,通常具有极低的功耗和极小的尺寸,能够在资源极其有限的设备上运行轻量
级的深度学习模型。
目前,结合特定场景的应用已经成为推动 AI 产业发展的主要动力,因此国
内厂商纷纷投入到 AI 芯片的研发与生产中。表 4-1 对一些具有代表性的国产 AI
芯片进行了介绍,图 4-2 重点从功耗和性能上对这些芯片进行了对比。
从表 4-1 和图 4-2 可以看出,在综合考虑功耗与算力后,只有海思 Hi3559A
V100 和瑞芯微 RK3588 能够满足课题需求。前者的 AI 框架支持较少,后者的功
耗略高。除此之外,两者在算力和图像处理能力等多方面性能接近,都适合作为
目标检测算法的部署平台。
4.3 国产 AI 平台软件方案
由于 RK3588 硬件资源有限,在国产 AI 平台上进行整个深度学习应用流程
是不可行的。本文结合多方资源,将深度学习开发过程进行了细分,形成了如图
4-7 所示的开发模式。

网站公告

今日签到

点亮在社区的每一天
去签到