定制算法需求&开发说明

文章正文
发布时间:2025-07-26 12:41

image-20250425161759530.png

0. 定制须知

定制算法前需确认算法需求是否属于【图像处理】【视频分析】【机器视觉】【多模态大模型】领域。如果是,请继续阅读以下文档。如果不是,请联系销售人员评估。

定制算法是运行于智驱力智能分析盒子或智能分析服务器产品上。目标设备非智驱力产品,联系销售人员评估。

定制算法的开发周期是需求明确且数据到位后1-2周,紧急上线的客户需加快需求沟通与数据采集进度。

定制算法是以算法包的形式交付,无需联调与现场调试。

定制算法初次上线可能存在误报,对于误报情况,需迭代2-3轮达到目标效果。

1. 需求说明

点此下载需求说明模板

1.1. 整体描述

需清晰描述算法的业务需求。业务需求与算法逻辑依次说明。建议使用以下方式。

需求点需求描述业务逻辑
轨道障碍物检测   识别矿车轨道上的人员、大石块、前方机车三种障碍物。并输出障碍物到车头的距离。   摄像头安装于矿车车头上方。前向捕获轨道画面。当识别到画面中的轨道上存在人员、大石块、前方机车三种障碍物,触发告警,并计算障碍物到车头的距离。告警数据可通过http接口推送。  
大块矿石检测   识别下料口放矿机上的大块矿石。   摄像头视角可清晰覆盖下料口。当识别到下料口放矿机上的大块矿石触发告警。告警数据可通过http接口推送。  
1.2. 附图说明

提供每个需求点的附图,并详细说明业务需求。如检测的目标、正样本(正常状态)、负样本(异常状态)以及告警触发时刻等。以轨道障碍物检测算法为例进行说明。

1.2.1. 轨道障碍物检测算法

image-20250425103124156.png

附图1:安装示意图

对检测场景进行描述。举例说明,如上,摄像头安装于矿车车头顶部。检测位于轨道上的障碍物。并输出障碍物到车头的距离。

image-20250425103736407.jpg

附图2:前方机车障碍物

图文结合,说明算法检测业务逻辑与需求点。举例说明。提供需求中的人员、大石块、前方机车三种目标障碍物的【摄像头视角下】的现场画面(不要使用手机拍摄)。并说明整体逻辑与需求要点。

详细需求描述:

整体逻辑:检测到位于轨道上的人员、大石块、前方机车产生告警,输出障碍物至机车距离。

需求点1: 算法自动检测轨道(直道、弯道)。

需求点2: 位于轨道内的障碍物告警,其余位置无需关注。

需求点3: 告警时标注轨道目标、障碍物目标与距离。

1.2.2. 大块矿石检测算法

1.jpg

附图3 大块矿石

图文结合,说明算法检测业务逻辑与需求点。举例说明。提供大块矿石【摄像头视角下】的现场画面。并说明整体逻辑与需求要点。

详细需求描述:

整体逻辑:在蓝色框内检测到大块矿石告警。肉眼观测超过上图红色框大小的矿石,判定为大块矿石。

需求点1: 只关注下料口位置的大块矿石。

需求点2: 可设置大块矿石的像素阈值,超过像素阈值的告警。

1.3. 能力要求

详细描述每个定制化需求的能力要求,智驱力进行技术可行性评估。使用如下例子进行说明。

需求1:轨道障碍物检测算法

可检测出30m以内,肉眼可见的人员、大石块、前方矿车目标。

检测准确率不低于90%。

检测帧率不低于10帧/秒。

需求2:大块矿石检测算法

可检测出10m以内,肉眼可见的放矿机下料口大块矿石。

检测准确率不低于90%。

检测帧率不低于2帧/秒。

1.4. 补充资料

为更加高效的评估定制算法的可行性与开发费用。除以上说明外,需提供如下内容。

提供需求点中多场景的摄像头视角下视频或图像素材(需求评估用,不是开发用)

比如:轨道障碍物检测算法。提供不同场景下轨道与障碍物素材。比如,

隧道内光线明亮视频或图片素材。

隧道内光线不足视频或图片素材。

隧道外光线明亮视频或图片素材。

隧道外光线不足视频或图片素材。

技术补充资料(需求评估用,不是开发用)

比如,额外的告警推送字段需求。提前告知智驱力,以便评估可行性。比如,

希望在轨道障碍物检测算法告警推送中,增加障碍物距离的字段。

希望在告警快照的障碍物label中增加距离显示。

2. 开发说明

完成需求文档的技术评估、双方签订技术服务合同、款项到位且数据到位后。智驱力将启动定制算法开发工作。各部分的详情如下。

2.1. 数据采集 2.1.1 采集要求

安装完成摄像头并调整完成角度采集如下视频素材。每个场景采集5-10段,3-5分钟的有效视频片段。(注:在摄像头安装或角度调试过程中,可申请智驱力技术支持),采集场景尽量覆盖全场景,且具备多样性。

场景1:不同光线、距离下的5-10段3-5分钟有效视频。

场景2:不同光线、距离下的5-10段3-5分钟有效视频。

...

注:有效视频是指包含需求中检测目标的视频。视频应当包含正负样本,即正常的与异常的,建议正常与异常数量比例1: 1。

视频采集方式如下。

5a3595a3a2266423dc65873d65b8c168.jpg

在浏览器中输入摄像头IP地址,登录摄像头管理页面;

点击①处【录制】按钮,再次点击【录制】按钮保存素材;

2.1.2 数据发送

将采集的视频文件进行整理。文件夹建议结构如下。

image-20250425154029106.png

将采集的视频压缩成zip文件,通过【网盘链接】的方式分享至算法定制群,有技术人员负责对接与视频质量验证。

2.2. 算法开发

数据集到位后,智驱力将负责数据处理、数据标注、模型训练、算法开发&测试全部工作。整个开发周期是数据到位后1-2周。

2.3. 算法交付

算法开发完成后,将进行算法交付,包括如下内容。

算法包。开发完成的算法包,直接从【算法仓库】-【算法导入】中导入,并在【视频接入】中绑定算法生效。

使用说明。提供定制化算法的使用说明文档,指导算法配置与使用。

2.4. 算法优化

若视频数据场景多样性不足,初次上线可能存在漏报或误报。如出现以上问题。处理方法如下。

算法识别出现漏报和误报该如何处理?

结语

每个算法需严格按照场景要求与工勘约束配置使用。为此,我方在技术评估后,会明确给出算法的使用条件与能力上限,以便在现场投产中达到使用预期。因此,定制算法在需求沟通中需保持清晰、明确、高效的沟通,从而确保算法快速、精准落地。