问题定义
预测性维护不是「预测一切故障」,而是在可接受的误报率下,尽可能早地发现异常,给运维留出反应窗口。
航空装备场景的特殊性:
- 传感数据异构 — 振动、温度、电流、图像,采样率差几个数量级
- 故障样本稀缺 — 真正有价值的异常事件可能一年几次
- 可靠性要求极高 — 漏报代价远大于误报
架构分层
传感层 → 边缘采集 → 时序对齐 → 特征工程 → 检测/预测 → 工单闭环
我的实践经验是:先做对齐,再做模型。不对齐的数据喂给再复杂的模型也是垃圾进垃圾出。
异常检测的混合策略
纯规则:可解释、上线快,但覆盖有限。
纯 ML:覆盖面广,但冷启动难、可解释性差。
当前方案是 规则 + 无监督/弱监督 ML 并行:
- 硬阈值覆盖已知模式
- Isolation Forest / LSTM-AE 覆盖未知漂移
- 人工复核反馈进入标注池
寿命预测
RUL(Remaining Useful Life)模型对标注质量敏感。我们在数据不够时退化为退化趋势监测 — 不给出精确天数,而是给出「进入关注区间」的信号。
这对运维团队反而更实用。
待深入
- 边缘推理 vs 云端批处理的延迟预算
- 多装备联邦学习的可行性
- 与 MRO 工单的 API 集成规范