金属矿山 ›› 2025, Vol. 54 ›› Issue (10): 191-200.
程 宇1 谢丽蓉1 卞一帆1 杨志勇2 胡桂林2 闫 壮1
CHENG Yu1 XIE Lirong1 BIAN Yifan1 YANG Zhiyong2 HU Guilin2 YAN Zhuang1
摘要: 为提升露天煤矿智能网联矿卡的换道决策性能,提出了一种融合深度强化学习与有限状态机的换道决
策方法。首先,构建了一个双层决策框架,上层利用深度Q 网络生成初步换道决策,下层通过有限状态机进行安全性
约束。其次,引入双重网络和竞争网络结构优化DQN 性能,有效缓解了Q 值过估计问题。然后,基于Gipps 安全模型
设计了状态转移规则,动态评估换道间隙的安全性。最后,设计了一个多目标奖励函数,综合评价和引导换道行为。
在Highway-env 平台上进行试验,结果显示,在高交通密度场景下,融合方法换道成功率达81. 36%,相比单一DuDQN
换道成功率(50. 84%)显著提升,碰撞次数减少,行驶稳定性增强。此框架能有效提升决策安全性和效率,对于露天矿
运输换道决策具有一定的参考意义。
中图分类号: