金属矿山 ›› 2024, Vol. 53 ›› Issue (11): 192-.
魏晓娟1 李纪云1 巩 闯2
摘要: 在复杂而危险的矿区环境中,矿区无人驾驶车辆的路径规划涉及如何使车辆智能地选择最佳路径,以 实现安全和高效运行。然而,传统的路径规划算法难以有效应对矿区内多变的路况和环境。提出了一种基于分层强 化学习的矿区无人驾驶车辆路径规划算法,该算法通过分层强化学习技术训练图指针网络,求解矿区无人驾驶车辆 路径规划问题。为将矿区无人驾驶车辆节点的向量映射成低维稠密向量,首先对图嵌入层的上下文向量进行均值化 处理,用于保持网络的全局属性。再将交叉熵损失函数的范式加入分层强化学习的基准函数中,用于衡量2 个不同驾 驶车辆间的差异分布程度。试验结果表明:该算法在复杂的矿区环境下能够实现高效、安全、智能的路径选择,且模型 收敛速度、时间花费上的优化效果优于传统算法和专业求解器,并具有良好的适应性和泛化能力。研究结果对于提 高矿区无人驾驶的自主性、效率和安全性具有重要意义。