1.3 国内外研究现状分析

为了提高航空装备的作战效能,有效应对未来空战的潜在威胁,随着计算机技术和人工智能技术的发展,目前国内外专家学者对空战辅助决策系统开展了大量研究,其中部分研究已经应用于工程实践。

1.3.1 空战态势评估研究现状

态势评估是空战决策的基础, 客观的评估结果是智能空战辅助决策的关键环节。为了使空战辅助决策系统早日应用于工程实践,专家学者针对态势评估进行了大量研究。 空战态势评估分析方法主要有非参量法和参量法两类。非参量法是将空战双方的态势信息进行定量化分析,提取出可以充分体现空战态势特征和便于量化分析的态势因素, 主要包括优势函数法、人工势场法、模糊评价法和神经网络法等。参量法也称为不确定理论方法,它通过概率论相关知识刻画各个评价指标间的关系,主要包括贝叶斯网络、DS 证据理论等。

1. 国外研究现状

文献[18]中 R. P. Narayana 等人基于模糊逻辑和贝叶斯网络混合技术,开发了一种用于空战态势评估的决策支持系统——智能空战态势评估系统。该系统重点研究了飞行员的心理模型,集成了平台模型、传感器模型、实验心理模型和数据处理算法。

文献[19]中 S. Das 等人提出基于概率贝叶斯信念网络技术的战场态势评估方法,通过实时构建信念网络、评估复杂变化的空战过程,提高了贝叶斯网络的推理效率。

2. 国内研究现状

文献[20]中杨任农等人通过聚类分析对空战态势进行分类,提取出反映目标的关键特征,对目标进行分类,并在模糊推理理论的基础上完成态势评估。

文献[21]中吴文海等人以导弹攻击区理论为基础,分析了传统空战评估模型在构造角度优势函数、速度优势函数、高度优势函数、距离优势函数时存在的不足,并针对能量优势模型的不合理性,重新构造速度优势函数、高度优势函数和角度优势函数,改进了原有的态势评估模型。

文献[22]中史振庆等人针对态势评估模型中较少考虑敌方攻击区影响的问题, 在空空导弹数学模型的基础上,利用快速模拟法求得攻击区,以此为基础构建评价指标函数,加入目标机对我机的影响因素,使评价结果更加客观、全面。

文献[23]中周焘等人类比势场提出基于人工势场理论的态势评估方法,将敌机对我方的威胁及我机编队之间的协同量化为威力势和斥力势,以此来进行态势评估和后续的指挥引导。

文献[24-25]中张涛等人、文献[26]中常一哲等人和文献[27]中李志强等人基于人工势场理论构建空战环境的人工势场,重点分析了势场函数的构建机理,以及各个评价指标间动态权重的建立,为后续建立人工势场启发粒子群的空战决策提供依据。

文献[28]中 Li Gang 等人利用模糊层次分析法对反映战场态势的元素加权求和,得到综合的态势评估函数。

文献[29]中肖亮等人在 4 种特点态势环境下,从空战环境变化和编队能力两个方面进行分析,采用主成分分析法提取关建态势因素,降低评估复杂度,同时采用神经网络赋权的方法弥补了评估中主观性强和权重局部收敛的缺点。

文献[30]中王向华等人采用层次分析法获取空战状态的训练样本对,通过径向基网络确定各个状态变量之间的非线性关系,以综合威胁指数为训练目标。经过对径向基网络的学习,可以较好地逼近各个评价指标之间的权重关系,弥补了人工赋权主观性强的缺点。

文献[31]中王昱等人基于证据网络对战场的态势估计模型设计了威胁等级评估推理方法,通过引入时空融合思想和变权机制,构建动态的证据网络态势评估模型,改善了由于证据失真导致评估结果不合理的问题。

文献[32]中顾佼佼等人针对空战过程中采集信息不完备、评估结果可信度不高的问题,基于区间集对分析将区间值转换成联系数进行评估,并采用粒子群寻优的方法确定各个指标权重,这在一定程度上提高了评估结果的可信度。

1.3.2 空战辅助决策研究现状

空战辅助决策是一个动态决策问题,需要根据态势评估结果,采取对应的机动动作。目前,国内外专家学者对机动决策问题展开了大量研究。求解该问题的方法主要集中在基于规则的专家系统法、影响图法、微分对策法、动态规划法、智能优化算法和强化学习法等。

1. 国外研究现状

文献[33]中 Burgin G. H.等人通过建立态势分析结果与机动策略的映射关系来模拟飞行员的决策过程。由于专家系统法简单易行,因此已经广泛应用于国外的工业实践中。 但是专家系统法也面临着移植性较差、机动动作库构造复杂的缺点。

文献[34]中 Y. C. Ho 等人将空战机动决策问题简化为追逃问题,在文献[34]的基础上建立线性追逃模型,以机动极值作为控制变量,分析飞行员的决策过程。

文献[35]中 H. Park 等人基于微分对策理论提出了一种空战机动决策自动生成方法。该方法在态势函数的基础上,构建得分函数矩阵,基于微分博弈进行计算,在动态变化的空战环境下求解最优机动。

文献[36]中 V. Kai 等人基于多级影响图法论述了机动决策的各种影响因素,在充分考虑飞行员在不确定条件下偏好的基础上,建立了飞机的动力学模型, 并将多级影响图转化为非线性规划求解的动态优化问题,求解出给定偏好情况下的最优机动决策。

文献[37]中 R. E. Smith 等人建立了空战机动规则,以规则为遗传算法的个体,基于遗传算法构建空战决策模型,通过遗传算法寻优求解对应的机动策略。

文献[38]中 J. S. Mcgrew 等人以一对一空战决策问题为研究对象,将三维空战问题简化为二维平面的机动决策问题, 基于近似动态规划法解决了小规模状态空间的追逃问题, 但是在求解大规模状态空间问题时容易出现维数灾难问题。

2. 国内研究现状

文献[39]中魏强等人通过构建专家规则,对空对地作战的战术机动进行研究,在规则库的基础上,设计了对地攻击智能决策系统的原型。

文献[40]中傅莉等人在系统分析了专家系统法求解空战决策问题后,针对专家规则法适应性较差的问题,将滚动时域法作为决策系统的备份控制方法,这在一定程度上弥补了专家系统法的不足。

文献[41]中祝世虎等人和文献[42]中王炫等人将专家系统和遗传算法相结合,建立了进化式的专家系统模型,解决了决策系统在面临不确定情况时灵活性差的问题。

文献[43]中万伟等人在分析了空战决策的各种影响因素后,建立单步预测的多级影响图机动决策模型, 通过求解离散空间的纳什均衡问题,获得效能值最大的最优控制量。

文献[44]中钟麟等人针对在不确定情况下求解机动决策问题时,多级影响图法计算量大的问题,提出分层优化策略,利用进化算法求解最优机动策略。

文献[45]中周思羽等人针对影响图法在求解时,先验似然函数确定难的问题,将随机决策理论引入决策模型,提出了基于随机准则的改进多级影响图机动决策方法。

文献[46]中钟友武等人通过预测空战双方的运动状态,将机动决策的双边问题简化为两个单边极值问题,降低了计算的复杂度,拓宽了微分对策的应用范围。同时,采用逐级淘汰的战术评价方法求得最优战术机动。

文献[47]中黄长强等人将空战决策问题简化为序列决策问题,利用近似动态规划理论,在每个决策时域,提出人工势场引导下的改进蚁狮优化算法,有效减少了策略搜索的时间。

文献[48]中梅丹等人提出零和微分对策的近似动态规划法算法,结合空战场景的态势评估函数,求解博弈双方的均衡策略。

文献[49]中徐安等人基于强化学习的框架对空战隐蔽接敌决策问题进行研究,针对状态空间连续引起的维数灾难问题,采用最小二乘拟合法对状态值函数近似求解,通过贝尔曼迭代求解最优隐蔽接敌策略。

文献[50]中孙楚等人针对连续动作空间的无人机机动决策问题,通过 Actor-Critic 强化学习框架提出基于高斯分布的连续动作选择策略,提升了模型的健壮性。

文献[51]中左家亮等人提出一种启发式的分层强化学习机动决策方法,采用神经网络启发后续的策略搜索,提高了搜索效率。

总之,基于微分对策法的决策系统由于受限于具体的数学模型,可移植性较差;影响图法在一定程度上给出了合理的空战决策行为,但是没有通过全局的战场态势信息构建决策模型,无法满足高强度的空战需要,很难应用到实践中;专家系统法通过建立态势与机动策略的映射关系来模拟飞行员的决策过程,但是专家系统难以构建完备的规则模型,并且通用性较差。非学习策略的决策方法将空战问题考虑成一个典型的数学问题,不能对空战环境进行仿真,在求解机动决策过程中,没有与空战环境的交互过程。学习策略的决策方法主要利用智能体与环境的交互信息,包括历史数据及在线实时数据,通过在未知环境下的交互,迭代求解最优的机动决策,因此基于学习策略的决策方法在面临动态复杂环境时具有较强的健壮性。本书将着重对学习策略的机动决策方法进行研究。