粒子滤波器:非线性和非高斯世界中的王者

粒子滤波器:非线性和非高斯世界中的王者粒子滤波器:非线性和非高斯世界中的王者粒子滤波器:非线性和非高斯世界中的王者

大家好,欢迎来到IT知识分享网。

粒子滤波器技术在非线性和非高斯系统中的优越性决定了它的广泛应用。此外,粒子滤波器的多模态处理能力是其广泛使用的原因之一。在国际上,粒子滤波已经应用于各个领域。

粒子滤波器:非线性和非高斯世界中的王者

  • 在经济学领域,它被用于经济数据中。粒子滤波技术在非线性和非高斯系统中的优越性决定了它的广泛应用。此外,粒子滤波器的多模态处理能力是其广泛使用的原因之一。在国际上,粒子滤波已经应用于各个领域。数字随处可见,当它们被收集和记录时,我们将它们称为数据。机器学习是从数据中学习数学模型的科学。这些模型一旦从数据中学习
  • 在军事领域,它已应用于雷达跟踪空中物体,空对空,空对地被动跟踪
  • 在交通控制领域,它适用于汽车或人的视频监控。
  • 在视觉分析领域,已经使用粒子滤波器开发了视频序列中的新技术。
  • 它还用于机器人的全球定位。

现在通过粒子模拟解决了传统分析方法无法解决的问题。

在模型选择,动态系统的故障检测和诊断,基于粒子的假设检验,粒子多模型,粒子似然比检测和其他方法已经出现。

在参数估计方面,静态参数通常作为扩展状态向量的一部分,但由于参数是静态的,因此粒子将快速退化为样本。为避免退化,常用的方法是人为地增加静态参数的动态噪声。

核心平滑方法和Doucet等人提出的点估计方法。避免参数的直接采样,并使用粒子框架下的最大似然估计(ML)和最大期望值(EM)算法直接估计未知参数。

揭开粒子过滤的神秘面纱

粒子滤波器(PF:粒子滤波器)的思想基于蒙特卡罗方法,该方法使用粒子集来表示概率,并且可以用于任何形式的状态空间模型。

核心思想是通过从后验概率中提取随机状态粒子来表达其分布。它是一种顺序重要性采样方法(Sequential Importance Sampling)。

粒子滤波器:非线性和非高斯世界中的王者

简单来说,粒子滤波方法是指通过找到在状态空间中传播的一组随机样本来近似概率密度函数并用样本均值替换积分运算来获得状态最小方差分布的过程。

这里的样本是指粒子,当样本数N→α时,它可以近似任何形式的概率密度分布。

虽然算法中的概率分布只是实际分布的近似值,但由于非参数特征,在解决非线性滤波问题时可以摆脱随机量必须满足高斯分布的约束,并能表达出来。比高斯模型更广泛的分布。

它还具有更强的能力来模拟可变参数的非线性特征。因此,粒子滤波可以基于观测和控制量准确地表达后验概率分布,这可以用于解决SLAM问题。

粒子滤波的发展

粒子滤波器:非线性和非高斯世界中的王者

马尔可夫链蒙特卡罗改进策略

马尔可夫链蒙特卡罗(MCMC)方法通过构造具有良好收敛性的马尔可夫链来从目标分布产生样本。在SIS的每次迭代中,MCMC被组合以将粒子移动到不同的位置以避免退化,并且马尔可夫链可以将粒子推向更接近概率密度函数(PDF)。使样本分布更合理。

Unscented粒子滤波器(UPF)

Unscented卡尔曼滤波器(UKF)由Julier等人提出。EKF(扩展卡尔曼滤波器)使用一阶泰勒展开近似非线性项,并用高斯分布近似状态分布。UKF类似于EKF,其高斯分布近似于状态分布,但是没有线性化,仅使用少量称为Sigma点的样本。

在这些点通过非线性模型之后,所获得的均值和方差可以精确到非线性展开泰勒的二阶项,这使得非线性滤波更准确。Merwe等人提出使用UKF来生成PF的重要性分布,称为Unscented Particle Filter(UPF)。UKF生成的重要性分布大于实际状态PDF的重叠,估计精度更高。

数据科学与机器人中的粒子滤波

粒子滤波器现在广泛用于金融市场模型的估计,特别是随机波动率模型。

粒子滤波器方法是递归贝叶斯滤波器,当模型是非线性的并且当噪声不是高斯时,它提供了方便且有吸引力的方法来近似后验分布。

这些技术为许多问题提供了一般解决方案,其中线性化和高斯近似是难以处理的或者会产生太低的性能。非高斯噪声假设和对状态变量的约束的结合也可以以自然的方式执行。此外,粒子滤波器方法非常灵活,易于实现,可并行化并且适用于非常一般的设置。

使用粒子滤波器进行机器人定位

粒子滤波器:非线性和非高斯世界中的王者

一个室内机器人在办公室内导航:

粒子滤波器:非线性和非高斯世界中的王者

机器人在地图上的近似位置

粒子滤波器解决了应用机器人中的许多问题。假设我们可能有我们想要跟踪的移动对象。也许这些物体是战斗机和导弹,或者我们正在追踪人们在田野里打板球。这并不重要。让我们考虑一下三维机器人问题的特征:

  • 多模式:我们希望同时跟踪零个,一个或多个对象
  • 遮挡:一个对象可以隐藏另一个对象,从而对多个对象进行一次测量
  • 非线性行为:飞机受到风的冲击,球以抛物线运动,人们相互碰撞
  • 非线性测量:雷达给我们到物体的距离。将其转换为(x,y,z)坐标需要平方根,这是非线性的
  • 非高斯噪声:当对象在背景中移动时,计算机视觉可能会将部分背景误认为是对象
  • 连续:物体的位置和速度(即状态空间)可以随时间平滑变化
  • 多变量:我们想要跟踪几个属性,例如位置、速度转、弯率等
  • 未知的流程模型:我们可能不知道系统的流程模型
粒子滤波器:非线性和非高斯世界中的王者

局部姿势的初始假设是有噪声的,因为我们可以看到点遍布网格(地图)。随着机器人进一步移动,粒子会聚,这解释了粒子的会聚。

在仓库中导航的室内机器人可以使用粒子滤波器根据测距传感器(如2D激光扫描仪)的输入进行定位,或者可用于融合传感器输入并确定道路上的车道标记。无人机可以使用粒子滤波器来优化光流。

强化学习算法和粒子滤波器

粒子滤波器:非线性和非高斯世界中的王者

人工智能的背景下,强化学习是一种动态编程,它使用奖励和惩罚系统来学习和完善算法。

基于粒子滤波器的强化学习(RL)算法计算成本低,并且具有非常低的存储器占用空间。包括基于粒子过滤器的直接全局策略搜索的RL算法将在由所选策略参数化定义的策略空间中执行搜索。

粒子滤波器可以是RL算法的核心概念,可以通过创建粒子来指导探索和利用,每个粒子代表整个策略。由于粒子滤波器执行全局搜索的能力,所得到的RL算法应该能够在策略空间中进行直接全局搜索,这是对基于传统本地搜索的策略RL的显着改进。

粒子滤波器:非线性和非高斯世界中的王者

这增加了价值,因为它继承了粒子滤波器的许多优点,其中包括:

  • 它实现起来非常简单,可以在嵌入式系统中轻松实现在线学习
  • 它可以通过改变σ参数的值,根据可用资源(时间和CPU方式)使用自适应计算
  • 它可以将RL探索的努力集中在政策空间的最重要部分,
  • 通过改变初始噪声水平和衰减因子λ,它可以根据精度和时间的要求表现出自适应收敛速率

粒子滤波的不利因素

虽然粒子滤波算法可以作为解决SLAM问题的有效手段,但算法中仍存在一些问题。主要问题是需要大量样本来近似接近系统的后验概率密度。机器人面临的环境越复杂,描述后验概率分布所需的样本就越多,算法就越复杂。

因此,可以有效减少样本数量的自适应采样策略是算法的重点。此外,重新采样阶段可能导致样本有效性和多样性的损失,导致样本耗尽。如何保持粒子的有效性和多样性以及克服样本的耗尽也是重新采样该算法的重点。

在强化学习中,粒子滤波器作为全局搜索方法的一员,通常需要更多的试验才能收敛,因为搜索的范围是最大可能的 – 整个政策空间。

粒子滤波器没有严格的收敛证明。理论上,我们用全球搜索方法交换了”局部收敛的证据”,这种方法没有全局收敛的证据,但至少保证不会陷入局部最优。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/71254.html

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信