有话说：什么是随机森林？什么时候使用它？

大家好，欢迎来到IT知识分享网。

全文共1716字，预计学习时长5分钟

来源：ijava

有证据显示神经网络优于许多领域的机器学习算法。后者不断学习，直到得出满足预测值的最佳功能集。

然而神经网络将变量放大成一系列的数字，一旦它完成了学习阶段，对我们来说，特征就变得无法区分了。

如果只考虑预测，神经网络就是一直使用的事实上的算法。但是在行业环境中需要模型，它可以为利益相关者赋予特性或变量意义。这些利益相关者可以是任何人，不只是懂深度学习或机器学习知识的人。

随机森林和神经网络最大的区别是什么？

随机森林和神经网络是不同的技术，学习方式不同，但可以在类似的领域使用。随机森林是机器学习的技术，而神经网络则是深度学习的技术。

什么是神经网络？

神经网络是计算模型网络，它大体上模拟了人类大脑皮层功能，可以复制出和人类一样的思维和感知方式。神经网络是由相互连接的节点组成的层次结构，这些节点包含计算网络输出的激活函数。

神经网络是机器学习的另一种方法，计算机通过分析训练样本学习执行任务。因为神经网络大致模拟人脑，所以会包括成千上万个相互连接的节点。一个节点可以连接到它下级层中接收数据的几个节点，以及它上级层接收数据的几个节点。每个输入数据点接收一个权值，会对其进行加减乘除运算。如果加权和等于零，就会增加一个偏差，然后传递给激活函数。

神经网络的结构

神经网络有3个基本结构

1. 单层前馈网络

· 它是感知器的扩展，是最简单的网络。输入层和输出层之间有额外的隐藏节点。

2. 多层前馈网络

· 除了输入和输出外，这种类型的网络还有一个或多个隐藏层。它负责输入层和输出层之间的数据传输。

3.递归网络

· 递归神经网络与上述两者类似，但广泛应用于文本和时间等序列数据的预测。最有名的递归神经网络就是“长短记忆”模型(LSTM)。

什么是随机森林？

随机森林是决策树的集合，因此，最终节点/叶节点将是分类问题的多数类或回归问题的平均类。

一个随机森林会长出许多分类树，对于树的每个输出，称之为该树为该类的“投票”。树是这么生长起来的：

1. 每棵树行的随机样本从训练数据中抽取。

2. 从步骤1选出样本后，利用特征子集在选出的树上进行拆分。

3. 每棵树都按照参数指定的最大范围生长，直到它对类进行投票。

为什么推荐随机森林？

使用随机森林而非决策树的根本，是将多个决策树的预测组合成一个模型。逻辑就是一个由许多平庸的模型组成的模型，仍然优于一个单一的好模型。看看随机森林的主流表现，就知道这是有道理的。因此，随机森林不易产生过拟合。

在决策树这样的柔性模型中，可能会出现过拟合，模型会记住训练数据，并学习数据中的任何干扰。这将使它无法预测测试数据。

随机森林可以将多棵树组合成一个集合模型，这能降低决策树等柔性模型的高方差。

来源：tuxi

相比于神经网络，什么时候该使用随机森林？

随机森林计算成本较低，不需要依靠GPU完成培训。随机森林可以提供决策树的不同解释，并且具有更好的性能。神经网络需要普通人手头更多的数据才能真正有效。神经网络只会简单地破坏特征的可解释性，以至于为了性能而变得毫无意义。虽然听起来有些道理，但还是要看每个项目具体分析。

如果目标是创建预测模型，不考虑变量的影响，强烈推荐神经网络，但是需要资源来实现这一点。如果需要了解变量，那么不管个人喜好，在这种情况下通常会发生的情况是：性能受到轻微的影响，以确保仍然可以了解每个变量是如何为预测模型作贡献。

如果你还有什么补充，欢迎在评论区留言哟~

留言点赞关注

我们一起分享AI学习与发展的干货

如转载，请后台留言，遵守转载规范

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://yundeesoft.com/164996.html