你所在的位置: 首页 > 正文

收藏 - 数据分析师最常用的10个机器学习算法

2019-08-28 点击:1597

- 数据分析师最常用的10个机器学习算法

在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,这意味着没有算法可以对每个问题产生最佳效果。这种理论在监督学习中尤为重要。

例如,您不能说神经网络总是比决策树更好,反之亦然。模型运行由许多因素决定,例如数据集的大小和结构。

因此,您应该根据您的问题尝试许多不同的算法,同时使用数据测试集来评估性能并选择最佳术语。

当然,您尝试的算法必须符合您的问题,门口是机器学习的主要任务。例如,如果你想清洁房子,可以使用吸尘器,扫帚或拖把,但你肯定不会开始用铲子挖。

对于渴望学习机器学习基础知识的机器学习新手,数据科学家使用了十种机器学习算法,为你介绍这十大算法的特性,便于大家更好地理解和应用,快来看看吧。

1.线性回归

线性回归可能是统计学和机器学习中最着名和最易理解的算法之一。

因为预测建模侧重于最小化模型的误差,或以牺牲可解释性为代价进行最准确的预测。我们从许多不同领域借用,重用和窃取算法,包括一些统计知识。

线性回归由一个方程表示,该方程通过找到输入变量的特定权重(B)来描述输入变量(x)和输出变量(y)之间的线性关系。

AdaBoost算法

AdaBoost通常用于短决策树。创建第一个树之后,树上每个训练实例的性能决定了下一棵树需要多少关注此训练实例。不可预测的训练数据被赋予更多权重,而更容易预测的实例被赋予更少的权重。模型按顺序创建,每个模型更新都会影响序列中下一个树的学习结果。在构建了所有树之后,该算法预测新数据并通过训练数据的准确性对每棵树的性能进行加权。

因为该算法非常注重纠错。

因此,没有异常值的整洁数据非常重要。

写在最后

初学者在面对各种机器学习算法时会问一个典型的问题是“我应该使用哪种算法?”问题的答案取决于许多因素,包括:

NN

数据的大小,质量和性质;

可用的计算时间;

任务的紧迫性;

你想要对数据做什么。

即使是经验丰富的数据科学家也无法知道哪种算法在尝试不同算法之前表现最佳。虽然还有许多其他机器学习算法,但这些算法是最流行的算法。如果您不熟悉机器学习,这是一个很好的学习起点。

NN

NN

TOP10 最完整的统计思维图,值得收藏! 现代统计史机器学习算法岭回归,套索回归和弹性网络回归组织详细的数据预处理方法资源|《Python数据分析与数据化运营》PDF HD +数据+代码机器学习算法优缺点的比较和选择(摘要)Pythonsklearn模型选择从概率的角度来看,3场比赛5胜3场比赛2胜。哪个胜利更大? 数据预处理|关于标准化和规范化的一切14个思维导图| Python编程核心知识系统

NNN。

日期归档
电子游艺免费送彩金 版权所有© www.dingmaotu.com 技术支持:电子游艺免费送彩金 | 网站地图