1. 五大流派
⑥调优模型:使用更多数据、不同的特征或调整过的参数来提升算法的性能表现
⑤使用模型:使用完全训练好的模型在新数据上做预测
优点:回归可用于识别变量之间的连续关系,即便这个关系不是非常明显
3. 回归(Regression):回归可以勾画出因变量与一个或多个因变量之间的状态关系。在这个例子中,将垃圾邮件和非垃圾邮件进行了区分。
优点:支持向量机擅长在变量 X 与其它变量之间进行二元分类操作,无论其关系是否是线性的 场景举例:新闻分类、手写识别。
①传统编程:软件工程师编写程序来解决问题。首先存在一些数据→为了解决一个问题,软件工程师编写一个流程来告诉机器应该怎样做→计算机遵照这一流程执行,然后得出结果
②统计学:分析师比较变量之间的关系
1980 年代
优点:容许数据的变化性,适用于识别(recognition)和预测操作 场景举例:面部表情分析、气象预测
2020 年代+
5. 机器学习的实际应用
主导流派:贝叶斯 架构:小型服务器集群 主导理论:概率论 分类:可扩展的比较或对比,对许多任务都足够好了
5. 隐马尔可夫模型(Hidden Markov model):显马尔可夫过程是完全确定性的——一个给定的状态经常会伴随另一个状态。交通信号灯就是一个例子。相反,隐马尔可夫模型通过分析可见数据来计算隐藏状态的发生。随后,借助隐藏状态分析,隐马尔可夫模型可以估计可能的未来观察模式。在本例中,高或低气压的概率(这是隐藏状态)可用于预测晴天、雨天、多云天的概率。
主导流派:联结主义 架构:大型服务器农场 主导理论:神经科学和概率 识别:更加精准的图像和声音识别、翻译、情绪分析等
主导流派:算法融合 架构:无处不在的服务器 主导理论:最佳组合的元学习 感知和响应:基于通过多种学习方式获得的知识或经验采取行动或做出回答
4. 朴素贝叶斯分类(Naive Bayes Classification):朴素贝叶斯分类器用于计算可能条件的分支概率。每个独立的特征都是「朴素」或条件独立的,因此它们不会影响别的对象。例如,在一个装有共 5 个黄色和红色小球的罐子里,连续拿到两个黄色小球的概率是多少?从图中最上方分支可见,前后抓取两个黄色小球的概率为 1/10。朴素贝叶斯分类器可以计算多个特征的联合条件概率。
1. 什么是机器学习?
6. 随机森林(Random forest):随机森林算法通过使用多个带有随机选取的数据子集的树(tree)改善了决策树的精确性。本例在基因表达层面上考察了大量与乳腺癌复发相关的基因,并计算出复发风险。
②贝叶斯派:获取发生的可能性来进行概率推理,最喜欢的算法是:朴素贝叶斯或马尔可夫
优点:当存在非常大型的数据集、大量特征和复杂的分类任务时,卷积神经网络是非常有用的 场景举例:图像识别、文本转语音、药物发现
优点:擅长对人、地点、事物的一系列不同特征、品质、特性进行评估 场景举例:基于规则的信用评估、赛马结果预测
9. 卷积神经网络(convolutional neural network):卷积是指来自后续层的权重的融合,可用于标记输出层。
快速三维地图测绘和建模:要建造一架铁路桥,PwC 的数据科学家和领域专家将机器学习应用到了无人机收集到的数据上。这种组合实现了工作成功中的精准监控和快速反馈。 增强分析以降低风险:为了检测内部交易,PwC 将机器学习和其它分析技术结合了起来,从而开发了更为全面的用户概况,并且获得了对复杂可疑行为的更深度了解。 预测表现最佳的目标:PwC 使用机器学习和其它分析方法来评估 Melbourne Cup 赛场上不同赛马的潜力。
2. 演化的阶段
场景举例:路面交通流量分析、邮件过滤
主导流派:联结主义+符号主义+贝叶斯+…… 架构:云计算和雾计算 主导理论:感知的时候有网络,推理和工作的时候有规则 简单感知、推理和行动:有限制的自动化或人机交互
②模型数据:使用训练数据来构建使用相关特征的模型
1. 决策树(Decision Tree):在进行逐步应答过程中,典型的决策树分析会使用分层变量或决策节点,例如,可将一个给定用户分类成信用可靠或不可靠。
①选择数据:将你的数据分成三组:训练数据、验证数据和测试数据
机器学习有很多应用场景,这里给出了一些示例,你会怎么使用它?
上一篇:上一篇:市规划局VS分局!加装电梯:一边查,一边建,居民权益在哪?
下一篇:下一篇:字幕组缘何走上违法之路?用爱发电变赚钱,版权问题无法回避