机器学习及其应用
上QQ阅读APP看书,第一时间看更新

第3章 监督学习

机器学习的核心思想是使用从训练样本中获取的特征信息来构造和优化模型。为实现机器学习的算法效果,有时需要对训练样本赋予一定的先验信息,即给训练样本标注特定的标签或标注信息,为机器学习的模型构造提供参照。这种以带标签样本为训练对象的机器学习方式通常称为监督学习。可以将监督学习形象地理解为考生复习备考的过程:考前演算一定数量的练习题,通过将习题演算结果与习题答案进行对照分析,归纳总结出具有一定泛化能力的解题方法。监督学习是一种非常重要的机器学习方式,可有效解决分类、回归等学习任务,在图像处理与模式识别、自然语言理解与机器翻译、数据挖掘与信息推荐、经济预测与投资分析等众多领域都有着非常成功的应用。本章比较系统地介绍线性模型、决策树模型、贝叶斯模型和支持向量机等面向监督学习的模型结构及相关学习算法。