1.4 总结
机器学习通过数据(经验)来学习其中的模式和规则,进而推广到未来新的数据上。在学习中会面临不同的任务,机器学习的学习效果也可以使用不同的性能度量来评估。
数据可分为结构型数据和非结构型数据,也可分为原始数据和加工数据,还可分为样本内数据和样本外数据。非结构型数据可以通过某种方式转换成结构型数据,比如将图片转换成数值向量,将文字转换成词向量等。在机器学习中,模型只能在样本内数据上训练,但要将其推广还要看它在样本外数据上的表现。
机器学习的任务具体介绍如下。
● 有监督学习是对有标签的数据的学习,回归和分类是主要任务。
● 无监督学习是对无标签的数据的学习,聚类和降维是主要任务。
● 半监督学习是对部分有标签、部分无标签的数据的学习,先聚类再分类。
● 增强学习是对有评价的数据在行动中的学习,边试错边反馈。
● 深度学习是一种机器学习的方法,在前4种学习模型因数据过多致使模型性能达到瓶颈时,可以起到助力的作用。
● 迁移学习是一种机器学习的方法,即将在一个任务上预训练后的模型重新用在另一个任务中。
机器学习的性能度量主要使用误差函数,以及一系列评估模型的指标。
本书主要讲解有监督学习,也就是预测数值(回归任务)和预测类别(分类任务),其中核心是下表中的假设函数h。
在传统编程中,重点是代码,人类总结经验并将其归纳成严谨的逻辑公式,然后用编程语言描述出来并编译成机器码,交给计算机去执行。而在机器学习中,重点是表示(Representation),它是一种新的编程方式,它不需要人类来总结经验、输入逻辑,人类只需要把大量数据输入计算机中,计算机就可以从数据中学习,该过程被称作训练,训练后得到的产物就是模型。
细心的读者可能发现有一个问题没有讲清楚,也就是引言中所说的:
模型的性能如何定性评估?模型性能的好坏通常要看它在没有见过的数据上的表现。但是这很矛盾,因为模型是基于看到的数据而学习的。你根本不知道你没看到的数据(未来发生的)是什么样的,那么又如何来评估模型性能呢?
第2章的机器学习理论就是用来解决如何根据模型在样本内的表现,推出其在样本外的表现,即在没看到的数据上的表现。