Skip to content

导语和基础概念

  • 机器学习:让机器去学习(规则可能是会变化的)给算法喂数据,让算法去寻找关系
  • 传统算法:让机器去执行(规则是固定的)

基础概念

  • 数据集(data set):数据整体(一张表)
  • 样本(sample):每一行,一个record
  • 特征(feature):每一列表达一个特征(除了作为标记最后一列)
  • 标记(label):最后一列。

  • 特征向量:一行,除了标记

分类任务本质就是在特征空间中切分。

基本任务

监督学习:基本的两类任务

  • 分类:可细分为二分类任务、多分类、多标签分类
  • 回归:结果是一个连续数字的值,而不是离散的类别