机器学习评估方法

正类 负类
预测为正类 TP(True Positives) FP(False Positives)
预测为负类 FN(False Negatives) TN(True Negatives)
  • 分类模型常用评估方法
      • 准确率(Accuracy)
      • 精确率(Precision):P=TP/(TP+FP) (预测为正例中,多少是正确的正例)
      • 召回率(Recall):R=TP/(TP+FN) (真正的正例中,多少被预测成功)
      •  F1-score:2PR/(P+R)
      • ROC曲线:横坐标FPR=FP/(FP+TN),纵坐标TPR=TP/(TP+FN),ROC曲线越靠拢(0,1)点,越偏离45度对角线越好

    • AUC值:被定义为ROC曲线下的面积,表示预测的正例排在负例前面的概率,反映的是分类器对样本的排序能力,小于0.5则预测反了。简单来说其实就是随机抽出一对样本(一个正样本,一个负样本),然后用训练得到的分类器来对这两个样本进行预测,预测得到正样本的概率大于负样本概率的概率(AUC的计算方法)
  • 回归模型常用评估方法
    • Mean Square Error (MSE, RMSE) 平均方差
      Absolute Error (MAE, RAE) 绝对误差
      R-Squared R平方值

f1_score/precision_score/recall_score中micro和macro的区别

0