主要参考《百面机器学习》一书,以下列表参考此链接。
加粗字体为必会。
- 特征工程:
- 两种归一化
- 类别型的三种特征
- 高维组合特征处理
- 如何进行特征的组合
- 模型评估:
- 准确率,召回率
- PR曲线,ROC曲线,AUC
- RMSE和MAPE
- 余弦距离和欧氏距离的区别
- AB测试
- Holdout,交叉检验,留P验证,自助法
- 超参数调优
- 过拟合欠拟合
- 经典算法:
- SVM,KKT
- 逻辑回归
- 决策树
- 降维:
- PCA
- LDA
- 无监督学习:
- K-均值,层次聚类
- 高斯混合模型
- 神经网络
- 聚类算法评估
- 优化算法:
- 有监督的损失函数
- 机器学习优化问题:凸优化
- 经典优化:无约束问题,Hessian矩阵
- 梯度验证
- L1、L2正则
- 集成学习
- bagging,boosting
- 集成学习步骤
- 基分类器
- 偏差,方差
- GBDT,XGBoost,Lightbgm