最近,在UPC /巴塞罗那的Oriol Pujol教授的机器学习课程中,他描述了用于各种机器学习相关任务的最常见算法,原理和概念。在这里,我与您分享它们并询问您:
- 是否有全面的框架将任务与与不同类型的机器学习相关问题相关的方法或方法相匹配?
如何学习简单的高斯? 概率,随机变量,分布;估计,收敛和渐近,置信区间。
如何学习混合高斯(MoG)?可能性,期望最大化(EM);概括,模型选择,交叉验证;k均值,隐藏马尔可夫模型(HMM)
我如何学习密度?参数与非参数估计,Sobolev和其他功能空间;ĺ2错误; 内核密度估计(KDE),最佳内核,KDE理论
如何预测连续变量(回归)?线性回归,正则化,岭回归和LASSO;局部线性回归 条件密度估计。
我如何预测离散变量(分类)?贝叶斯分类器,朴素贝叶斯,生成与区分;感知器,重量衰减,线性支持向量机;最近邻分类器和理论
我应该使用哪个损失函数?最大似然估计理论;l -2估计;贝叶斯估计 极小极大与决策理论,贝叶斯主义与频繁主义
我应该使用哪种型号?AIC和BIC;Vapnik-Chervonenskis理论;交叉验证理论;自举 大概近似正确(PAC)理论;霍夫廷定界
如何学习更高级的(组合)模型?整合学习理论;促进 套袋 堆放
如何学习更高级的(非线性)模型?广义线性模型,逻辑回归;Kolmogorov定理,广义加性模型;内核化,再现内核Hilbert空间,非线性SVM,高斯过程回归
如何学习更出色的(组合)模型?递归模型,决策树,层次聚类;神经网络,反向传播,深度信念网络;图形模型,HMM混合,条件随机字段,最大边距Markov网络;对数线性模型; 文法
如何减少或关联功能?特征选择与降维,特征选择的包装方法;因果性与相关性,偏相关性,贝叶斯网络结构学习
如何创建新功能?主成分分析(PCA),独立成分分析(ICA),多维缩放,流形学习,监督降维,度量学习
如何减少或关联数据?集群,双集群,约束集群;关联规则和市场篮子分析;排名/常规回归 链接分析;关系数据
如何处理时间序列?ARMA;卡尔曼滤波器和统计空间模型,粒子滤波器;功能数据分析;变更点检测;时间序列的交叉验证
如何处理不理想的数据?协变量移位 阶级失衡;数据丢失,采样数据不规则,测量误差;异常检测,鲁棒性
如何优化参数?无约束与约束/凸优化,无导数方法,一阶和二阶方法,后拟合;自然梯度 边界优化和EM
如何优化线性函数?计算线性代数,用于回归的矩阵求逆,用于降维的奇异值分解(SVD)
如何优化约束?凸性,拉格朗日乘数,Karush-Kuhn-Tucker条件,内点方法,用于SVM的SMO算法
如何评估深度嵌套的总和?精确的图形模型推论,总和的变化范围,近似的图形模型推论,期望传播
如何评估大笔款项和搜寻?广义N体问题(GNP),分层数据结构,最近邻居搜索,快速多重方法;蒙特卡洛积分,马尔可夫链蒙特卡洛,蒙特卡洛SVD
我该如何处理更大的问题?并行/分布式EM,并行/分布式GNP; 随机次梯度方法,在线学习
如何在现实世界中应用所有这些?机器学习部分的概述,在用于每个任务的方法,先验知识和假设之间进行选择;探索性数据分析和信息可视化;评估和解释,使用置信区间和假设检验,ROC曲线;机器学习的问题在哪里