特征工程通常是机器学习的重要组成部分(在2010年赢得了KDD杯冠军的过程中被大量使用)。但是,我发现大多数功能工程技术要么
- 破坏基本功能的任何直观含义,或
- 是特定于特定领域甚至特定类型的功能。
前者的经典示例是主成分分析。在我看来,主题专家将拥有的有关功能的任何知识都将通过将这些功能转换为主要组件而被破坏。
将其与将日期转换为“月中的某天”和“星期几”的特征的简单技术进行对比。潜在的含义仍然保留在新功能中,但是显然,此特定技术仅适用于日期,不适用于任意功能。
是否有任何标准的要素工程技术体系都没有破坏基本要素的含义,同时又适用于任意领域(或至少各种各样的领域)?
2
有时可以使用PCA查找特征的直观含义,例如特征面。
—
tdc 2012年
您能否给出(更多)示例数据的想法?如果您可以更具体地说明您的应用程序(甚至是任意示例),则将更容易给出(更准确的)答案。
—
2012年
@Dov好吧,关键是(理想情况下)我希望某些东西可以适用于任何结构化的表格数据集(具有数据点和特征的数据集)。所以这可能是销售数据,财务数据,药物研发数据,棒球数据等
—
迈克尔·麦高恩