当目标是在分类环境中隔离有趣的预测变量时,您如何在小样本临床研究中应用随机学习或惩罚回归(具有L1或L2罚分,或其组合)等机器学习技术呢?这不是关于模型选择的问题,也不是关于如何找到变量效果/重要性的最佳估计的问题。我不打算进行强力推断,而只是使用多变量建模,因此避免一次针对感兴趣的结果测试每个预测变量,并避免考虑它们之间的相互关系。
我只是想知道这种方法是否已经在这种特殊的极端情况下应用,比如说20-30个对象中有10-15个分类变量或连续变量的数据。这是不完全情况下,我觉得这里的问题是关系到我们班试图解释(这往往是没有得到很好的平衡)的数量,和(很)小样本。我知道在生物信息学的背景下有关该主题的大量文献,但是我没有找到任何与通过心理计量表型进行生物医学研究有关的参考文献(例如,整个神经心理学问卷调查)。
对相关论文有任何提示或指示吗?
更新资料
我愿意接受任何其他用于分析此类数据的解决方案,例如C4.5算法或其派生类,关联规则方法以及任何用于监督或半监督分类的数据挖掘技术。