Answers:
我从来没有直接使用过它,所以我只能分享一些我曾发表过的论文以及对该技术的一般想法(主要解决您的问题1和3)。
我对双簇聚类的一般理解主要来自基因研究(2-6),我们试图解释基因簇和个体分组:总之,我们希望将共享相似基因表达谱的样本分组在一起(这可能与(例如疾病状态)和有助于这种基因分析模式的基因。Pardalos的幻灯片Biclustering中提供了有关生物学“大规模”数据集的最新技术的概述。请注意,有一个R包biclust,可用于微阵列数据。
实际上,我最初的想法是将该方法应用于临床诊断,因为它允许将特征或变量放在一个以上的聚类中,这从符号学的角度来看是很有趣的,因为聚类在一起的症状可以定义综合症,但某些症状可以在不同疾病中重叠。可以在Cramer等人的《合并症:网络观点》中找到一个很好的讨论(Behavioral and Brain Sciences 2010,33,137-193)。
一种与之相关的技术是协作过滤。Su和Khoshgoftaar提供了很好的评论(人工智能的进展,2009年):协作过滤技术概述。其他参考文献在末尾列出。也许对频繁项目集的分析(例如在市场购物问题中得到证明)也与此相关,但是我从未对此进行调查。共聚的另一个例子是当我们想要同时聚类单词和文档时,例如在文本挖掘中,例如Dhillon(2001)。使用二部光谱图分区对文档和单词进行聚类。程序 KDD,第269–274页。
关于一些一般参考,这不是一个非常详尽的列表,希望对您有用: