克日,银娱优越会郭建华教授团队在因果推断算法研究上取得主要突破。郭建华教授团队在国际机械学习与人工智能顶级聚会——第四十二届国际机械学习聚会(International Conference on Machine Learning, ICML)上提交的论文“An Improved Clique-Picking Algorithm for Counting Markov Equivalent DAGs via Super Cliques Transfer”(基于超团转移的团选取算法快速盘算马尔可夫等价类规模),入选所有投稿论文前1%,被评选为口头报告论文。
该聚会共收到专家学者投稿论文共计12107篇,其中仅有120篇被评选为口头报告>刍嵘蟾迦硕怨ɑ淌谕哦犹峤坏穆畚母韪叨热峡,一致以为:“这篇论文解决了高效盘算马尔可夫等价类规模这一主要的算法问题,极大提升了现有要领的效率。这种盘算能力对贝叶斯实验设计要领尤其主要。论文在算法方面作出了主要的孝顺,并提供了扎实的理论支持”。
图1:聚会论文截图
本项论文效果由郭建华教授(通讯作者)向导研究,东北师范大学数学与统计学院博士研究生刘力夫、银娱优越会数学与统计学院副教授贺诗源为配合第一作者。该研究聚焦因果推理领域,详细针对高效盘算有向无环图(Directed Acyclic Graph, DAG)的马尔可夫等价类(Markov Equivalence Class, MEC)规模这一要害科学问题,从算法设计与理论剖析两个维度,对提升盘算效率、镌汰算法冗余及理论支持方面作出了主要且立异性的孝顺。
在因果推理中,有向无环图(DAG)是形貌变量之间因果关系的基础工具。但在现实研究中,研究职员从有限视察数据无法唯一确定变量间的因果关系结构,只能识别出一组代表相同条件自力关系的DAG,即马尔可夫等价类(MEC)。MEC的规模代表了因果结构的不确定水平,对进一步的科研实证环节至关主要。在盛行病学、经济因果剖析、医疗干预设计、政策评估以及智能系统自动推理等诸多领域中,准确量化因果结构的不确定性,能够助力科研职员和决议者更高效地获取因果结构、设计干预实验、评估潜在危害并制订优化战略,为决议历程提供更为精准的科学依据。
在既有的MEC规模盘算研究中,已知的Clique-Picking算法,通过选取差别的团为根节点,一直将MEC拆分为差别的子类,并递归盘算每个子类中的DAG数目。但由于子类之间保存大宗结构上的重复与相似性,盘算历程中爆发大宗冗余,严重影响盘算效率。

图2:古板Clique-Picking算法
通过选取差别团为根,对马尔可夫等价类分类
针对这一难题,研究团队发明,差别子类在图结构上保存高度的相似性,特殊是在图结构的无向部分——即连通分量荟萃上,结构相似性可以被准确识别与使用。借助图论中“团树”(Clique tree)工具,研究团队提出了高阶图结构—— “超团”(Super Clique)和“超残差”(Super Residual),以此清晰描绘和高效处置惩罚差别MEC子类间重大的相互关系。
在引入高阶图结构的基础之上,研究团队提出了超团转移(Super Cliques Transfer,SC-Trans)算法。这一立异算法能够在迭代盘算新子类图结构时,巧妙使用前序盘算的“超团”和“超残差”结构,直接获取重叠的结构信息,并通过局部的转移操作迅速增补不重叠的部分,从而极大镌汰冗余盘算,提升盘算效率。

图3:研究团队在团树中结构“超团”结构,
并设盘算法实现差别团树间的结构快速转换
研究团队不但从理论上给出了SC-Trans算法的完整证实,更通过大宗模拟验证了算法的高效性,展现算法在现实应用中的重大潜力。这一研究效果为重大因果结构评估和贝叶斯实验设计提供了主要的理论支持与算法工具,进一步买通了从大数据到精准决议的要害通道。
作者:吴慧中
编辑:曹薇
审核:王远芳
审定:倪国华







