山东理工大学刘聪教授:流程挖掘简史

后台-系统设置-扩展变量-手机广告位-内容正文顶部

近日,由RPA中国主办的 “企业数字化变革引擎:流程优化与重构-流程挖掘技术发展与应用研讨会”在线上顺利召开。山东理工大学教授,RPA中国流程挖掘首席顾问刘聪作为特邀嘉宾参与了本次会议,为大家分享了国内外流程挖掘的发展历程。

 
刘聪作为国内较早从事流程挖掘理论和应用研究的从业者,于2019年博士毕业于荷兰埃因霍芬理工大学(Eindhoven University of Technology),师从欧洲科学院院士、“流程挖掘之父”、Wil van der Aalst教授,对整个技术的原理与商业实践有着深厚的见解。刘聪表示,从流程挖掘技术发展路径来看,以1999年为临界点分为两大研究阶段。1999年之前称为基于模型的流程管理或者叫做模型驱动的流程管理,这段时间主要研究方向热点包括Petri网形式化方法、并发论和工作流技术;1999年之后基于挖掘的流程管理,这个阶段重点就是流程挖掘、合规性检查以及现在广泛关注的基于AI的流程预测性监控。
 
 
                             
具体来说,流程挖掘学术研究始于1999年,最初是理论驱动行业实践的过程,行业的实践始于2007年,随着数字业务对流程挖掘的需求快速增长,直到2021年,Wil教授加入Celonis做首席科学家,实现了理论知识与行业实践的深度融合。
 
随后刘聪主要通过时间维度详细介绍了从1999年至2021年流程挖掘历史上发生的大事件。1999年,荷兰埃因霍芬理工大学开始做流程挖掘相关的研究。“流程挖掘之父”、Wil van der Aalst教授在自己的专著和报告交流中提到流程挖掘思想始于1998年在美国的访问,本质上是业务流程管理领域和数据挖掘领域的一次碰撞,目的是如何通过数据挖掘的方法去解决一些流程管理方面的难题。1998年Wil van der Aalst教授访问结束之后回到荷兰埃因霍芬理工组建了相关的小组开始技术研究。
 
2000年,首个流程挖掘算法问世,也就是我们熟知的Alpha Miner。以日志为输入,通过统计方法挖掘活动关系,进而构造一个Petri网模型。虽然算法本身有很多局限,例如挖掘能力有限,无法处理短循环、不可见任务等,但是对了解挖掘算法的基本原理是一个很好的开端。
 
   
2001年提出的启发式流程挖掘方法,是针对Alpha算法的一个改进,重点是支持日志中噪声的处理,同时支持复杂流程结构的挖掘。首先从日志中构造活动依赖关系图,根据重要程度将一些噪声处理掉,然后挖掘出因果网,最后将因果网转成通用的流程模型,如BPMN、EPC、Petri网等。这也是第二个经典的流程挖掘算法,与前面算法整体原理一样,从日志中获得抽象活动关系,进而转化为人可以读懂的流程模型。
 
2004年,TU/e发布了首个流程挖掘学术工具平台ProM(Process Mining),从1.1版本发展到现在的ProM6.13,涵盖了2000多个功能组件。很多商业工具的功能也都脱胎于这个平台的原型算法。除了主流的ProM,还有澳大利亚昆士兰科技大学Apromore、其重点是流程模型管理与检索,这个工具已经开始商业化了。近年来,也发展出了基于R语言和Python语言的流程挖掘平台。
 
前面提到的Alpha和Heuristic 都是从日志到模型,属于流程挖掘的第一个范畴——模型挖掘。2004年提出的托肯重演是流程挖掘的第二个范畴——合规性检查,目标是建立模型和事件日志之间的关联。具体而言,该方法基于Petri网引发规则进行轨迹行为重演,发现重演过程中模型与日志的偏差。 
 
   
2007年,流程挖掘领域出现首个商业公司Futura PI。该公司定位是流程智能的软件,归类于BI。2008年,Futura PI被Gartner评选为业务流程领域的新秀企业,开始在商业方面崭露头角。
 
2009年,数据挖掘专委会成立了工作小组,这也是国际首个流程挖掘的学术社区。该社区的成立为流程挖掘领域的标准化和规模化的发展奠定了基础。具体而言,该组织制定了标准的日志格式XES。同时,牵头举办了很多流程挖掘管理的大赛,例如,BPI、PDCC竞赛等,同时于2019年发起了国际业务流程管理大会ICPM。
 
此外,2009年还成立了几家知名的流程挖掘企业,例如,Fluxicon、Process Gold。其中Process Gold在2019年被RPA巨头UiPath收购,也是第一家被收购的流程挖掘公司。
 
前面提到的托肯重演的合规性检查方法是基于Petri网引发规则,存在无法定位全局最优匹配路径的问题。2010年提出的基于对齐的合规性检查算法,将日志行为与模型行为进行全局最优对齐,可以精准诊断模型与日志之间的偏差。
 
2011年,Wil van der Aalst教授出版了首部流程挖掘专著,是流程挖掘初学者必读经典之作,也被业内奉为流程挖掘领域的“圣经”,作为流程挖掘学者的经典必读。从此之后,Wil慢慢的也被称为“流程挖掘之父”。
 
同时IEEE发布了《流程挖掘宣言》,成员包括全球53个单位的70+科研人员,主要分享了流程挖掘6大指导原则以及面临的11个挑战问题,为流程挖掘近10年的发展指明了方向。
 
2011年还有一件大事情发生,就是流程挖掘巨头Celonis在德国成立,该公司产品集成数据抽取、流程可视化分析与洞察,运营管理于一体。目前Celonis是流程挖掘领域国际公认的领导者。
 
2013年,归纳式流程模型挖掘算法问世。它在前面的算法上进行了大量优化,例如,保证模型正确性。但该算法也有明显的缺点,模型过度泛化,同时可能会导致额外增加大量不可见变迁,表达能力有限。
 
2014年Wil 教授推出了流程挖掘在线网课,基于他的专著进行详细的技术讲解,截至目前该课程已有数十万学习用户,而刘聪便是第一批学习者并拿到了认证。
    
2016年,Wil van der Aalst教授发布了第二部专著《流程挖掘:数据科学实战》,深度分享了自2010至2016年最新的技术理论与商业实践成果。
 
2018年,Celonis成为德国独角兽企业,同时市场上出现了超过了25家流程挖掘企业,例如,Minit、PAF、LANA、Nvenio、Signavio等知名企业。但这些流程挖掘企业先后都被微软、IBM、SAP等科技巨头收购了。
 
2019年6月,第一届流程挖掘年会在亚琛工业大学举办,此次会议与Petri网年会(40多届)同步举办,有点老树长新芽的感觉。
 
2021年Celonis估值达到110亿美元,致使国内2021年逐步发展出很多流程挖掘企业。  同年Wil教授加入Celonis担任首席科学家,实现最强流程挖掘理论研究者和最强流程挖掘企业实践者的结合,这对整个行业和学术的发展起到了非常重要的推动和里程碑式的作用。
 
   
聚焦国内,虽然流程挖掘还处于探索阶段,但一些杰出的人才对我国流程挖掘技术的普及起到了重要作用。例如,清华大学王建民教授是国内流程挖掘领域首位杰青;清华大学闻立杰教授是国内首个流程挖掘领域的博士生;山东科技大学的曾庆田教授完成了流程挖掘领域首篇综述文章,以及Petri网的两位专家袁崇义教授和吴哲辉教授,对国内普及流程挖掘知识起到了非常重要的推动作用。
 
   
流程挖掘作为舶来品,我们也试着从国内华人圈子里找一下联系与源头,具体包括如下几位研究人员:清华大学闻立杰老师在Wil教授组里做访问交流,Xixi Lu、李光明、刘聪博士毕业于Wil教授团队,程龙是Wil教授的博后。
 
   
此外,由清华大学于2011年发起的“中国业务过程管理大会”也走过了12个年头,该会是国内顶级垂直的流程挖掘领域大会。比较特别的是,大会从今年开始增加了工业论坛部分,重点是与各位流程领域行业从业者进行交流,争取学习一下国外的思路实现产业和学术双驱动。
 
在商业化落地方面,国内也聚集了一批有潜力广阔发展空间的流程挖掘厂商,主要分为垂直流程挖掘与RPA厂商两大类。垂直流程挖掘厂商包括:凡得科技、杰成合力、熵评科技、望繁信、璇星科技、优数腾等。RPA厂商布局流程挖掘的包括:来也科技、容智信息、弘玑Cyclone、艺赛旗、九科信息、实在智能、云智慧等。
 
最后,刘聪表示,虽然国内外在技术水平和行业认可度方面还有一定的差距,但随着我国数字经济和企业数字化转型进程的推进,流程挖掘作为数字化转型的助推器,其产业化和标准化程度必定会逐步提升。在不久的将来,会有一大批企业、用户甚至个人开发者逐步熟悉流程挖掘技术,并将其应用到业务流程赋能的实践应用中。
 
 
刘聪教授完整《流程挖掘简史》PDF文件,可在【RPA全球生态】公众号后台回复【简史】下载。

未经允许不得转载:RPA中国 | RPA全球生态 | 数字化劳动力 | RPA新闻 | 推动中国RPA生态发展 | 流 > 山东理工大学刘聪教授:流程挖掘简史

后台-系统设置-扩展变量-手机广告位-内容正文底部