面向对象的流程挖掘-3D流程挖掘简介

后台-系统设置-扩展变量-手机广告位-内容正文顶部

 

本期作者简介

 

华北电力大学-程龙教授、XX研究所研究员-李光明博士、山东理工大学-刘聪教授,均长期从事流程挖掘关键技术研究。三位专家分别于博士后、博士期间师从流程挖掘之父Wil van der Aalst教授,并且全面参与了面向对象流程挖掘(Object-Centric Process Mining 或者OCPM)研究。

 

01、引言 

 

2022年11月,超级独角兽公司、全球流程挖掘领导者Celonis在德国慕尼黑召开了第四届用户大会“2022 Celosphere”,并且推出了颠覆性产品Process Sphere,将流程挖掘视角从2D发展至3D,可将企业的数字业务流程像“3D地铁地图”一样呈现在用户面前。流程挖掘之父Wil van der Aalst教授评价Celonis Process Sphere产品是流程挖掘领域近10年最大的技术进步。

“Celonis Process Sphere represents the biggest step-change in the field for 10 years and establishes new table stakes for process mining and how companies operate”-- 流程挖掘之父Wil van der Aalst

那到底什么是面向对象的流程挖掘(以下简称3D流程挖掘或者OCPM)?这个技术相比传统流程挖掘到底有什么优点呢?以下我们对3D流程挖掘的发展和概念做一些简单的梳理和介绍。

 

02、研发到落地共7年

 

在国内市场,流程挖掘的应用当前还是处于初级阶段,3D流程挖掘的概念还显得比较前沿,知道的人并不多。同时,虽然面向对象的流程挖掘的核心技术这些年发展的比较迅速,Wil教授最近2年也一直在数字产业中力推3D流程挖掘, 但是当Celonis在“2022 Celosphere”推出3D流程挖掘时,我们整体还是感觉比较惊讶。主要原因还是其技术产品化和商业化的时间比我们预期的要早,因为我们预计的商业化时间点大概是在2024年左右。当然,3D流程挖掘技术的落地以及3D流程挖掘商业化产品的推出,除了体现了Celonis公司对新兴技术的追求和实践,进一步奠定了其在流程挖掘领域行业领先者的地位,也在另一方面反应了商业市场对3D流程挖掘的实际需求。

实际上,面向对象的流程挖掘的技术研究始于2015年。当时,在“Interacting Artifacts”概念的基础上,Wil教授意识到流程挖掘中Object(对象)的重要性。因此,Wil教授于2015年特别招聘了李光明作为博士研究生,专门进行面向对象的行为约束(OCBC)模型研究,并先后让刘聪、程龙、Gyunam、Jan、Alessandro、Anahita等人分别参与了相关技术的研究和开发,其具体内容覆盖了3D流程模型、日志格式、挖掘算法、流程分析、一致性检测等一系列技术。

随着研究的逐步推进,3D流程挖掘技术的闭环在2020年基本形成,其中Wil在2020年CBPM大会上也以“面向对象的流程挖掘”为主题进行了主旨演讲,使业界意识到了3D流程挖掘的巨大潜力和市场需求。此外,Wil在2020年入职Celonis成为首席科学家之后,也集中精力把3D流程挖掘作为一个研发关键点,并在科研活动中一直力推OCPM技术,包含推动相关标准例如OCEL(Object-Centric Event Log)的标准化,直接加速了Celonis Process Sphere产品的问世。

总的来说,3D流程挖掘的发展和落地,经历了7年多的时间。这其中有Wil教授的力推,相关研究人员的努力,也有Celonis公司整体的支持。结合流程挖掘技术自身的发展,3D流程挖掘发展的整体历程如下。

▲ 3D流程挖掘的发展历程

 

03、为什么要3D挖掘?

 

流程挖掘数据主要来源于企业信息系统。以当今大多数企业广泛使用企业资源计划(ERP)系统为例,ERP系统包括计划、制造、销售、会计、财务、人力资源管理、项目管理、库存管理和运输等模块,模块间具有松耦合的交互关系,并且基于一个中央服务器来存储不同模块的业务,这样就能够使不同的模块共享数据并进行交互。以常见的采购到付款(OTC)流程为例,其中整体的信息系统结构如下图所示。

▲ ERP信息系统结构(基于OTC流程)

由于ERP系统由多个模块组成,一个企业部门使用一个模块,流程实例分散在企业的不同部门,经常存在一对多和多对多的关系,导致多个流程实例之间存在交互,且不同部门的案例概念也不相同,很难为整个业务流程确定全局唯一的案例概念(即流程挖掘中的case id概念)。例如,在“销售”部门的眼中,案例概念是“订单”,而在“送货”部门眼中,案例概念是“包裹”。因此,缺少一个能贯穿整个流程的全局案例概念。

▲ 传统的流程挖掘技术基于单一案例概念的假设会压平实际流程

传统的流程挖掘技术和产品大多基于单一案例概念,即以案例(case)为中心。执行数据记录的每个事件都精确地指向某个案例,一个案例对应于流程的一个执行实例,流程挖掘技术从案例概念的角度分析系统中的业务流程。当采用当前的流程挖掘技术分析ERP系统中的流程时,强加的单一案例概念会将3D流程压平投影到2D视图上,只捕捉到流程的一个基于选择的案例概念的特定视角。这种强制转换还会导致诸多问题,特别是:

(1)收敛问题,即事件被复制并分散到多个案例中;

(2)发散问题, 即多个同一活动的实例不能在一个案例中区分。

这些问题会使得流程挖掘得到的结果不精确或者很难从一个视角对端到端流程进行细粒度的分析。此外,现有的流程挖掘技术侧重分析业务流程的控制流方面,不能对分析数据方面提供足够的支撑,即缺少业务流程与数据对象之间的关联互动。

 

04、OCPM技术简介

 

为了使能3D流程挖掘,面向对象的流程挖掘技术应运而生。经过近些年的发展,面向对象的流程挖掘包含了一套技术,具体如下图所示。

▲ 面向对象的流程挖掘的一些技术示例

在事件数据存储方面,XOC日志格式最先被提出来存储3D的流程事件数据,避免了传统XES事件日志格式对事件数据的扁平化压缩,保留了原始事件数据中的多实例概念和复杂交互关系;而后基于本质上同样的面向对象的思想,OCEL日志格式被提出来降低日志的复杂度,提高日志的性能,成为支撑面向对象的3D流程挖掘技术可实际运用的日志格式。在流程可视化方面,OCBC模型被提出,可以在一个模型中同时描述数据和行为两个视角,其中数据视角可以描述一对多和多对多等复杂关系,行为视角可以描述ERP系统中灵活的事件约束等松耦合关系。面向对象的Petri网(OCPN)通过给库所添加类型来表示不同的对象,通过加强的关系来表示一对多和多对多等复杂关系。直接跟随多图通过重叠基于不同案例概念的子流程,得到一个描述多案例概念的端到端流程。

此外,面向对象的流程挖掘也具有了一系列的支持工具,包含从数据库抽取3D事件日志的日志生成工具、3D流程建模工具、3D流程挖掘工具、一致性校验工具和性能分析工具。这些工具进一步使能了3D流程挖掘的应用,其中学术领域中面向对象的流程挖掘工具示例如下图所示。

▲ 学术领域面向对象的流程挖掘工具示例

总的来说,在分析ERP等信息系统中的3D流程时,面向对象的流程挖掘技术存在以下优势:

(1)不需要为整个业务流程确定全局唯一的案例概念,而是根据分析需求,选取关注的对象,灵活地查看与其相关的业务流程。

(2)解决了收敛和发散问题,提高了数据质量。通过采用3D事件日志格式记录事件数据,避免了对数据的扁平化压缩,使得数据保持原有的复杂对应关系,数据中和事件不直接相关的各种信息都可以得到保留。

(3)可以对流程实例之间的交互进行建模,基于数据模型和对象进行事件关联来处理多实例问题,解决现有的流程建模语言孤立地描述流程实例的问题。

(4)采取集成的方式对数据方面和控制流方面进行建模,提高对数据视角建模的能力,解决当前的流程建模语言虽然可以对数据对象进行建模,但能力偏弱,没有采用ER模型和UML类模型等专业的数据建模语言中表达力更强的元素的问题。

(5)增强了合规性校验中检测出数据方面偏差的能力。现有的一致性校验技术主要是从控制流的角度来检测偏差,但一些控制流方面的异常行为无法直接从控制流方面进行校验,它们与数据方面的异常关联,必须综合考虑控制流和数据两个方面及其之间的交互才能检测出来。

(6)进一步提高了流程性能分析的准确性。通过采用3D事件日志作为数据支撑进行分析,使得对流程的分析结果更加丰富和准确。

 

05、技术应用与展望

 

流程挖掘技术应用到面向对象的信息系统,总的来说,目前有3条路径,分别对应当前、以后、将来三个时间阶段。具体如下图所示。

▲ 应用面向对象的流程挖掘技术的3种途径

第一条路径是完全采用传统的流程挖掘技术。从系统数据库中直接抽取数据转化为标准的XES日志(或者对应数据模型),采用传统的面向案例(即假设单一案例概念)的流程挖掘技术进行分析。这种途径也是当前阶段大多数流程挖掘厂商所采用的方式,例如,通过执行SQL语句直接从ERP数据库中抽取事件日志,再采用直接跟随图的可视化形式发现业务流程。

第二条路径是首先从面向对象的信息系统数据库中抽取出面向对象的事件日志,该日志包含了用户关心的数据库的所有信息。再根据用户需求将面向对象的事件日志转化为基于不同案例的XES日志(或者对应数据模型)。最后依然采用传统的流程挖掘技术进行分析。预计在以后的一段时间内,部分厂商会尝试采用这种方式进行流程挖掘。

第三条路径是直接从面向对象的信息系统数据库中抽取出面向对象的事件日志,然后采用专门的面向对象的流程挖掘技术进行分析。

 

06、结束语

 

Cenonis Process Sphere产品的推出,意味着面向对象流程挖掘技术的最终落地,也表明了流程挖掘商业化产品从2D到3D的跨越。相比传统流程挖掘,3D流程挖掘涉及到更为复杂的模型挖掘、一致性检测算法等核心技术。因此,我们可以预测,基于构建的在3D流程挖掘方面的技术壁垒,Celonis公司在未来一段时间内仍将继续保持其在流程挖掘商业领域的领先地位。同时,其产品在实际商业中的应用,也将进一步推动流程挖掘技术的发展和创新。

另一方面,尽管当前面向对象的流程挖掘技术已经成熟,但总的来说,其在各个领域和业务方面的实际应用价值还需要进一步探索。同时,如何让3D流程挖掘与BI、AI等技术以及领域知识有机的融合起来, 也是一个需要继续研究的方向。

未经允许不得转载:RPA中国 | RPA全球生态 | 数字化劳动力 | RPA新闻 | 推动中国RPA生态发展 | 流 > 面向对象的流程挖掘-3D流程挖掘简介

后台-系统设置-扩展变量-手机广告位-内容正文底部