极客Java进阶训练营6期2022最新完结无密

#1

download:极客Java进阶训练营6期2022最新完结无密

如何使用Power BI进行流程挖掘
简介
数据粒度可以分为两类——事务性数据和分析性数据。事务性数据通常是最低级别的粒度,而分析性数据通常被汇总或聚合以达到更高级别的粒度。摘要或分析数据可用于仪表板、下钻或钻取分析,以执行根本原因分析、监控关键性能指标和其他类似目的。对于数据挖掘、机器学习或人工智能等分析,一般来说,是从事务性知识库中提取数据,通过挖掘进行采样或推断。当人们希望在同一个系统中采用数据挖掘和dashboard时,这两个数据流派的挑战就来了,因为一般来说,处理或消费不同粒度数据的系统是非常不同的。如果采用两种不同类型的系统来实现每种类型的数据处理,那么使数据消费者能够执行数据挖掘和仪表板是一项非常具有挑战性的任务。数据工程的现代趋势是使最终用户能够使用R和Python等数据框架以及各种本地和第三方智能可视化工具来执行与数据处理相关的各种任务。这些工具嵌入了数据分析所需的功能,并为最终用户的操作提供了标准接口。
不断生成和收集的最大数据类型之一是日志。根据生成日志的来源,日志有很多种。与操作相关的日志(如账单或事件)是数据日志的重要组成部分。数据科学的一个特定分支,致力于分析操作日志并从这些数据中生成操作智能,被称为过程挖掘。企业采用复杂系统构建大规模流程挖掘系统。为了以自助方式为最终用户执行初始流程挖掘探索,报告工具可用作起点,并且是最佳方式之一。Power BI desktop可以用作执行流程挖掘的起点。根据流程挖掘需求的复杂程度和深度,可以选择继续使用Power BI或者采用其他系统。
流程挖掘
因为我们将使用Power BI进行流程挖掘,所以假设人们已经在自己的机器上安装了Power BI Desktop。BI提供了开箱即用的本地可视化功能,并支持导入第三方可视化功能。进行流程可视化的一种方式是在Power BI外部进行数据的分析和准备,并使用它来报告预处理的数据,而进行流程挖掘的另一种方式是使用Power BI自身的智能可视化,可以在一定程度上进行流程挖掘所需的数据分析。在本文中,我们将使用第二种方法,我们将使用第三方可视化,它可以从Power BI的可视化库中免费获得。这个可视化厂商的名字叫ProcessM,可视化的名字叫Blpm和PmBI,都代表流程挖掘的商业智能。可能有许多其他供应商和这样的可视化软件可用于流程挖掘。我们将使用这个特定的可视化软件进行讨论,以实际了解流程挖掘对于流程挖掘新手来说是什么样子的。人们可以从这里导航到Blpm可视化。使用这种可视化的第一步是下载可视化控件本身,或者您可以选择下载附带的示例文件。正如可视化的描述中提到的,这种可视化在内部创建了一个可能类似于典型的联机分析处理(OLAP)立方体的结构,然后使用这些数据以力分流图的形式显示从数据中挖掘出的情报。

打开我们从这个可视化产品页面下载的报告示例文件。导航到报表的模型视图,如下所示。两个较小的表仅用于过滤,核心表是修复实例表。该表中的字段给了我们一个线索,即可能从该表中保存的账单数据进入挖掘过程结构的典型字段。

切换到数据视图,这将显示该表的实际数据。通过浏览和滚动该表的记录,可以发现该表中有很多事件,即与账单相关的数据。账单的客户通过名为Customer_Cluster的字段进行分类。“生命周期”字段捕获事件的阶段。

虽然组织有规定的流程,但在多方环境下,人们希望根据运营数据分析或理解自己遵循的流程,因此必须进行流程挖掘。为了可视化从这个可视化中推断出的信息,我们现在可以导航到这个示例报告的报告视图。这种可视化依赖于R在系统中的安装和对Power BI的访问。假设已经安装了R,当我们打开报告视图时,它会提示我们安装一些R包并为这个报告启用脚本。检查可视化先决条件,单击安装按钮,并允许安装包。

一旦软件包安装完毕,我们将能够查看根据我们之前看到的操作数据创建的过程的力导向图。图表中显示的每个实体显示了流程的阶段以及在该阶段发现的事件数量。一个实体与另一个实体的关联,以及连接两个实体的箭头所显示的关联权重,就是这种可视化的实际推断,对我们来说很容易,如果手动的话会花费很多时间。为了理解该可视化如何推断实体和连接它们的路径,考虑查看用于呈现该可视化的字段,这将提供对驱动该过程可视化的呈现的因素的更多洞察。

在非常高级的探索目的的基础级别上,这种可视化可以被视为过程挖掘的良好起点。在实际的真实场景中,人们可能需要更复杂的功能,其中可视化将获得更多智能,并解释导致流程图或从运营数据中提取的流程的因素。同一个供应商提供了另一个可视化流程挖掘,称为PmBI,如下图所示。从这个可视化的描述中,我们不难看出这是一个比前一个更丰富的功能。

如果我们在此可视化的示例Power BI报告文件中研究用于此可视化的数据,我们会发现它使用的数据与我们在之前的可视化中使用的数据相同,如下图所示。

在这里,我们可以看到使用该可视化工具创建的控制面板,如下图所示,一个直方图和一个漏斗图。在这里,数据以更有组织的方式显示,可视化提供了许多定制的功能。

如果我们将鼠标指针悬停在连接过程中不同步骤的任何一侧,我们将能够看到更详细的信息,如下图所示。

可以考虑通过点击这个可视化的菜单选项和格式选项来探索这个可视化的功能,从而充分挖掘这个可视化对于流程挖掘的潜力。
摘要
在本文中,我们学习了流程挖掘的一些基本知识,以及可以在Power BI中使用的案例。我们了解了流程挖掘类别中的可视化工具,并通过下载可视化工具和示例报告文件、分析数据和此类可视化工具的输出,了解了了解此类可视化工具的简单方法。