UiPath Web自动化——关于Web提取的一站式解决方案

后台-系统设置-扩展变量-手机广告位-内容正文顶部

企业和初创公司都在广泛结构化的基于Web的系统上设置应用程序。这些基于网络的系统中存在的信息非常复杂,需要大量处理才能阅读,理解和分析。那么,我们就需要机器人过程自动化。在UiPath Web Automation的帮助下,我们可以自动执行各种任务,如表单填写,屏幕抓取,数据提取网站测试等。

本文将介绍以下主题:

  • 什么是机器人过程自动化?
  • 什么是UiPath?
  • 什么是Web Automation?
  • Web Automation的用法
  • 实践:Google联系人的网页搜寻
  • 动手实践:从电子商务网站提取数据并存储在电子邮件中

在机器人/软件的帮助下自动化工作流程以减少人类参与的流程机器人流程自动化。

在这里,您需要了解的主要有三个术语: 机器人,流程 自动化。让我逐一向您解释这些术语。  

  • 机器人:  模仿人类行为的实体称为机器人。
  • 过程:  导致有意义活动的步骤顺序。例如,制作茶或您最喜欢的菜肴等的过程。
  • 自动化:  由机器人完成的任何过程,无需人为干预。

如果我们将所有术语汇总在一起,那么模仿人类行为来执行一系列导致有意义活动的步骤,而无需任何人为干预,这被称为机器人流程自动化。

现在,要实现机器人流程自动化,我们需要工具,其中一个工具是UiPath。那么,接下来在UiPath Web Automation的这篇文章中,让我们简要介绍一下UiPath。

什么是 UiPath?

UiPath是一款机器人过程自动化工具,主要用于Windows桌面自动化。该工具提供了一个社区版,该版本终身免费,并且具有拖放功能的功能。使用UiPath,您可以执行各种类型的自动化,如Excel Automation,Citrix Automation,Web Automation,PDF Automation等。那么,在本文中,我们将重点关注Web Automation。

Web Automation - Web Automation using UiPath - Edureka
 

什么是 Web Automation?

Web Automation是一个自动化过程,通过它您可以通过属性识别Web元素并相应地对其进行操作。这种自动化适用于任何网站,也可以远程部署在网络中的各种机器上。UiPath提供了一个内置的记录器,可以通过直观的图形工作流编辑器读取和制定基于Web的活动。
 

UiPath Web Automation | 自动化 Web 数据提取 – UiPath Studio

 

现在,让我们看一下UiPath中Web Automation的顶级实现。

 

Web Automation的用法

Usage of Web Automation using UiPath - Web Automation using UiPath - Edureka
当今行业中Web自动化的最佳用途是:

  • 数据提取:可以提取大量数据并将其存储到各种网站的文件和数据库中。
  • 记录:可以记录在网站上执行的操作,以便将来进一步实施。
  • 网站测试:您的网站功能和功能可以根据用户的要求进行测试。
  • 报告生成:可以通过提取所有数据然后在各种参数上对其进行分析来生成报告。
  • 应用程序转移:根据使用要求,可以将应用程序从一个域转移到另一个域。

Web抓取可用于各种类型的网页格式,例如JSON,HTML。现在,您知道什么是Web自动化,让我们看看如何使用UiPath执行Web Automation的实用方法。我们将在本文中看到两个实践。他们是:

  • 从Google通讯录中抓取数据
  • 从电子商务网站抓取数据并存储在电子邮件中

让我们从本文关于UiPath Web Automation的第一篇实践开始。

Hands-On: Web Scraping of Google Contacts

实践:Google联系人的网页搜寻

任务

 从Google通讯录中提取数据并将其存储在文件中。

自动化的步骤

按照以下步骤完成任务:

  • 使用Data Scraping工具提取数据。
  • 相应地提取相关值。
  • 使用“写入CSV”活动将数据存储在CSV文件中。

第1步: 打开Goog​​le通讯录页面以提取数据。

第2步: 现在,打开UiPath Studio并创建一个黑色项目。

Blank Project-UiPath Web Automation-Edureka
步骤3:
从功能区中选择Data Scraping选项,然后选择要选择的元素。在下面的对话框中Next  

Select-Element-UiPath Web Automation-Edureka
步骤3.1:
 将鼠标悬停在数据源字段上,然后单击数据源字段。 在这里,我想选择名称。

Hover Mouse To Extract Data-UiPath Web Automation-Edureka
步骤3.2:
 之后,您将看到另一个对话框,它将要求您选择第二个元素来创建模式。

Select-Second-Element-UiPath Web Automation-Edureka
第4步:
  选择第二个元素创建模式后,您将获得配置列的选项  在打开的对话框中,您还可以重命名列名称和提取URL。之后单击Next请参阅下文。

Configure-Columns-UiPath Web Automation-Edureka
步骤5:
 现在,要从网站中提取其他数据源,请单击“  提取关联数据”  选项并重复上述步骤。在这里,我将提取联系人的电子邮件ID。您会看到以下输出。

Extracted Data-UiPath Web Automation-Edureka

步骤6: 完成提取所有必需数据后,单击  Finish 此操作将打开一个对话框,询问您是否希望跨多个页面跨越数据。请参阅下文。

Span-Multiple-Pages-UiPath Web Automation-Edureka

步骤7: 要跨越多个页面,请选择“  是”  并将鼠标停在将您重定向到下一页的区域上。然后,您将被重定向到您的UiPath仪表盘。 

步骤8: 现在将所有提取的数据存储到.csv文件中,将Write CSV活动拖到  Data Scraping  的  Do  部分  

步骤9: 在 此活动的“  文件路径”部分中,提及 要存储提取数据.csv文件路径,然后 在  DataTable部分中提及 ExtractDataTable变量请参阅下文。

Write CSV Activity- UiPath Web Automation-Edureka

注意:ExtractDataTable变量是从Data Scraping Wizard自动生成的输出变量。您可以在Extract Structured Data活动中找到此变量。

步骤10: 单击 Run 按钮执行此序列您会看到数据存储在.csv文件中。

现在知道如何从网站获取数据,让我们继续本文关于UiPath Web Automation的第二篇实践。

动手实践:从电子商务网站提取数据

任务

在这个实践中,我的任务是设计自动化,读取电子邮件的主题并执行自定义搜索。例如,如果我的主题说LG电视,那么,设计的自动化必须在Flipkart中搜索LG电视并提取名称,URL和价格。

自动化的步骤

按照以下步骤完成任务:

  • 拖动“获取IMAP邮件”活动并配置活动。
  • 拖动For Each活动以执行一组操作。
  • 拖动“打开浏览器”活动并提及URL
  • 使用Data Scraping工具并提取数据。
  • 相应地提取相关值。
  • 拖动Write CSV活动并提及文件路径。
  • 使用“发送SMTP邮件”活动发送电子邮件。

第1步:创建一个空白项目

第2步:我们的第一个任务是获取包含主题的电子邮件。在这里,我希望主题是苹果手机。因此,要执行此操作,请拖动“ 获取IMAP邮件”活动。

步骤2.1:转到此活动的“ 属性”窗格,并提及以下内容:

  • 港口号码:993
  • 服务器名称:“imap.gmail.com”
  • 电子邮件:提及您的电子邮件ID
  • 密码:提及您的密码
  • 上图:1(这将只读取1  在收件箱中的电子邮件。)
  • 选中只读未读邮件框。(这只会读取未读消息。)

请参阅下文。

Get IMAP Messages-Element-UiPath Web Automation-Edureka

步骤2.2:现在要存储来自电子邮件的数据,我们需要创建一个变量。因此,要创建变量,请转到变量窗格并提及变量的名称和类型。在这里,我将提到名称为M ailMessages并输入List <T>
 

步骤2.3:现在,在<T>中,您必须提到邮件消息为此,请在变量部分中浏览类型并搜索System.Net.Mail。 在此部分下,您必须选择MailMessage请参阅下文。

Create Variable-UiPath Web Automation-Edureka

步骤2.4:在“ 获取IMAP邮件消息”活动的“输出”部分中  提及变量MailMessages

步骤3:现在,要为“n”个电子邮件启用信息,您必须在“ 获取IMAP邮件”活动下方拖动“ 每个”活动。

步骤3.1:  接下来,在项目部分提及邮件,并在表达式部分中,提及MailMessages变量。这将使您能够为每个邮件执行“正文”部分中提到的一组操作。此外,在此活动的“ 属性”部分中,将Type Argument提及System.Net.MailMessage请参阅下文。

For Each Activity and Type Argument -UiPath Web Automation-Edureka

第4步:现在,您必须打开Flipkart网站。为此,您必须在F 或每个活动的“ 正文”部分拖动“ 打开浏览器”活动并在双引号中提及该URL。在这里,我将搜索Fossil手表并提及URL。

注意:搜索的内容无关紧要,因为我们将在下一步中更改URL。
 

第5步:现在,由于我们的任务是阅读主题行,然后搜索主题行中提到的项目,我们必须修改Open Browser活动中提到的URL

因此,如果您的网址如下:

https://www.flipkart.com/searchq=fossil%20watches&otracker=search&otracker1=search&marketplace=FLIPKART&as-show=on&as=off,然后您更改了搜索参数下的项目,在引号中包含 + mail.Subject +因此,您的新网址应如下所示。

https://www.flipkart.com/search?q="+mail.Subject+"&otracker=search&otracker1=search&marketplace=FLIPKART&as-show=on&as=off

请参阅下文。

Open Browser Activity -UiPath Web Automation-Edureka
 

直到现在,您已设计自动化以阅读电子邮件的主题行,然后在Flipkart网站中执行自定义搜索。因此,如果主题行有苹果手机,那么设计的自动化将读取主题行并在Flipkart中搜索苹果手机。

现在,我们的下一个任务是执行数据抓取。

步骤6:要执行数据搜集,您可以参考我们之前的实际操作并执行1-7中步骤

步骤7:现在,一旦您抓取数据并重定向到UiPath仪表盘,您必须删除附加浏览器活动,并将ExtractDataTable部分保留在For Each活动Body部分

步骤8: 之后,将所有提取的数据存储到.csv文件中,将Write CSV活动拖到  For Each Activity  的  Do 部分

步骤9: 接下来,在 此活动的“  文件路径”部分中,提及 要存储提取数据 .csv文件路径,然后 在  DataTable部分中提及 ExtractDataTable变量请参阅下文。

Write CSV Activity -UiPath Web Automation-Edureka

步骤10:现在,要获取包含所有数据的电子邮件,您必须在序列中拖动“ 发送SMTP邮件”活动

步骤10.1:在此活动中,您必须提及以下内容:

  • 电邮地址:“abc@gmail.com”
  • 主题:“附件”
  • 主体:“PFA”

此步骤将设计任务以将包含已删除数据的电子邮件发送到提及的主题行附件和主体为PFA的To电子邮件地址。请参阅下文。



步骤10.2:
由于我们尚未附加文件,因此要附加文件,请单击此活动中的“ 附加文件”选项,并在打开的对话框中提及该文件的路径。然后单击确定。请参阅下文。

Attach Files -UiPath Web Automation-Edureka
 

步骤10.3:现在,您必须转到SMTP活动属性窗格并提及以下内容:

  • 端口号 - > 465
  • 服务器名称:“smtp.gmail.com”
  • 电子邮件:提及FROM电子邮件地址
  • 密码:提及FROM电子邮件地址的密码
  • 发件人:提及FROM电子邮件地址

SMTP Properties -UiPath Web Automation-Edureka

步骤11:现在,使用主题行apple%20phones(%20用于标识UiPath中的空间)向自己撰写邮件收到邮件后,返回UiPath仪表板并单击“ 运行”以执行自动化。您会看到包含已删除数据附件的邮件。请参阅下文。

Final Output -UiPath Web Automation-Edureka
以上是关于UiPath Automation示例的文章,希望大家喜欢阅读UiPath Web Automation这篇文章并学习如何自动执行任务。

未经允许不得转载:RPA中国 | RPA全球生态 | 数字化劳动力 | RPA新闻 | 推动中国RPA生态发展 | 流 > UiPath Web自动化——关于Web提取的一站式解决方案

后台-系统设置-扩展变量-手机广告位-内容正文底部