Google Brain的AI，实现了最先进的文本总结功能--RPA中国 | RPA全球生态 | 数字化劳动力 | RPA新闻 | 推动中国RPA生态发展

文本总结是机器学习算法的最佳应用途径之一，微软研究院最近发表的一篇论文证明了这一点。同时，文本自动总结功能有望减少企业员工阅读邮件的时间。一项调查表明，企业员工平均每天需要2.6个小时用来阅读邮件信息。近日，“谷歌大脑”（Google Brain）联合英国伦敦帝国理工学院构建了一个智能系统，利用Google的Transformers架构与针对抽象文本量身定制的文本总结系统，可总结包括：新闻、科学、故事、说明、电子邮件、专利以及立法法案等文本内容。

在上述所有文本形式中，Google Brain的AI完美的总结了1000个文本实例，其真实度与编辑、作家所撰写的内容几乎一样。正如研究人员所指出的那样，与执行技术相比，文本摘要旨在从输入文档中生成准确而简洁的摘要。抽象总结不仅可以复制输入中的片段，还可以产生新颖的单词或覆盖主要信息，从而使输出在语言上保持流利和人性化。

“情感探测器”是Google人工智能研究部门，Google Brain的研究人员在论文中介绍的一种神经结构。与所有深层神经网络一样，它们包含布置在相互连接层中的神经元，这些功能从输入数据传输信号并缓慢调整每个连接的权重，这就是所有AI模型如何提取特征并学会进行总结的方式。Google Brain的团队设计了一个数据训练模型，其中包含了整个文档中很重要的句子。人工智能必须通过利用网络和新闻文章来填补空白，包括研究人员编写的新语料库和网络文章等。

在实验中，研究小组选择了性能最佳的Pegasus模型：一种具有5.68亿个参数或从历史数据中学习的变量模型，通过从3.5亿个网页中提取的750GB文本（通用抓取）和从新闻网站收集的文章总计3.8TB。研究人员称，在流利性和连贯性方面达到了很高的语言质量，并且不需要人工进行修改、校准等处理。

继续阅读：Google Brain AI