Google Brain的AI,实现了最先进的文本总结功能

后台-系统设置-扩展变量-手机广告位-内容正文顶部

文本总结是机器学习算法的最佳应用途径之一,微软研究院最近发表的一篇论文证明了这一点。同时,文本自动总结功能有望减少企业员工阅读邮件的时间。一项调查表明,企业员工平均每天需要2.6个小时用来阅读邮件信息。近日,“谷歌大脑”(Google Brain)联合英国伦敦帝国理工学院构建了一个智能系统,利用Google的Transformers架构与针对抽象文本量身定制的文本总结系统,可总结包括:新闻、科学、故事、说明、电子邮件、专利以及立法法案等文本内容。

 

 

在上述所有文本形式中,Google Brain的AI完美的总结了1000个文本实例,其真实度与编辑、作家所撰写的内容几乎一样。正如研究人员所指出的那样,与执行技术相比,文本摘要旨在从输入文档中生成准确而简洁的摘要。抽象总结不仅可以复制输入中的片段,还可以产生新颖的单词或覆盖主要信息,从而使输出在语言上保持流利和人性化。

 

“情感探测器”是Google人工智能研究部门,Google Brain的研究人员在论文中介绍的一种神经结构。与所有深层神经网络一样,它们包含布置在相互连接层中的神经元,这些功能从输入数据传输信号并缓慢调整每个连接的权重,这就是所有AI模型如何提取特征并学会进行总结的方式。Google Brain的团队设计了一个数据训练模型,其中包含了整个文档中很重要的句子。人工智能必须通过利用网络和新闻文章来填补空白,包括研究人员编写的新语料库和网络文章等。

 

在实验中,研究小组选择了性能最佳的Pegasus模型:一种具有5.68亿个参数或从历史数据中学习的变量模型,通过从3.5亿个网页中提取的750GB文本(通用抓取)和从新闻网站收集的文章总计3.8TB。研究人员称,在流利性和连贯性方面达到了很高的语言质量,并且不需要人工进行修改、校准等处理。

未经允许不得转载:RPA中国 | RPA全球生态 | 数字化劳动力 | RPA新闻 | 推动中国RPA生态发展 | 流 > Google Brain的AI,实现了最先进的文本总结功能

后台-系统设置-扩展变量-手机广告位-内容正文底部