文章摘要
技术思想及原理分析
文章摘要就是输入一篇文章,然后让模型去理解这篇文章的内容含义,再根据整体内容提炼出关键的信息做为这篇文章的摘要信息。很明显,模型的输入是一篇字数较多的文章,而模型的输出则是一段字数简短的摘要信息。也就是输入端和输出端的的字数长度都是不确定的。使用神经网络的方法就需要创建一个输入和输出长度都不一样的模型来实现。而语言模型的输入语料前后之间都是有关联的。基于循环神经网络RNN的复合变种模型SEQ2SEQ是比较适合来解决此类问题的。在SEQ2SEQ的模型中,主干网络可以是RNN,也可以是GRU、SRU等模型。下面是输入和输出长度都不一样的SEQ2SEQ模型,输入为4个值,输出为3个值。
应用场景及商业价值
文章摘要的主要应用在新闻行业较广泛,可快速对一些新闻提取重要观点内容,根据提取的观点内容进行分门别类,或者利用对新闻提取到的新闻观点,做为新闻概要展示或者做为读者快速阅读部分。对于其他类型的文章,也可以根据提取到的文章摘要来判断文章的观点等内容。