阅读理解
技术思想及原理分析
阅读理解和前面所讲的文章摘要刚好相反,文章摘要是把长篇文章内容压缩成简短的概要,以供读者快速阅读或者分辨;而阅读理解是根据文章中的某段话,提出自己的理解。一篇文章中的一句话很短,但是在阅读理解中却要花费较长的语句来描述,比如文章中说了一句话,要理解这句话的引申义,就需要更多的文字来描述,所以阅读理解输入是较短的语句,输出则是较长的语句。阅读理解对于模型的难度往往比文章摘要高的多,其主要原因就是一句话的语境不同,其要表达的含义也不同,所以要理解文章中某句具有特殊含义的话,需要进入文章中的相关前后文去理解才行,甚至很多模型需要加入注意力机制来更好的理解语句的含义。阅读理解的深度学习模型有BIDAF、R-Net、QANet以及目前在语言模型较火的transformer、Bert、GPT系列等。左图展示的是QANet模型的结构。
应用场景及商业价值
阅读理解的应用范围非常之广,可以说如果AI真正的掌握了阅读理解,也就实现了真正意义上的认知智能。目前AI在阅读理解方面学到的知识非常有限,只能做一些基本的理解,无法做到像人类一样,能够理解到同样的语言子啊不同的语境下的含义,不过随着AI的发展,尤其是以深度学习为主的模型的快速发展,相信不久就能够看到和人类阅读理解能力相当的智能产品了。