面试题:文本摘要中的NLP技术

2019 年 5 月 13 日 七月在线实验室


文本摘要中的NLP技术



析:

人类很难手动汇总大型文本文档。文本摘要是NLP为源文档创建简短、准确和流畅的摘要问题。

随着推送通知和文章摘要获得越来越多的注意力,为长文本生成智能且准确摘要的任务每天都在增长。

通过首先计算整个文本文档的单词频率来自动汇总文本。


然后,存储和排序100个最常用的单词。

然后根据它包含的高频词数对每个句子进行评分,更高频率的词,价值更大。


最后,根据它们在原始文本中的位置来获取和排序前X个句子。




文本摘要有两种基本方法:提取和抽象。
前者从原始文本中提取单词和单词短语以创建摘要。
后者是学习内部语言表示以生成更像人类的摘要,解释原始文本的意图。

提取摘要的方法是通过选择子集来工作。
这是通过从实际文章中提取短语或句子以形成摘要来完成的,LexRank和TextRank是众所周知的摘要总结,它们都使用了Google PageRank算法的变体。

· LexRank是一种无监督的基于图形的算法,它使用IDF修改的余弦作为两个句子之间的相似性度量。
该相似度用作两个句子之间的图形边缘的权重。
LexRank还采用了智能后处理步骤,确保为摘要选择的顶级句子彼此不太相似。

· TextRank是一种类似于LexRank的算法,具有一些增强功能,例如使用词形化而不是词干,结合词性标注和命名实体分辨率,从文章中提取关键短语,以及根据这些短语提取摘要句子。
除了文章摘要外,TextRank还从文章中提取了有意义的关键短语。

抽象概括的模型属于深度学习。
使用深度学习的文本摘要已经取得了一定的突破。
以下是一些NLP领域最大公司最显着的公布结果:

· Facebook的神经注意是一种神经网络架构,它利用基于本地注意力的模型,能够根据输入句子生成摘要中的每个单词。

· Google Brain的Sequence-to-Sequence模型遵循编码器-解码器架构。
编码器负责读取源文档并将其编码为内部表示,解码器是一种语言模型,负责使用源文档的编码表示在输出摘要中生成每个单词。

· IBM Watson使用类似的序列到序列模型,但具有注意力和双向递归神经网络功能。

更多面试题
关注后点击免费资料菜单
点击BAT面试题即可


想踏入人工智能领域?

大量学员拿到40万年薪左右

应届生秋招记录52万年薪


多位博士手把手教学

从零开始

培养机器学习工程师


原价18000元

前十人14599


现在报名

送18VIP

[包2018全年在线课程全年GPU]

2人及2人以上组团报名,可各减500元


快来扫它

查看详情

40万年薪不是梦



他用机器学习减肥20斤!程序员必看,你想不到的机器学习妙用


龙妈苟活还是凉凉,预测算法哪家准?


后台回复:“100”   免费领【机器学习面试100题

后台回复:“干货” 免费领【全体系人工智能学习资料

后台回复:“领资料” 免费领【NLP工程师必备干货资料


“阅读原文”你来决定未来的内容
你在看吗?
登录查看更多
15

相关内容

【ACL2020-复旦大学NLP】异构图神经网络的文档摘要提取
专知会员服务
34+阅读 · 2020年5月1日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
209+阅读 · 2020年4月26日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
NLP基础任务:文本分类近年发展汇总,68页超详细解析
专知会员服务
57+阅读 · 2020年1月3日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
225+阅读 · 2019年10月12日
学习自然语言处理路线图
专知会员服务
133+阅读 · 2019年9月24日
了解情感分析中的NLP技术么?
七月在线实验室
9+阅读 · 2019年4月12日
用深度学习做文本摘要
专知
24+阅读 · 2019年3月30日
赛尔原创 | 文本摘要简述
哈工大SCIR
22+阅读 · 2019年3月25日
3分钟看懂史上最强NLP模型BERT
新智元
22+阅读 · 2019年2月27日
NLP预训练模型大集合!
机器之心
21+阅读 · 2018年12月28日
独家 | 基于TextRank算法的文本摘要(附Python代码)
数据派THU
14+阅读 · 2018年12月21日
自动文本摘要
AI研习社
21+阅读 · 2018年10月27日
深度学习面试100题(第31-35题)
七月在线实验室
8+阅读 · 2018年7月16日
【NLP】十分钟快览自然语言处理学习总结
专知
17+阅读 · 2017年11月21日
Arxiv
13+阅读 · 2020年4月12日
Arxiv
3+阅读 · 2019年9月5日
Deep Learning in Video Multi-Object Tracking: A Survey
Arxiv
55+阅读 · 2019年7月31日
Arxiv
6+阅读 · 2019年7月11日
Arxiv
3+阅读 · 2018年12月18日
Conditional BERT Contextual Augmentation
Arxiv
8+阅读 · 2018年12月17日
Arxiv
21+阅读 · 2018年8月30日
Arxiv
6+阅读 · 2018年6月20日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关VIP内容
【ACL2020-复旦大学NLP】异构图神经网络的文档摘要提取
专知会员服务
34+阅读 · 2020年5月1日
深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
209+阅读 · 2020年4月26日
Transformer文本分类代码
专知会员服务
116+阅读 · 2020年2月3日
NLP基础任务:文本分类近年发展汇总,68页超详细解析
专知会员服务
57+阅读 · 2020年1月3日
深度学习自然语言处理综述,266篇参考文献
专知会员服务
225+阅读 · 2019年10月12日
学习自然语言处理路线图
专知会员服务
133+阅读 · 2019年9月24日
相关资讯
了解情感分析中的NLP技术么?
七月在线实验室
9+阅读 · 2019年4月12日
用深度学习做文本摘要
专知
24+阅读 · 2019年3月30日
赛尔原创 | 文本摘要简述
哈工大SCIR
22+阅读 · 2019年3月25日
3分钟看懂史上最强NLP模型BERT
新智元
22+阅读 · 2019年2月27日
NLP预训练模型大集合!
机器之心
21+阅读 · 2018年12月28日
独家 | 基于TextRank算法的文本摘要(附Python代码)
数据派THU
14+阅读 · 2018年12月21日
自动文本摘要
AI研习社
21+阅读 · 2018年10月27日
深度学习面试100题(第31-35题)
七月在线实验室
8+阅读 · 2018年7月16日
【NLP】十分钟快览自然语言处理学习总结
专知
17+阅读 · 2017年11月21日
相关论文
Arxiv
13+阅读 · 2020年4月12日
Arxiv
3+阅读 · 2019年9月5日
Deep Learning in Video Multi-Object Tracking: A Survey
Arxiv
55+阅读 · 2019年7月31日
Arxiv
6+阅读 · 2019年7月11日
Arxiv
3+阅读 · 2018年12月18日
Conditional BERT Contextual Augmentation
Arxiv
8+阅读 · 2018年12月17日
Arxiv
21+阅读 · 2018年8月30日
Arxiv
6+阅读 · 2018年6月20日
Arxiv
25+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员