面向人民日报语料的新闻自动摘要生成
Automatic Summary Generation of News for People’s Daily Online Corpus
-
作者:
梁媛
1,2
王东波
1,2
黄水清
1,2
-
作者单位:
-
提交时间:2023-10-08 09:44:10
摘要: [ 目的 / 意义 ] 面向主流新闻媒体人民日报语料展开研究,旨在为文本自动摘要研究
提供思路和实践支撑,进而应用到新闻等相关文本信息处理中,为知识聚合服务和信息获取
途径研究做出贡献。[ 方法 / 过程 ] 以新时代人民日报语料 NEPD 中的 2015 年 1 月、2015 年
6 月和 2016 年 1 月的人民日报分词语料作为实验语料,基于 TF-IDF、Textrank 等抽取式自
动摘要算法,以及基于指针生成网络的生成式自动摘要模型展开研究,并对摘要结果进行分
析评价。[ 结果 / 结论 ] 实验设计面向人民日报语料的新闻抽取式自动摘要算法,构建面向人
民日报语料的新闻生成式自动摘要指针生成网络模型,并通过 Rouge 指标(包括 Rouge-1、
Rouge-2和 Rouge-L 3种指标)对实验结果进行评测,为人民日报分词语料的应用提供具体思路,
并对新闻自动摘要系统研究提供语料支持和实践支撑。
版本历史
[V1] |
2023-10-08 09:44:10 |
ChinaXiv:202310.00635V1
|
下载全文 |