所属栏目:计算机软件及计算机应用
【日期】:2024-09-16 【关键词】:自动关键词抽取;文本摘要;长文档建模;文档主题分析;语义处理;权重优化;向量相似性 【摘要】:为克服基于嵌入的关键词抽取方法在长文档上性能下降的问题,提出一种基于文本摘要的方法(summarization-based document embedding rank, SDERank)。将句向量的加权和作为文档嵌入,根据每个句子与文档主题的语义相关度赋予权重。以往基于嵌入的方法选择关键词时忽略候选词之间的关联,针对该问题,在SDERank的改进版SDERank+中,Pag...