您所在的位置: 首页» 成果展示

【学会优博】王亚珅:基于概念化的短文本向量化表示及检索研究

编辑: 研究生院 发布日期: 2019-05-06 浏览量:

一、博士学位论文主要内容及创新点

  获奖学会:中国人工智能学会

  研究内容

  面向社交媒体短文本聚类和微博检索等实际应用中短文本表示建模面临的语义表达能力和通用性不足的问题开展研究,主要研究内容包括:

  1)支持异质语义关联关系协同建模推理的短文本概念化方案;

  2)支持模拟人类阅读注意力习惯的短文本向量化方案;

  3)支持微博检索噪声过滤的概念反馈查询扩展方案。

  

  创新成果

  1)创新性地充分利用概念与词语之间多种类型语义关联关系,提出基于Co-Ranking框架的短文本概念化算法,克服以往研究无法充分融合多种类型关联关系的缺陷,并在该研究方向中首次实现对上下文语境关键词的协同抽取。

  2)创新性地将语义层次更高的概念信息和基于人类阅读习惯建模的注意力机制引入到短文本向量化研究中,提出基于注意力机制的概念化句嵌入模型,显著增强所生成的短文本向量的语义表达能力和对“一词多义”现象的甄别能力,摆脱了特定领域和特定应用任务限制,使模型更具泛化能力和通用性。

  3)创新性地将短文本概念化和短文本向量化结果同时融入微博检索查询扩展研究中,提出面向微博检索查询扩展的概念反馈模型,有效过滤伪相关反馈文档中的噪声、提升扩展词语的质量,从而缓解微博检索任务存在的“词表不匹配”问题和输入信号不充足问题。

  

二、标志性成果

 

  学术论文

  1)Huang H, Wang Y, Feng C, et al. Leveraging Conceptualization for Short-Text Embedding[J]. IEEE Transactions on Knowledge & Data Engineering, 2018, 30(7): 1282-1295.(CCF,SCI二区,IF= 2.775

  2)Wang Y, Huang H, Feng C, et al. Community Detection Based on Minimum-Cut Graph Partitioning[100]// 16th International Conference on Web-Age Information Management (WAIM 2015). Springer International Publishing, 2015:57-69.(CCF推荐C类会议)

  3)Wang Y, Huang H, Feng C, et al. CSE: Conceptual Sentence Embeddings based on Attention Model[100]// 54th Meeting of the Association for Computational Linguistics (ACL 2016). 2016:505-515.(CCF 推荐A类会议,EI收录)

  4)Wang Y, Huang H, Feng C. Query Expansion Based on a Feedback Concept Model for Microblog Retrieval[100]// 26th International Conference on World Wide Web (WWW 2017). International World Wide Web Conferences Steering Committee, 2017:559-568.(CCF推荐A类会议)

  5)Wang Y, Huang H, Feng C, et al. Conceptual Sentence Embeddings[100]// 17th International Conference on Web-Age Information Management (WAIM 2016). Springer International Publishing, 2016: 390-401.(CCF 推荐C类会议)

  

  获奖情况

  2018.11月 获得2018年度中国人工智能学会优秀博士学位论文奖。

  2018.6月 获得2018年度北京理工大学优秀博士学位论文奖。