情报探索

计算机软件及计算机应用论文_基于混合相似度度

 

文章摘要:由于装备信息的敏感性,军事领域的跨语言实体匹配问题会面临缺乏标注好的平行语料、依赖机器翻译质量等问题。从这些问题出发,提出了一种跨语言舰船实体匹配算法。首先归纳匹配规则,通过融合机器翻译和词典短语释义取得语言转换结果,设计了检测后缀相同字符串的相似度度量suffix-matter优化候选集,提高了算法的效率。还设计了捕捉字符和发音特征的混合相似度度量MixSim协助寻找匹配的实体。利用从互联网上爬取各国舰船活动事件的新闻报道和简式舰船数据进行实验,结果表明算法取得了较好的效果,而且证明了两种相似度度量在字符串比对中的有效性。

文章关键词:

论文DOI:10.13705/j.issn.1671-6841.2021297

论文分类号:TP391.1

上一篇:军事论文_于无声处听风云
下一篇:没有了