信息检索方法与技术开放论坛之跨语言检索篇
时间:2011-01-07 23:52:55  来源:  作者:simyjs  点击量:
    2011年1月6日下午1点,70后信息检索方法与技术团队按常例进行开放式讨论,此次讨论主题是信息检索中的跨语言问题,切入点是命名实体的翻译。

    青年教师吴丹就她最近的研究介绍了命名实体(人名、机构名、地名以及其他所有以名称为标识的实体)对跨语言信息检索的影响,对于命名实体的翻译主要有三种模式:①给定源语言实体名,用机器翻译方法直接进行翻译,得到目标语言实体名;②给定源语言实体名,用网页挖掘辅助翻译的方法找出目标语言的实体对应;③源语言实体名未知,批量地从语料库或网页中抽取实体翻译对应。吴丹老师分别就多种翻译模式进行了对比分析,研究结果证实了对命名实体的识别与准确翻译可在一定程度上改进信息检索的效果。

    命名实体的翻译在机器翻译、跨语言信息检索、多语言命名实体对抽取、平行语料库对齐等众多领域占据重要地位,是信息检索的基础性工作。


 

                                                          2010级情报硕士  吴雪峰  供稿

最近更新

点击排行