航天科工集团208所语言实验室开展“党的二十大报告”和《新时代的中国北斗》白皮书的语料库建设

  党的二十大胜利闭幕后,航天科工集团208所人工智能与语言科技实验室第一时间组织对党的二十大报告多语版内容开展了语料库建设工作。随着《新时代的中国北斗》白皮书发布,语言实验室也同步进行了该文件术语语料的提取加工。

  语言实验室本次以中、英、法、俄、德五个语种为主,进行了语料获取、语料清洗、语料对齐、术语提取等工作,初步形成党的二十大报告的中英、中法、中俄、中德系列语料库,以及《新时代的中国北斗》中英语料库及术语库,可导入多语智能翻译系统和文本分析工具中助力翻译工作和语言分析,后续将围绕语料标注、多语平行语料库构建开展相关工作。

  该语言实验室是基于国家语言战略不断发展、智能科技广泛应用的背景下成立的,旨在创新开展智能科技引领下的翻译理论方法和实践范式研究,重点探索人工智能与翻译技术的深度融合与广泛应用,不断完善国防科技翻译体系,加强前沿技术赋能的语言能力建设。

  此次术语语料库建设是该语言实验室在语言资产挖掘和管理方面的一次成功尝试,未来,语言实验室将在术语提取、语料标注、数据挖掘等方面持续发力,继续加强语言资产管理,打造高质量的多语言国防科技术语语料库,利用多语言智能翻译系统不断完善语言资产数据平台建设,从而为科技情报提供语言信息的强力支撑。

 (郭宇)

   

编辑:李芊诺

责编:张永杰

审核:陈雪辉

文章内容来自网络,如有侵权,联系删除、联系电话:023-85238885

参与评论

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

评论区