语言信息化研究构筑国家信息安全屏障
核心提示语言信息技术是国家信息化发展的基石及保障国家信息安全的关键力量,尽早开发并推广国产操作系统是目前保障我国信息安全的当务之急。
语言是信息传播的主要载体,在经济全球化背景下,语言文字信息化对国家安全的影响也日益凸显。中央国家机关政府采购中心日前下发了《关于进行信息类协议供货强制节能产品补充招标的通知》,要求中央机关采购所有计算机类产品不允许安装Windows 8操作系统,以保护政府部门信息安全。在信息化时代,语言文字信息化是信息安全的基础。有学者表示,我国语言信息化技术发展缓慢,当前语言信息化面临的安全风险堪忧,国人所使用的计算机操作系统等重要软件,核心技术均为外国所掌握。武汉大学中国语情监测与研究中心主任赵世举将其形容为,“这就犹如我们的心脏和大脑被别人所掌控,埋下了很大的安全隐患”。信息化时代应如何确保信息安全?本报记者就此采访了相关学者。
语言文字信息化能力关乎国家安全
信息化催生虚拟空间、大数据、云计算等成为时代特征的关键词。“适应信息化时代的语言文字处理能力不仅影响我们的语言生活,而且决定着国家信息化水平与信息安全,制约着国家的"信息红利"。”北京语言大学党委书记李宇明表示。
我国是语言资源大国,拥有包括汉语和少数民族语言在内的100多种语言。赵世举介绍说,维护海量语言文字信息资源安全,保证其不受侵害、流失,这本身就是一大艰巨任务。尤其是随着信息技术的迅猛发展,信息资源的巨大潜能不断得到发掘,成为各种利益追逐的热点,更加大了其安全风险。
记者在采访中获悉,2006年,美国提出了“关键语言”战略,在这一战略的指导下,美国国防和情报部门开发了适用于汉语等的“跨语言情报侦查、提取及摘要系统”。据有关媒体报道,在英国,仅切尔腾纳姆市的政府信息中心就雇佣了300多名语言分析师,实时监测分析有关国家的重要信息。赵世举介绍说,美国现在正研发规模巨大的语言隐喻库,力图利用各种公开语言信息来探究不同文化背景的人的思维模式、心理特征和现实行为,借以获取语言背后隐藏的秘密。
对此,中国传媒大学教授侯敏表示,我国要摆脱种种限制,就必须在信息基础设施方面掌握核心技术,做到国家重要、关键信息网络的安全可控。其中,语言信息技术是国家信息化发展的基石及保障国家信息安全的关键力量,尽早开发并推广国产操作系统是目前保障我国信息安全的当务之急。
国家信息化建设离不开语言学研究
一系列信息安全危机向我国语言信息化建设提出迫切任务。近年来,国家语委、工信部、科技部等相关部门采取了得力措施。在规范标准建设方面,制定了《信息交换用汉字编码字符集基本集》等100多项信息处理用汉语言文字和少数民族语言文字规范标准;在语言技术创新方面,汉字处理技术的优秀应用成果不断涌现,并广泛应用于移动设备、机器翻译、搜索引擎、自动文摘、文本自动分类以及智能语音等领域;在语言资源建设方面,建设了国家语委现代汉语语料库等一系列语料库、知识库以及文化资源库;在少数民族语言文字信息化建设方面也不乏重大成果产生。但有学者表示,目前语言信息化水平与国家和社会的现实需求还有相当大的差距。李宇明认为,面对信息安全问题,亟须进一步提升语言信息技术以及处理各类事务的国家语言能力。
国家信息化建设以及信息安全的维护离不开语言学的研究,语言文字信息化研究向语言研究工作者提出了很多新要求新任务。侯敏说,过去,语言文字工作者主要研究的是面向人的问题;现在,不仅要考虑人的问题,还要考虑机器的问题。仅仅观察现实社会中的语言现象、解决现实社会中的语言问题还不够,还要关注虚拟空间中存在的语言现象,解决虚拟空间中存在的语言问题。
信息化需要语言研究者提供语言理论和语言知识。赵世举告诉记者,要解决语言文字信息的高效处理问题,无论是基本理念的确定,还是具体工程设计和工具研发,都必须按照语言文字的规律和特点来进行。
杭州师范大学教授冯志伟多年来致力于自然语言处理技术的研究。他介绍说,信息检索、信息抽取、信息过滤、文本数据挖掘、语种自动辨认、跨语言检索以及建立自然语言“计算模型”都是与信息安全息息相关的重要研究领域。
语言信息化研究需“文理兼顾”
语言文字信息化之路,我国尚处在起步阶段。有学者表示,尤其面临信息安全的挑战,目前形势不容乐观,无论在科学研发能力还是人才培养方面,都有较长的路要走。
由于网络信息安全问题是一个多边缘的、跨学科的交叉研究领域,需文理兼顾。冯志伟提出,通过语言学、数学、计算机科学等多学科的通力合作,把人类知识与计算机的计算能力有效地结合起来,为自然语言处理的形式模型提供大量的、丰富的“约束条件”,从而解决信息安全中的各种问题。赵世举也表示,语言文字信息化建设迫切需要建立多学科、多机构系统化协同攻关机制,加强统筹。
同时,也有学者提出,目前该领域研究的课题支持也远远不够,更多的是国家社科基金的支持。李宇明建议,由于语言信息化属于工科与人文学科交叉领域,国家自然科学基金项目应在语音信息处理、语言工程等相关课题上,面向国家战略给予更多引导与规划;基于不同领域专家的共同研究,设置语言文字信息化课题研发的统一架构及课题指导意见,引领更多的学者和科研团队加入到相关课题的研究中来。
侯敏提出,在提高重视程度、加大投入的同时,为避免重复开发,国家应投入资金建设基础设施和平台(如语料库、数据库、技术平台等),以最大程度实现语言资源共享,最大化地发挥有限资金的作用。
该研究领域具有学科交叉性,而人才培养却受制于学科鸿沟,跨学科培养实施困难,导致文理兼通的语言信息处理人才缺乏。侯敏建议,学界应对交叉学科倾斜,大力发展应用语言学,特别是与语言信息化关系最为密切的计算语言学,尽快培养适应信息化的复合型语言研究人才。
相关文章
- 1条评论
- 依疚路岷2022-05-29 04:47:06
- 是随着信息技术的迅猛发展,信息资源的巨大潜能不断得到发掘,成为各种利益追逐的热点,更加大了其安全风险。 记者在采访中获悉,2006年,美国提出了“关键语言”战略,在这