由教育部语言文字信息管理司、教育部语言文字应用研究所主办,中国中文信息学会协办、北京大学计算语言学研究所承办的“语言学研究手段现代化问题学术研讨会”于2005年11月12~13日在北京大学召开。
来自全国各地约60名语言学和计算语言学专家学者参加了本次会议,还有30多名学生旁听了会议。本次会议主要采用论坛讨论的方式进行,是语言学研究者和计算语言学研究者之间的一场精彩对话。会议集中讨论了以下三个主题:(1)信息处理能为语言学研究提供哪些服务;(2)语言学研究需要的信息处理技术和资源;(3)如何实现语言资源的开发和共享。与会者围绕这三个主题畅所欲言,达成了许多共识。
多学科交叉融合是现代科学研究的一个显著标志,计算机科学和语言科学联姻是信息时代语言学研究的一个必然趋势。计算机强大的记忆能力和准确的运算能力在很大程度上改变了传统记卡片式的语言研究方式,把语言研究者从繁重的资料搜集中解放出来,也在某种程度上改变了语言学研究的方法和准则。用计算机来处理自然语言向语言理论研究提出了新的挑战和新的要求,语言研究者应该直面这些挑战,在迎接挑战中找寻语言理论研究新的发展机遇。语言科学的研究成果也将反馈于信息科学,大大促进计算机科学的发展。无论是计算机处理语言,还是语言学研究者进行理论语言研究,都离不开语言资源。如何用有限的时间和有限的人力财力创建更为有价值的资源,如何有效地整合现有的资源,实现资源的共享,是计算语言学和语言学研究者都应该认真思考的课题。
12日上午,大会进行了语言资源的演示。北京大学、清华大学、教育部语言文字应用研究所、中国社会科学院、中国科学院、上海师范大学、南开大学、华中师范大学、南京师范大学、中国传媒大学等多家单位展示了语料库及其检索、语音实验室、语义知识词典等语言数据资源,显示了语言学和计算语言学研究者在语言资源建设方面已取得的丰硕成果。
教育部语言文字信息管理司李宇明司长在会上作了精彩的报告,说明这次会议的目的和意义,呼吁语言学者和计算语言学研究者相互合作,采取切实有效的措施来实现语言资源的集成和共享。
会上还宣布了一个令人高兴的消息:国家语委现代汉语语料库已加工好的2000万字核心语料,将通过中国语言文字网向社会提供免费查询服务,另外还拟提供一定数量的生语料和树库,供语言研究者免费下载。