全国高校外语教师研修网

语料库在外语教学与研究中的应用(北京) (2023/08/08-08/09)

已结束

内容综述

2023暑期研修 | 磨语料库研究利器,展数智时代新篇章——语料库在外语教学与研究中的应用”研修班

8月8—9日,外研社2023年暑期全国高等学校外语学科中青年骨干教师高级研修班第九期——语料库在外语教学与研究中的应用研修班在北京成功举办。本期研修班特邀北京外国语大学许家金教授刘鼎甲博士主讲,详细介绍了语料库语言学与语料库翻译学的发展脉络、语料库研究方法及应用、常用软件工具及其操作方法、ChatGPT等大语言模型与语料库的融合应用等内容,并通过实操讲解和实战演练,助力来自全国160余所院校的200余名高校外语教师夯实语料库理论基础,掌握语料库方法与工具,提升科研能力,改善教学实践。

研修会场

北京外国语大学 许家金教授

北京外国语大学 刘鼎甲博士

 厘清概念,掌握原则

研修伊始,许家金教授简要回顾了“语料库在外语教学与研究中的应用”研修班的发展背景与课程设置情况。随后,刘鼎甲老师梳理了语料库的源流,详细介绍了各个时期的语料库语言学流派、代表人物及研究成果。刘老师强调,语料库研究具有广阔的学科视野,大有可为。刘老师介绍了经典时代语料库研究中的基本术语,并阐述了与词相关的语料库统计方法以及语料库操作相关概念。

许家金教授介绍了文本编辑工具EditPlus和语料库文本检索分析工具AntConc的具体功能。通过多个研究案例,详细阐述了创建语料库的原则——目标原则、代表性原则和量的规模原则。接着介绍了COCA、BNC等大型主流语料库及其获取方式,展示了由北外语料库团队创建的多语种、多用途在线语料库集群(BFSU CQPweb)。许教授强调,在选择特定语料库之前,研究者应该详细了解该语料库的库容、所含语料文体等基本信息。此外,在建设语料库时,需要制定取样方案,或参考现有语料库的取样方案。

创建语料库的第一步是采集语料。许教授讲解了采集语料的基本操作,重点介绍了几种网页自动爬取方式,演示了如何运用idiom search网站确定检索关键词,并使用BootCaT工具自动爬取网页文本。许教授还讲解了如何利用Syntactic Complexity Analyzer、Readability Analyzer等工具来分析语料文本的词汇难度和句法复杂度。

驾驭方法,熟练操作

刘鼎甲老师介绍了不同类型语料库的标记规范,并强调了文本分类的完备性与边界性。他以新闻文本为例,示范了语料文本元信息标记的方法,并指导参班教师制作元信息表头。刘老师重点讲解了词性标注。在进行标注前,熟悉词性标注集是非常重要的,他详细介绍了UCREL CLAWS5和Penn Treebank P.O.S.等常用标注集。在此基础上,刘老师使用Tree Tagger和CorpusWordParser两种典型标注工具分别对英文和汉语语料进行分词和词性标注,并引导参班教师进行实际操练。

许家金教授带领参班教师解读了词性标注后的文本。他通过实例来说明,标注后的文本能帮助研究者快速检索特定的词类或短语结构,并分享了一些可用的语料库标注工具资源。随后,许教授通过AntConc语料库分析工具,演示了如何对标注好的语料进行统计分析。

数智融合,未来已来

语料库语言学发展到后经典时代,在描写语言现象的基础之上,通过统计、观测,更可以回答为什么出现此种现象的问题。刘鼎甲老师介绍了R语言的特点以及RStudio的界面功能。紧接着,两位主讲专家使用该软件详细示范了数据的可视化操作,并解读了统计分析结果。许教授以评价语言研究为例,演示了如何进行对应分析;刘老师以主语回指语研究为例,演示了如何用条件推断树进行统计分析。参班教师在主讲专家的引导下,一步步操练基于R语言的语料库数据分析。

语料库方法以其量化特征,回应语言学中形义对应关系这个根本问题。许教授通过《大学英语教学大纲通用词汇表》等实际案例,详细展示了语料库在英语教学中的应用。在教学大纲方面,可以利用语料库制作词表。在教材编写方面,可以利用语料库确定目标语言学习特征、提供真实口语语料、分析教材语言难度。在词典编纂方面,可以利用语料库抽取相关领域的专业词汇、创建词条。在课堂教学方面,许教授阐释了大语言模型在教学设计中的应用路径与方法,并使用Twee来演示视听说练习的设计。

刘鼎甲老师分享了语料库在翻译教学和研究中的应用案例。他从翻译中的词汇选择和表层结构入手,指出翻译教学中存在的规定性问题,进一步指出语料库翻译学是在描写译学的基础上建立起来的,并系统梳理了语料库翻译学的三个发展阶段。刘老师以自己对被动结构和大学介绍信息的翻译研究为例,演示了如何应用语料库进行翻译研究,从而解决翻译教学中的问题,改善翻译教学与实践。最后,刘老师向参班教师介绍了一系列语料库资源,如CQPweb、English-Corpora平台,BCC语料库等。

在读博士郭嘉雯、任俊强、杨宇航、殷俪恺同学和在读硕士宋瑛明同学担任助教,在研修过程中,及时解决参班教师操作实践中的问题。

道技合一,创意激荡

在小组实践活动中,六组教师利用ChatGPT等大语言模型开展外语教学或研究设计。西华师范大学宋莉老师、云南中医药大学孙雯老师、成都东软学院李少波老师、浙江工商大学杭州商学院杨仙菊老师、首都医科大学傅斯亮老师、黔南民族师范学院曾令忠老师代表小组展示了设计成果,主讲专家高度肯定了各小组的智慧与创意,同时进行了具有针对性的反馈和有益补充。

小组汇报代表

本次研修班由外研社高等英语教育出版分社李晓雨主持。两天的研修紧张而充实,在主讲专家的引导下,参班教师对语料库语言学与语料库翻译学的发展脉络、语料库研究方法及应用、常用软件工具及其操作方法有了深刻的了解。他们不仅从经典时代迈向后经典时代,还展望了ChatGPT等大语言模型为语料库研究和外语教学带来的便利与洞见。参班教师表示收获颇丰,课程内容实用,为自己今后的教学与科研奠定了深厚的基础。

外研社高等英语教育出版分社 李晓雨

外研社将一如既往为全国高校外语教师提供教学和科研全方位服务,与教师一道汲取学科育人新理念,探索教学改革新路径,构建外语教育新生态,落实“强师”基础要求,投身“强教”战略实践,共赴“强国”伟大征程!

 

乐思奖获奖名单