全国高校外语教师研修网

语料库在外语教学与研究中的应用 (2019/07/24-07/26)

已结束

内容综述

探索语料库新世界,助力外语教学——记2019年“语料库在外语教学与研究中的应用”研修班

为了促进科研方法的应用与创新,提升教学效果,2019年7月24—26日,北京市教育委员会、中国外语与教育研究中心和外语教学与研究出版社共同举办了“语料库在外语教学与研究中的应用”研修班。本期研修班特邀曲阜师范大学秦洪武教授、西安外国语大学黄立波教授、北京外国语大学张威教授、北京外国语大学中国外语与教育研究中心刘鼎甲博士,向来自全国27个省、市、自治区,142所学校的近320余位教师讲解了语料库语言学的主要概念、语料分析的基本方法和工具、语料库建设的原则与步骤,以及语料库在外语教学和语言研究中的应用等内容。本期研修班旨在通过讲解、示范与练习、小组实践,提高教师运用语料库进行教学与研究的能力。

研修现场

一、初识语料库

曲阜师范大学秦洪武教授为参班教师深入浅出地讲授了语料库研究的概述及基本概念。单语库、双语库、多模态库是语料库的三种类型。KWIC,Type / token ratio,Lexical density,Chunk,Collocation,Keyness,Cluster analysis,Sentiment analysis,是语料库的主要使用方式。例如,Chunk积累得越多,言语输出量就越多,流畅性就更大;Keyness主要用于分析两个文本的主要差异;Cluster analysis用于分析大批量文本,有助于判断文本所应用的主题;区别于传统语料库,Sentiment analysis用于宏观的评价与分析。

 

近年来,语料库的研究范围由词与句逐渐过渡到句与篇。秦老师说道,语言研究、语言教学研究、翻译研究、文学研究、跨文化研究是语料库在外语教学与研究中的主要应用方向。常用的方法包括定量研究和定性研究。通过频率和比较来验证语言使用的假设,然后按照设定的内容提取信息,发现规律性。通过提出假设,运用提取的语料数据验证假设属于证实性研究。不基于假设,确定特定侧面让数据分析产生数据,从而分析数据,这属于探索性研究,也是当前使用最广泛的研究。接着,秦老师介绍了语料库与语言学和应用语言学研究、文学研究、翻译和对比语言研究、社会科学研究的若干案例,让参会教师更深刻地了解了语料库的应用价值。秦老师说道,语料库的主要作用是描写,而非解释。掌握语料库的基本概念,可以为教师自己建设语料库,让语料库更好地服务于科研与教学作铺垫。

秦洪武教授

二、语料库工具

北京外国语大学中国外语与教育研究中心刘鼎甲博士带领参班教师通过工具实操深入了解了语料库的分析步骤。他首先提出语料库研究的基本思路,即提出研究问题或假设、获取或者自建语料库、对语料库中的数据进行信息抽取、数据分析。

 

文本(text)、形符(token)、类符(type)是语料库研究的三个基本术语。文本行索引(concordance)、搭配(collocation)、类连接(colligation)、词块(chunk)、词表(word list)、主题词表(keyword list)是语料库分析的基本方法。语料库的主要工具包括:面向文本的语料库检索分析工具(AntConc,BFSU_PowerConc1.0beta21c,Collocator,WordSmith 4),面向双语对齐文本的语料库检索分析工具(ParaConc,AntPConc,BFSU_ParaConc_1.2.2),以及语料库的文本处理工具(包括文本编辑器:Editplus 4,EmEditor8,PowerGREP;文本预处理:SRename,TextForever,TXT切割合并,WCopyfind.64.4.1.4,文本整理器_V5.0;词性赋码工具:SegmentAnt,TreeTagger3;DeTagging)。

 

通过现场带着参班教师实操演练,刘老师展示了Editplus, WordSmith,AntConc,BFSU PowerConc等一系列工具的具体应用。他强调语料库设计要考虑研究的问题、目标、对象和方法,考虑语料库的规模和用途,以及语料来源及版权的合法性。语料库的文本采样要考虑其代表性、平衡性、有限性。收集好语料之后,可以基于语料的特点与研究目标对语料进行预处理。

刘鼎甲博士

参会教师与专家交流

秦洪武教授详细介绍了语料库的建设流程,提到在确认研究目的和问题后,需要确定数据类型、数据范围和数据来源,通过对数据源的认知,确认数据的抽样方式,再进一步考虑文本的处理。而后,通过带领教师操作AntWordProfiler和SegmentAnt两种赋码软件,秦老师讲解了赋码标注的目的及方法。针对大部分教师望而生畏的正则表达式,秦老师则通过现场互动以及实战教学,一步步带领大家熟悉正则表达式的编写思路与应用。

参会教师与专家交流

三、语料库应用

理论讲解与实操训练之后,黄立波教授通过语料库与翻译语言研究的案例介绍了语料库的研究应用。首先,他说明了翻译语言研究的可行性。那么如何用语料库方法研究翻译语言呢?一是基于平行语料库的跨语言比较研究,二是基于类比语料库的语言内类比研究。研究翻译语言特征的落脚点在于对共性特征的解释。黄教授基于实际案例,详细解读了翻译语言研究的步骤:确定研究目标;就研究目标提出研究问题或假设;根据研究目标,确定(构建)适用于研究目标的语料库;选择能够充分体现(说明)研究对象的特定语言(形式)参数;以所选参数为切入点,在语料库中进行检索并提取数据;对数据进行统计分析;根据数据统计对研究对象进行量化描写;讨论描写的结果并从特定视角做出合理的解释。黄老师提到,对翻译语言的研究,无论运用类比还是平行模式,都是语料库翻译学在研究内容与研究方法方面的探索。

黄立波教授

北京外国语大学张威教授详细阐述了语料库翻译学的研究现状与趋势。语料库翻译学是以语言理论和翻译理论为指导,以概率和统计为手段,以大规模双语真实语料为对象,采用语内对比与语际对比相结合的方法,对翻译现象进行历时或共时的描写和解释,探索翻译本质的一种翻译学研究方法。语料库翻译学研究有理论研究、描写研究、应用研究三个领域。张老师为大家简单介绍了翻译普遍性、译者风格、类比分析与平行分析、有声思维法的翻译过程等基于研究层次的语料库翻译学,以及机器翻译、翻译教学、图书编写、词典编纂、译者培训、翻译批评等基于实践应用层次的语料库翻译学。最后,他提醒参班教师,在建设语料库之前,要考虑有无必要选取有特色的材料,不要盲目建设一个无用的语料库。此后,张威教授又为参班教师介绍了语料库与外语教学的相关知识,从理念、方法与实践三个方面进行分析。他提到,现代技术语境下的外语教学面临着挑战与机遇,相应地,语料库环境下的外语教学也有其必要性与可能性。外语教学语料库的建设有其基本原则、主要程序和主要工具。张老师为大家介绍了语料库外语教学模式的相关内容,包括教学资源、教学大纲,教材研发、词典编撰、技能培养、课堂组织、教学研究等。

张威教授

四、学以致用

经过两天半高强度的学习之后,参班教师也迎来了实践与应用的挑战。各个小组利用课余和晚上时间,积极讨论,利用所学的语料库知识设计可行的研究方案。研修第三天下午,各个小组就语料库在外语教学与研究中的应用进行汇报,小组成员分别阐述了研究问题、研究设计、预期成果与难题。秦洪武教授和黄立波教授对每组的汇报进行点评,提出可行性反馈和建议。

小组活动

教师进行大班汇报

经过三天的研修,参班教师不仅对语料库研究的基本概念及主要工具有了深入了解,也对如何建设语料库,语料库在外语教学中的应用有了全面认识。我们相信教师们一定会带着研修所收获的启发和鼓舞,投身到语料库的教学实践和研究中。