在教育数字化转型与人工智能技术迅猛发展的背景下,外语学科的“教”与“研”正面临重塑学习形态、创新教学模式、拓展科研维度的机遇与挑战。为助力师生把握技术赋能的核心逻辑,探索技术与外语学科教学、科研深度融合的实践路径,学院特别邀请业界知名专家与青年学者,为师生带来“技术赋能外语学科教学与科研”系列讲座。
在生成式人工智能技术迅速崛起、语言教学与研究面临深刻变革的背景下,如何坚守语言教育的实证基础,促进技术与语言教学的深度融合,已成为外语学科发展的重要议题。为进一步推动师生对数据驱动语言教学的理解,探索语料库与AI协同赋能的教学与科研路径,
2025年12月4日上午,西班牙穆尔西亚大学教授、香港教育大学客座教授、SSCI一区期刊ReCALL联合主编Pascual Pérez-Paredes在外国语学院为广大师生带来题为“Corpora first: Evidence-driven language teaching in the age of AI(语料库先行:AI时代下数据驱动的语言教学)”的专题讲座。讲座由张丹阳副院长主持,吸引了多名师生到场聆听。
Pascual在讲座开始时指出,在生成式AI被部分学者批评为“智力劳动的去芜存菁工具”甚至“高等教育杀手”的今天,语料库以其实证性、可验证性与透明性,成为语言教学中不可替代的锚点。他引用近期荷兰千余名学者联名反对AI在学术界无批判应用的公开信,强调语言教育必须坚持数据驱动,而语料库正是这种驱动力的核心来源。

Pascual随后系统比较了大型语言模型(LLMs)与语料库在语言呈现上的本质差异:LLMs追求流利与连贯,却往往掩盖语言的真实使用变异与语用复杂度;而语料库则如实反映语言在真实语境中的使用模式,包括频率、搭配、语域分布等关键维度。他以“scowl”一词为例,现场演示了如何通过BNC、COCA等语料库工具,获取该词在书面语与口语中的搭配模式、常用副词修饰(如darkly, fiercely)及介词结构(如scowl at),并指出这些细微差别往往是AI生成内容所忽略的。
讲座还介绍了English-Corpora.org平台最新推出的语料库与LLM协同分析功能。Pascual现场演示了如何一键将语料库检索结果(如“cap”的搭配词表)发送至GPT、Claude、DeepSeek等大模型,由AI进行语义聚类与解释,并将结果实时嵌入语料库界面。例如,“cap”的搭配词可被自动归类为“服装配饰”“金融税务”“极限环境”等语义集群,极大提升了数据解读效率。
Pascual强调,这种“语料库先行、AI辅助”的模式,不仅加速了语言数据分析过程,更重要的是保持了语料数据的中心地位与可追溯性,一定程度上避免了AI成为“黑箱”。他进一步提出“混合式人机工作流”设计理念:教师可引导学生先通过语料库自主观察语言现象,再使用AI进行归纳与解释,最后回到语料库验证AI输出的真实性,从而培养批判性AI素养。
Pascual结合其与Alex Boulton教授合著的新书,系统阐述了数据驱动学习(DDL)在AI时代的拓展方向。他指出,DDL不仅是一种教学方法,更是一种开放式读写能力的培养路径。学生通过操作语料库工具,发展对语言系统性的觉察力、对证据的敏感度以及对技术输出的批判性质疑能力。
他特别展示了如何利用语料库开展AI输出活动:例如,让学生对比AI生成的词汇搭配建议与语料库实际数据,识别AI在语用适切性、语域匹配度上的局限。这类活动不仅深化语言学习,也促使学生理解AI的运作边界与不确定性本质,形成技术清醒使用的态度。
讲座最后,Pasucal强调语言学习终究是关于意义建构、批判思考与表达自主性的过程。AI与语料库都是工具,而教育的核心仍是“人的发展”。在技术狂飙的时代,语料库作为一种稳定、透明、民主的语言资源,为我们提供了一条不忘本来、面向未来的教学路径。
活动现场气氛热烈,提问环节中,各位师生就语料库建设、期刊发表等问题进行了深入交流。本次讲座是一次关于语言教育本质、技术伦理与学科未来的深度思辨,它为外院师生在AI浪潮中保持教学与研究的实证性、批判性与人文性提供了重要启发。
