期刊精选

刘晓斌等 | 教你用语料库工具和词汇云图换种思路玩儿转语篇教学!

2020年08月28日
分享到

■ 摘要:本文从当前语篇教学的常见问题出发,提出基于文本关键词的数据驱动学习与教学方法。在对这种方法进行介绍的基础上,以教学设计案例的方式分析了如何利用语料库工具与词汇云图网站进行传统的和可视化的数据驱动教学方法。

 ■ 关键词:数据驱动;关联;语篇;关键词;高频词


《普通高中英语课程标准(2017年版)》(以下简称《课标》)要求在必修课程中掌握“语篇中的显性衔接和连贯手段,如:通过使用代词、连接词、省略句、替代等手段来实现的指代、连接、省略、替代等衔接关系”(中华人民共和国教育部,2018)。


很多教师在解读语篇的时候,只注重分析代表显性衔接和连贯手段的关联词,而忽视了段落和句子之间在内容上的内在关联。事实上,语篇中的关联,除了表现在关联词这一浅层的形式上,还突出地体现在语篇的关键词和高频词中


本文所介绍的方法,是基于文本关键词、高频词的数据驱动学习(Data-driven learning,简称DDL)与教学方法


关键词与数据驱动的教学

高频词汇通常是能够反映语篇的某些内容特征的关键词汇。在教学中要关注高频词汇、关键词汇,已逐渐成为语言教学界的一个共识。语言材料中多次“自然”出现的词汇或词组,通常都是重要的、值得关注的内容(Leech,2001)。


教师在教学中引导学生关注高频词、关键词,能够挖掘文本中隐含的内在关联,揭示语篇内容的隐性衔接手段。《课标》在词汇知识内容要求中也特别强调要“理解语篇中关键词的词义和功能以及所传递的意图和态度等”(中华人民共和国教育部,2018)。而关注高频词和关键词是本文要介绍的DDL模式的一种重要方法


DDL模式通过计算机工具,把有真实语境意义的句子以数据的形式呈现给学生,引导学生从句子或数据中发现语言的规律,使学习过程成为一种语言的探索过程(Johns,1993)。


数据驱动学习最常见的方式是使用语料库工具进行语言学习,如使用AntConc、WordSmith或网络上的BNC、COCA等查询工具,查询出大批语言实例之后,引导学生根据其语境特征的异同进行多层次的分类和归纳,逐步将其中带规律性的东西挖掘出来(何安平,2004)。


一般语料库工具特有的语境共现界面不仅能够提供大量的语料实例(concordance),在相对同质的大量语料中反复呈现不同语境里的同一种语言现象,而且以醒目的方式(不同的颜色)把检索项两侧的各种语境特征凸显出来,容易形成注意力的焦点,能帮助学生基于大量的语言现象进行观察、比较、分析,再在教师的引导之下,对语言规律进行归纳与总结(刘晓斌,2018)。


如图1显示的是利用AntConc工具查询人教版高中《英语》(2007年版)教材所有语篇中含有take一词的句子,利用语境共现功能凸显take及其后面两个词汇,以此可用来探究take一词的常见搭配情况。

640 (22)

图1. 使用AntConc查询含有take的句子


从以上例子可以看出,使用语料库工具的DDL可用于词汇和语法教学,其基本方法是大规模查询文本、总结大量语言现象后归纳语言规则。然而,近年来已有学者关注语料库工具如何基于单个语篇进行阅读教学(Cobb & Boulton,2015)。笔者所在的团队也多次在语篇阅读教学中实施基于语料库的数据驱动教学(Xu et al.,2019),其中前文提到的文本高频词和关键词能够发挥重要作用。


由于教材一般并不会专门提供文本的高频词和关键词信息,教师可利用语料库工具快速分析某个要阅读的文本,生成该语篇的关键词表(keyword list)数据,引导学生针对关键词信息对语篇脉络进行预测,形成宏观上的语篇内容初步关联。


如图2显示的是使用AntConc分析某阅读文本后形成的关键词表(其中Freq表示该词在文中出现的次数),教师可引导学生根据这些数据梳理语篇内容的内在关联;接下来可对语篇的每个重点段落或部分再分别进行分析,利用段落的关键词表及某些关键词汇的语境共现,引导学生从微观层面关注语篇句间的内容关联。

640 (23)

图2. 某阅读文本的关键词表


在以上整个教学过程中,教师引导学生关注的是代表着语篇中隐性衔接的关键词汇,从关键词汇入手来理解语篇的内容关联。这其中如果没有DDL工具的应用,很难快速形成客观且有效的关键词数据。本文第二部分将对基于语料库的数据驱动教学进行案例探讨。


随着信息技术的发展,数据的呈现越来越多样化、可视化和人性化,基于数据的学习已不仅仅限于专业的语料库工具,越来越多在界面上更加友好、更易用的工具开始走进课堂教学,词汇云图就是一个典型的例子。


词汇云图又称文字云图,依据计算机分析文本中的词频高低,把关键词生成为可视化的图像。一般来说,云图中词汇的字号越大、颜色越重、位置越靠近中心,说明其出现的频率越高。词汇云图可以满足学习者关注语篇中高频实义词的需要,生成线索词以供学习者梳理文脉(吴堤樱等,2019)。词汇云图一般通过专门的网站(如wordsift.org或wordart.com等),把阅读文本输入后即可自动生成。


如图3显示的是人教版高中《英语》(2007年版)必修三About Mark Twain一文在wordsift.org网站生成的词汇云图。图中所呈现的实际上就是该语篇在语料库工具中的关键词表,只不过这里使用了可视化的方式进行呈现,形式上对学习者来说更直观。教师可引导学生基于云图进行可视化数据驱动的教学。

640 (24)

图3. About Mark Twain一文的词汇云图


某些云图网站还能提供更多基于关键词的语篇分析功能,教师基于这些功能产生的数据可引导学生深入分析语篇的各种内在关联特征。


如图4显示的是在wordsift.org网站中,分别点击云图中的高频词river和writing后,在其word in context(语境词汇)界面下高亮显示的这两个词汇的语篇位置。

640 (25)

图4. river和writing两个关键词在文中的不同位置


教师可引导学生分析这两个高频词汇与语篇特征之间的联系。如river出现在文中前面的位置,是否意味着某河流在马克·吐温的童年占据重要的位置?而writing只出现在文中后半部分,教师可根据这点引导学生预测本文的语篇体裁特征,即关于作家生平介绍的叙事方法一般是怎么样的。这种基于关键词的可视化数据驱动教学,能够突破显性和表层的形式关联,深入到语篇的内在关联特征。


基于语料库的DDL教学

本部分将要呈现的是基于语料库关键词表和语境共现的一节完整的DDL教学案例。


1. 教学内容分析



教学内容选自人教版高中《英语》(2007年版)选修七Unit 5的阅读语篇Keep it up, Xie Lei!。文章主要介绍中国留学生谢蕾到英国留学遇到的问题和逐步适应的过程。


具体来说,文章首先介绍了谢蕾得知自己要去留学的心情和目前的学习情况,即正在读预科;然后介绍了她在留学生活中遇到的困难,如公交车费用的支付问题和语言问题等;接着具体介绍她在住宿方面和学校论文写作中遇到的困难;最后,介绍她将要参加学校社团活动。


本文是刊登在校报的一篇文章,多处直接引用谢蕾所说的话,显得有对话感。此外,由于文章按照预科学习、住宿、论文写作等方面介绍她遇到的困难和适应的过程,因此在同一段中的词语运用上呈现一定的逻辑顺序。


如:在第五段中,谈到论文写作时,出现了made a summary、revised、handed the essay in等论文写作步骤的动词(或动词短语),体现了谢蕾的写作过程。


2. 教学目标



在本课结束时,学生能够:


(1)根据语料库关键词预测文章的大意和结构;

(2)梳理主人公遇到的问题和采取的相应措施;

(3)根据语料库关键词归纳论文写作的步骤和要求;

(4)归纳并运用本文实现关联的手段,如:主题词、表示步骤的动词和名词、过渡句等。



3. 教学过程




Step 1 根据单元和文章标题,初步预测文章大意


教师展示该单元标题“Traveling abroad”和阅读语篇标题“Keep it up, Xie Lei!”,并使用一些问题引导学生预测内容。


如:

  • What information can you get from the title of the passage? 

  • What does“Keep it up”imply?

  • What is the relationship between the title and“traveling abroad”?


[设计意图]


教师通过问题引导学生关注标题中的“Keep it up”所隐含的两条主线,为什么要“Keep it up”和怎么样“Keep it up”,也就是遇到的问题和解决方法。学生接着将文章标题与单元标题联系在一起,预测文章可能涉及谢蕾在外国旅游的经历。



Step 2 观察语篇关键词表,进一步预测文章内容


教师使用AntConc,以本篇文章做成的文本文档为目标语料,以《新概念英语》语料库NCE(注:NCE是由广州市协和中学陈运良老师主持的语料库团队所建设的《新概念英语》语料库,内含《新概念英语》(1997年版)1—4册的全部阅读语篇。)为参照语料,生成该语篇的关键词表(见图5,呈现前20个)。教师指引学生将关键词按内容进行归类,将学生的答案呈现在黑板上。

640 (26)

图5. 阅读语篇Keep it up, Xie Lei!的关键词表


[设计意图]


学生在步骤1对文章大意进行了预测,步骤2 则进一步关注可能会从哪些角度介绍谢蕾的事情。完成两次预测活动后,学生基本能建立起本文阅读的主线框架。tutor、essay、authors、article、students等关键词主要是关于国外学习和文章写作的;而host和family则可能涉及她在国外的寄宿家庭;preparation可能涉及她的准备等。



Step 3 阅读课文,梳理文章信息


学生阅读课文,并根据步骤1、2所预测的文章大意和内容进行文章信息梳理,填写表格(见下表)。


表. 阅读语篇Keep it up, Xie Lei!的信息梳理 

微信图片_20200828165937


[设计意图]


本环节属于学习理解类活动,利用预测活动中形成的框架辅助梳理文章细节信息,有助于学生清晰了解主人公遇到的问题和解决的办法。



Step 4 利用语境共现理解生词,梳理论文写作要求和步骤,关注段内词语关联


(1)教师展现语料库工具AntConc中essay一词在本文的语境共现行(见图6),并利用一些问题引导学生全面理解essay的含义。

640 (27)

图6. essay 在文中的语境共现行


如:

  • Can you find out a synonym of essay in Line 1? 

  • What is the function of essay according to Line 2? 

  • Read Line 3 and try to sum up the possible procedures of writing an essay.


(2)教师呈现课文第五段的关键词表(已剔除虚词),要求学生重新阅读该段,将关键词分别填入“主人公认为的论文写作要求”和“真正的论文写作要求”的流程图内(见图7),阅读时需要关注语篇连接词。

640 (28)

图7. 第五段的关键词表与两个对应的流程图


(3)教师引导学生关注没有用上的四个关键词(tutor、autonomous、numb、revision)在这一段中的作用,并思考这四个关键词之间的联系。

 

在这一教学活动中,学生需要在文中重新阅读含有这四个关键词的句子,归纳出:tutor(导师)看到主人公写的论文后打了E等级。主人公感到numb(失去知觉的)并找到导师希望获得revision(修改)的建议。导师帮助主人公正确认识学术写作的要求,使她成为一个autonomous(独立的)学习者。


[设计意图]


在本教学活动中,学生先根据essay的前后语境信息对词汇进行深度理解。由于本段的写作顺序是从“主人公初稿的写作步骤”到“导师指引下的写作步骤”,通过将本段中的关键词填入流程图内,学生既能巩固词汇学习,也能借助这些名词和动词学习学术写作的步骤和要求。


最后,教师引导学生关注不涉及写作步骤的四个关键词,这四个关键词中的numb和revision所在句子是描述主人公谢蕾解决写作困难的过渡句(I was numb with shock! So I went to my tutor to ask the reason for his revision.),在该段中起着衔接的重要作用。



Step 5 归纳作者实现文本关联的手段


教师要求学生回顾本文的写作思路,归纳作者实现段际连接和段内连接的手段。


[设计意图]


这个活动主要是引导学生关注:


(1)本文在各段中叙述了主人公在国外留学时,在不同方面遇到的问题和应对办法,从而达到段落之间的连接;


(2)段内连接(第五段)主要通过一系列描写论文写作要求与步骤的动词和名词来体现,并在主人公的两次论文写作中加入了过渡句,从而强调导师指引主人公解决了论文写作的困难。



Step 6 作业


教师要求学生用100词左右叙述自己在线上学习开始时遇到的困难及解决方法,注意使用词语衔接和过渡句等文本关联手段(用下划线标注)。


基于词汇云图的可视化DDL教学

本部分将要呈现的是基于词汇云图的一个可视化DDL教学片段的案例,以人教版高中《英语》(2007年版)必修五Unit 1 John Snow defeats “King Cholera”为教学语篇。该文是一篇按照时间顺序展开的说明文,呈现了科学家研究的完整过程:


Find a problem(Para. 1)➡ Make a question(Para. 2 和Para. 3)➡ Think of a method & Collect results(Para. 4) ➡ Analyse the results(Para. 5)➡ Find supporting evidence & Draw a conclusion(Para. 6),最后一段(Para. 7)讲述研究对以后的影响。


文章逻辑清晰,每个段落的段首主题句都有表示篇章发展脉络的逻辑顺序提示词和显性衔接词。


如“the second theory”(Para. 3)、“First”(Para. 4)、“Next”(Para. 5)、“In another part of London” (Para. 6)、“To prevent this from happening again”(Para. 7)等。


教师在阅读之前提供一个热身活动,让学生猜测科学研究的步骤(见图8)。在阅读文本前,教师先让学生自主完成该任务,为后面的文章脉络梳理进行铺垫。


640 (29)

图8. 读前活动(部分)


在学生整体阅读文本、熟悉大意之后,教师将学生分成7个小组,每个小组提供一个段落的词汇云图(见图9),学生通过小组合作来回答3个问题:


① What are the key words of the paragraph? 

② Can you summarise the main idea of Para. 1 (2 / 3...) in one sentence using the key words as shown?

③ Which step(s) of scientific research does / do the paragraph(s) show?

图9

图9. 课文第一至七段词汇云图


在学生讨论时,教师引导学生关注云图中最显著的关键词,适当提示并引导学生讨论关注这些关键词如何暗示了段落主要说明对象的变化。


如第一段最显著的关键词是John Snow,暗示第一段主要介绍人物;而第二段最显著的关键词则是cholera,说明从第二段起,本文的主要关注点从人转变到事物上来;第三段最显著的关键词outbreak和500则暗示段落主要描述问题的严重性;从第四段的关键词street到后三段的关键词water的转变,则暗示主人公的研究一步步深入,最终确定了此次伦敦霍乱的来源是受污染的水。


在学生汇报小组讨论结果时,教师在黑板上板书,按照事件发展线索直观形象地呈现语篇描述的研究步骤和顺序,并同时板书每个研究步骤的关键词(见图10)。在这一步骤中,学生既学习到话题相关的语言知识,又清晰地理解了文章的发展脉络,加深了对内容关联的了解,深化了对主题语境的认识,提升观察、分析、归纳与建构的思维品质。同时,这样也有助于解决部分教师难以平衡语言教学与思维品质培养的问题。


640 (30)

图10. 教师板书原稿


在理解了篇章内容关联之后,教师再引导学生关注作者是如何利用显性衔接词进行篇章形式关联的,使学生深入理解文本意义建构的过程。总结段落大意并梳理文本说明脉络是在说明文阅读中培养学生思维品质的一个重要方法。通过总结梳理,学生既能深入理解文本关于What的信息,又能理解作者写作方法How的问题。但如果在阅读过程中教师只引导学生关注显性关联词,往往容易只关注表层形式的关联,而忽略了关联词背后所传达的内容关联。


从这个案例片段可以看出,词汇云图的使用能帮助学生在有关键词“脚手架”的基础上,自主总结段落大意并发现各段之间的内容关联。


结语

本文所介绍的DDL方法,主要是基于关键词信息所采取的教学方法。虽然关键词本身是语篇的微观元素,但诚如《课标》所指出的:“学习词汇不只是记忆词的音、形、义,更重要的是在语篇中理解和表达与各种主题相关的信息或观点”(中华人民共和国教育部,2018)。由于关键词表的产生是基于计算机对词频和文本等多重科学分析的结果,因此它已不仅仅是单个简单的词汇,其背后代表的是整个语篇内容关联的集中体现。因此抓住了文本关键词,也就抓住了语篇关联的重点。


作者简介

刘晓斌,华南师范大学外国语言文化学院副教授,硕士生导师,英语系主任。


罗伟雄,广东实验中学越秀学校英语教师,英语教研组组长,广州市高中英语中心组成员。


吴嘉慧,广东广雅中学英语教师。

*本文为全国教育科学“十三五”规划2017年度教育部重点课题“基于语料库智能学习平台的读写能力培养研究——以英语学科为例”(课题批准号:DHA170335)的阶段研究成果。以上内容摘自《英语学习》2020年第5期“热点·观点”栏目,原题为《以文本数据驱动的教学提升语篇关联的理解》。文章版权归《英语学习》所有,欢迎分享本文到朋友圈,如需转载请联系后台授权。


相关信息

关于我们

外语教学与研究出版社(简称“外研社”)由北京外国语大学于1979 年创办并主管,是一家以外语教育出版为特色,国内领先、国际知名的综合性文化教育出版机构。[了解更多]

京ICP备11010362号-42   京公网安备 11010802028551号  新出网证(京)字047号

京ICP备11010362号-42  京公网安备 11010802028551号  新出网证(京)字047号