多模态汉语儿童语言环境语料与数据库
语言能力是儿童早期发展的最基础能力,而环境则是影响儿童语言发展的最关键因素之一。在发展和语言心理学领域,大量研究结果表明,婴幼儿所处环境中的语言输入量、词汇多样性、互动性程度等特征,不仅能显著预测儿童的语言能力与发展水平,也与他们的多项认知功能紧密相关。
以往研究婴幼儿的语言环境,通常以家庭成员的父母语(又称儿向语)语料为研究对象。但当儿童长到2-3岁,进入词汇爆发和复杂语言结构高速发展时期,他们也开始接触更加多样化、跨模态的语言环境,如读绘本、看电视、使用pad等电子设备。因此,为了更全面了解这一阶段儿童的语言环境特征及其影响,需要将研究对象从父母语扩展到囊括多类模态的语料。然而,此类语料匮乏,导致我们对这一时期儿童语言环境的理解一直比较有限。
为了解决这一问题,华东师范大学心理与认知科学学院蔡清教授团队搭建了首个基于动画语料的汉语儿童视听语料库和语言数据库,并在实验与认知心理学国际知名期刊Behavior Research Methods发表了题为“CCLOOW: Chinese children’s lexicon of oral words”的论文,介绍该项数据库工作。该库是国际上首个基于动画视听语料的儿童语言数据库,统计了频率、语境多样性、词性等多项字词水平的特征指标,涵盖近200部热门动画片和动画电影、共270万字、180万词语料。这一数据库不仅对团队前期发布的CCLOWW汉语儿童书面字词数据库(Li et al., 2022)进行了补充,也提供了研究汉语儿童多模态语言环境的重要基础资源。
基于这两个跨模态语料库的字词统计指标,团队进一步开展了一系列儿童字词认读实验,以考察儿童的词汇知识如何受到跨模态语言环境的影响。结果发现,在预测二年级儿童的词汇认读表现时,视听语言环境中的词汇层面指标比书面环境中词汇指标的解释力更强,但书面环境中汉字层面的解释力更强。这说明,7-8岁儿童虽然已经开始识字且拥有一定阅读经验,但他们的书面词汇知识仍然极大地受到视听语言环境的影响。由于当前一年级语文教育以识字为主,因而书面环境中的汉字经验也影响着他们的词汇知识。此外,在另一项成人词汇认读实验中,团队还发现,CCLOOW儿童视听词频也能显著预测成人的词汇加工效率,并且,在成人词频 (来自SUBTLEX-CH数据库,Cai & Brysbaert, 2010)的影响之外,CCLOOW儿童视听词频信息对预测成人的词汇加工效率也有显著的额外贡献,这表明早期语言教育对语言能力发展的长足影响。
CCLOOW数据库已在线公开发布(https:// www.learn2read.cn/ccloow),免费供研究者、家长和教育工作者使用。用户亦可通过Learn2Read首页“儿童数据库”选择“口语数据库”访问。该在线数据库提供了基于动画语料统计的汉字、词层面的数据搜索和下载功能,用户可通过 “使用说明”查看对各项指标的解释和计算方法。
蔡清教授团队
截止目前,蔡清教授研究团队已开展一系列汉语语言数据库工作,包括CCLOOW儿童视听语言数据库、CCLOWW儿童书面语言数据库、SUBTLEX-CH电影字幕数据库。这些工作为心理学、语言学和教育学领域研究研究汉语加工、习得与发展提供了宝贵的基础工具。基于这些语料和数据库的后续研究正在进行中。此外,团队也通过结合行为学、影像学和基因等多种方法,广泛探索语言及其发展的认知神经机制问题。
华东师范大学心理与认知科学学院蔡清教授、明园晨晖学者王婧为本数据库相关论文的通讯作者,博士后李鸾为第一作者,本科生赵文涛、博士生宋明为本研究做出了重要贡献。研究得到了国家自然基金(31970987、32100857)、上海市科学技术委员会(19JC1410100)、上海市脑功能基因组学重点实验室开放课题和华东师范大学青年预研究项目(2022ECNU-YYJ021)的资助。
蔡清教授团队现正招聘博士后,欢迎对语言和儿童发展研究感兴趣的海内外优秀博士人才加入。有意者请联系:qcai@psy.ecnu.edu.cn。
论文信息:
Li, L., Zhao, W. T., Song, M., Wang, J., Cai, Q. (2023) CCLOOW: Chinese children’s lexicon of oral words. Behavior Research Methods. https://doi.org/10.3758/s13428-023-02077-6.
Li, L., Yang, Y., Song, M., Fang, S.-Y., Zhang, M.-Y., Chen, Q.-R., Cai, Q. (2022). CCLOWW: A grade-level Chinese children’s lexicon of written words. Behavior Research Methods. https://doi.org/10.3758/s13428-022-01890-9.
Cai, Q., & Brysbaert, M. (2010). SUBTLEX-CH: Chinese word and character frequencies based on film subtitles. PloS one, 5(6), e10729.