语言是人类最为复杂的认知功能之一,也是人类作为高级生物的决定性特质之一。不同语言之间具有极大的多样性。
据估计,全世界现存大约种语言,它们使用同一套发声系统(咽喉,声带,口腔,唇齿颚舌,等等),产生相似的声音要素,传达各自独有的语义。这就产生了一个关于人类语言特异性的根本问题:不同的人类语言是如何既共享同样的生理基础又各自拥有高度的特异性?
跨语言比较的实验范式示意图
年2月19日,医院神经外科吴劲松教授团队和加州大学旧金山分校华裔科学家张复伦(EdwardChang)院士团队的科学家们进行了一项跨语言的比较研究,最新成果以“人脑皮层在声调语言和非声调语言中的音高编码机制”(Humancorticalencodingofpitchintonalandnon-tonallanguages)为题在《自然-通讯》(NatureCommunications)上在线发表。
在这个项目中,两个团队的神经外科医生们各自利用颅内高密度皮层脑电技术(high-densityECoG),分别记录和分析了汉语母语者和英语母语者在聆听汉语和英语时的大脑皮层神经电生理活动。他们探索了音高(pitch)和声调(tone)这两个重要的语音元素在两类截然不同的语言群体中的神经表征机制,以及个体语言背景的差异对神经表征的影响。
在自然语言中,音高是极为重要的要素之一。在说话或者唱歌时,人类通过挤压肺部呼出空气,空气流过声带产生振动从而发出声音,同时我们通过控制喉部的肌群调节声带(vocalfolds)的振动频率从而控制音高的高低变化。在不同的语言中,音高可以表达丰富的语义(lexical)和语调(intonation)信息。依据音高是否表达语义信息,可以将语言划分为声调语言(tonallanguage)和非声调语言(non-tonallanguage)。
在声调语言中,仅仅改变单词的音高可以完全改变词义,例如/fu1/(夫)和/fu2/(福)是音节相同但是语义完全不同的两个词。而非声调语言中,音高的起伏变化主要用来表达情绪,态度,陈述以及疑问等等语调信息而并不直接改变词义。据估计,在现存的种语言中,有一半以上的语言是声调语言,全球一半以上的人口使用声调语言。其中,汉语普通话就是使用人口最多的声调语言。而英语则是使用人口最多的非声调语言之一。
众所周知,汉语普通话有四个声调,它们分别有各自特有的音高轮廓曲线。然而在自然言语状态下,受到不同的说话者本身的固有基础频率(女性的音高一般在-Hz,比男性的60-Hz高一倍左右),以及前后语境、情绪、句子短语结构等因素的影响,实际的音高轮廓曲线会与理想情况呈现较大的偏差,可能出现男性语者的高音高频率(第一声、第二声尾部与第四声头部)低于女性语者的低音高频率(第三声、第二声头部与第四声尾部),以及句尾的第一声(阴平)绝对频率低于句首的第三声(上声)的情况。这就要求在自然言语的条件下,聆听者必须能够有效且稳健地从声学线索中提取出准确的声调信息。
自然语言状态下的声调轮廓偏差示例:T1-相对较高的第一声(阴平),T1L-相对较低的第一声(阴平),T3-相对较低的第三声(上声)。在声学空间中,T1L与T3更为相似,而T1与T1L差异较大。
行为学实验表明,声调语言母语者依靠语者标准化的相对音高高度以及轮廓(speaker-normalizedrelativepitchcontour)来判别声调信息。而本文作者通过神经编码(neuralencodingmodel)的方法确认了这一心理语言学现象的神经机制,即位于颞上回(superiortemporalgyrus)言语听觉皮层的局部神经活动直接编码表达了语者标准化后的相对音高高度以及音高变化速率,而相反,这些局部的神经活动并不反应语者的绝对音高(absolutepitch)或者抽象的声调类别(tonecategory)。进一步的跨语言比较分析表明,这一局部神经编码机制是跨语言相通的:当同一个聆听者听到汉语以及英语语音时,汉语中语义相关的声调变化以及英语中的非语义语调变化采用相同的颞上回局部编码机制。
颞上回局部单电极神经活动编码了相对音高高度以及音高变化速率,而非绝对音高或声调类别。
(上)颅内高密度电极以及颞上回语言区;(下)平均神经响应信号以及不同编码模型的预测值。
当同一聆听者听到不同语言时,颞上回的局部神经编码机制是跨语言相通的:汉语中语义相关的声调变化以及英语中的非语义语调变化触发相同的颞上回局部编码机制。
另一方面,行为学文献表明,由于语言背景的不同,声调语言的母语者在听到不同声调时会进行分类感知(categoricalperception),即将在声音空间内线性变化的声调信号,在感知空间中非线性地映射到离散的声调类别中。而非声调语言母语者则会倾向于真实地感知连续变化的声调信号。为此,本文作者同样进行了对应神经机制的跨语言比较分析,结果表明对于同样的中文语音,汉语母语者的颞上回群体状态空间呈现分类感知的表达结构,而英语母语者的颞上回群体状态空间则更为接近于表达原始的声学空间。
群体编码性质统计以及状态空间分析表明,汉语母语者颞上回神经群体活动体现较强的声调分类以及类别结构表征的特性,英语母语者则与原始声音空间更为接近
由此,作者们揭示了音高在声调语言和非声调语言中采用相同的神经编码机制,并证明了这种编码机制会受到不同语言背景的影响。
该研究通过高时空分辨率的颅内脑电技术提出了神经语言模型的全新视角,即作为声学语言中枢之一的颞上回既参与了相对音高这一复杂声学特征的编码表征,也参与了声调这一语义相关的高级信息的处理和表征,而这两种不同级别的信息分别反映在同一皮层区域的局部和整体神经活动中。
(左)汉语和英文自然语句示例;(右)汉语和英语母语者颞上回听觉皮层的局部和群体神经活动分别编码不同层级的声学和语义特征信息
参考文献Li,Y.,Tang,C.,Lu,J.etal.Humancorticalencodingofpitchintonalandnon-tonallanguages.NatCommun12,().本文转自:brainnews