分子遗传学和生物信息学在回族学研究中的应用初探
———分子遗传学和生物信息学在回族学研究中的应用初探
谢小冬,王希隆, 周瑞霞, 马克君
(兰州大学民族基因研究所,甘肃兰州730020)
摘 要:
为探讨回族学学科体系与方法论创新问题, 进一步揭示回族的群体遗传特征和起源、迁徙途径, 本文将分子遗传
学和生物信息学的方法移植到回族学研究中。对回族和相关的国内外人群的Y 染色体上SNP位点的多态性数据进行了研究, 使用A rlequ in2. 0软件计算了Fst遗传距离, 并且进行了主成分分析, 结果显示分子遗传学和生物信息学的方法对回族起源迁徙研究得出的证据可以与结合民族研究的成果和相关历史资料相对应;证明分子遗传学和生物信息学的方法可以很好地应用和移植到回族学研究中;同时, 分子遗传学和生物信息学在回族学研究中的成果将为回族群体的医学基因组学、药物基因组学研究开辟新的领域, 直接为回族群体的人口健康服务。
关键词:回族;回族学;遗传学;生物信息学;族源
中图分类号:C951 文献标志码:A 文章编号:1002 - 0586(2006)04 - 0027 - 04
谢小冬,王希隆, 周瑞霞, 马克君
(兰州大学民族基因研究所,甘肃兰州730020)
摘 要:
为探讨回族学学科体系与方法论创新问题, 进一步揭示回族的群体遗传特征和起源、迁徙途径, 本文将分子遗传
学和生物信息学的方法移植到回族学研究中。对回族和相关的国内外人群的Y 染色体上SNP位点的多态性数据进行了研究, 使用A rlequ in2. 0软件计算了Fst遗传距离, 并且进行了主成分分析, 结果显示分子遗传学和生物信息学的方法对回族起源迁徙研究得出的证据可以与结合民族研究的成果和相关历史资料相对应;证明分子遗传学和生物信息学的方法可以很好地应用和移植到回族学研究中;同时, 分子遗传学和生物信息学在回族学研究中的成果将为回族群体的医学基因组学、药物基因组学研究开辟新的领域, 直接为回族群体的人口健康服务。
关键词:回族;回族学;遗传学;生物信息学;族源
中图分类号:C951 文献标志码:A 文章编号:1002 - 0586(2006)04 - 0027 - 04
【前言】
回族是中国少数民族中散居全国、分布最广的民族。根据2000年第五次全国人口普查统计, 回族人口已达9 816 802人, 在我国56个民族中人口数位居第四。回族除聚居于宁夏回族自治区外, 在甘肃、青海、新疆以及河南、河北、山东、云南等省分布也较多, 形成大小不等的聚居区, 呈现出“大散居, 小聚居”的特点。
回族非原生型民族,而是由众多民族融合而成的融生型民族。从形成历史过程来看, 回族与境内外各相关民族都
有着一定的关系, 但回族的形成应有“源”、“流”之分。
随着回族学的发展,利用分子生物学方法进行交叉学科研究, 为历史研究提供补充和佐证, 已经成为该学科发展的必然趋势。本文利用本实验室积累的群体遗传学数据和国内外文献数据, 对回族起源问题进行探讨, 尝试为回族学研究提供新的手段。
回族是中国少数民族中散居全国、分布最广的民族。根据2000年第五次全国人口普查统计, 回族人口已达9 816 802人, 在我国56个民族中人口数位居第四。回族除聚居于宁夏回族自治区外, 在甘肃、青海、新疆以及河南、河北、山东、云南等省分布也较多, 形成大小不等的聚居区, 呈现出“大散居, 小聚居”的特点。
回族非原生型民族,而是由众多民族融合而成的融生型民族。从形成历史过程来看, 回族与境内外各相关民族都
有着一定的关系, 但回族的形成应有“源”、“流”之分。
随着回族学的发展,利用分子生物学方法进行交叉学科研究, 为历史研究提供补充和佐证, 已经成为该学科发展的必然趋势。本文利用本实验室积累的群体遗传学数据和国内外文献数据, 对回族起源问题进行探讨, 尝试为回族学研究提供新的手段。
大多数的科学概念、原理和研究方法都可应用于所在的科学领域以外的科学, 而且应用于其他领域时, 往往有助于促成进一步的科学发现。学科之间的空白点或接触点往往是重大发现和新学科的生长点。
基于此, 本文力图将分子遗传学、生物信息学的概念、原理和方法移植到回族学的研究领域里, 以期填补学科之间的空白并能为回族学学科体系与方法论创新提供新思路。
基于此, 本文力图将分子遗传学、生物信息学的概念、原理和方法移植到回族学的研究领域里, 以期填补学科之间的空白并能为回族学学科体系与方法论创新提供新思路。
对民族族源的研究, 可以从历史学、语言学、建筑学、考古学和音乐学等多角度去展开。而本文尝试将自然科学领域的分子遗传学、生物信息学和社会科学领域的民族学研究联合起来, 在回族的族源论证上发挥跨学科的优势。毫无疑问, 生物信息学的介入为分子遗传学在社会科学领域的民族研究提供了发展契机, 本文对SPSS12. 0和A rlequin2. 0 软件的应用, 能让我们更直观地看到人群之间的遗传关系。
一、分子遗传学和生物信息学的研究方法及各人群之间的遗传关系
我们知道, 对于民族的源与流、人群间的血缘关系, 可以从历史、考古、语言、文化、体质特征、基因频率等各方面进行研究, 相互印证补充。可是历史与考古资料往往受条件限制, 残缺不全或记载失真;语言与文化则容易受战争征服、同化渗透等影响, 以至在一二百年内发生急剧变化;体质特征则在相当大程度上受外界影响, 不同源人群在相同环境条件下,可以朝相同方向演化而形成趋同的体质特征。
而基因是遗传物质DNA 的核苷酸序列, 在自然界以一定的频率发生变异, 所产生的变异体大部分是中性的,只有小部分受环境因子影响, 有稳定的世代遗传。因此根据基因频率研究人群间的迁徙与混杂及血缘关系更具有其特殊的重要性。在人类基因组中, 如果不同种族的某一基因座等位基因频率不同, 其等位基因分布能够代表某一种族或某一群体特征, 该遗传标记就可作为人类学、历史学等相关学科进行种族识别和群体基因遗传结构、分析基因流动的新手段。
我们知道, 对于民族的源与流、人群间的血缘关系, 可以从历史、考古、语言、文化、体质特征、基因频率等各方面进行研究, 相互印证补充。可是历史与考古资料往往受条件限制, 残缺不全或记载失真;语言与文化则容易受战争征服、同化渗透等影响, 以至在一二百年内发生急剧变化;体质特征则在相当大程度上受外界影响, 不同源人群在相同环境条件下,可以朝相同方向演化而形成趋同的体质特征。
而基因是遗传物质DNA 的核苷酸序列, 在自然界以一定的频率发生变异, 所产生的变异体大部分是中性的,只有小部分受环境因子影响, 有稳定的世代遗传。因此根据基因频率研究人群间的迁徙与混杂及血缘关系更具有其特殊的重要性。在人类基因组中, 如果不同种族的某一基因座等位基因频率不同, 其等位基因分布能够代表某一种族或某一群体特征, 该遗传标记就可作为人类学、历史学等相关学科进行种族识别和群体基因遗传结构、分析基因流动的新手段。
目前研究起源、迁移最理想的遗传标记, 公认是Y染色体拟常染色体以外的非重组区段(NRY)的遗传标记。这是由于人体内只存在一份父系遗传Y染色体非重组区, 可以有效地排除交换重组的混血干扰和回复突变的影响;同时突变率低更能稳定地遗传, 可以忠实地记录进化事件;再由于以单倍体存在的Y染色体, 其有效群体大小只有常染色体位点的1 /4, 所以易产生人群特异性的单倍型。因此, Y 染色体非重组区域的遗传标记, 能够忠实地记录人群迁移的历史, 并追溯现代人类的父系祖先[ 1 - 4] 。
本文根据国内外已经公布的Y— DNA 单倍群数据, 对从高加索地区到东亚(中国)的诸多民族进行群体遗传分析:用A rlequ in, version 2. 0软件计算几个有关人群遗传方面的参数;用分子变异分析(AMOVA)软件评估单倍群和单倍型的多样性, 单倍群的两两FST值和单倍型的两两RST值, 有关人群扩散的Fu's Fs检验和矩阵相关性Mantel检验;用SPSS12. 0软件利用单倍群的频率进行主成分分析(principal componen t analysis)。主成分分析是将分散在一组变量上的信息集中到某几个综合指标(主成分)上的探索性统计分析方法, 以便利用主成分描述数据集内部结构, 实际上也起着数据降维的作用。
本文所涉及的民族如下(按所引用文献中的原始称谓)。
国内民族:
宁夏回族、北方汉族、兰州汉族、伊犁汉族、成都汉族、广东汉族、维吾尔族、藏族、外蒙蒙古族、内蒙蒙古族、羌族、达斡尔族、鄂温克族、赫哲族、满族、鄂伦春族、锡伯族、朝鲜族、布依族、哈尼族、黎族、畲
族、瑶族。
境外族群:
Dungan、Tajik、kho jant、Esfahan、Turkmen、K arakala、Bukhara、Tashken t、Samarkan、Iran、A rab、C rimean、Amenian、Ossetian 。
国内民族:
宁夏回族、北方汉族、兰州汉族、伊犁汉族、成都汉族、广东汉族、维吾尔族、藏族、外蒙蒙古族、内蒙蒙古族、羌族、达斡尔族、鄂温克族、赫哲族、满族、鄂伦春族、锡伯族、朝鲜族、布依族、哈尼族、黎族、畲
族、瑶族。
境外族群:
Dungan、Tajik、kho jant、Esfahan、Turkmen、K arakala、Bukhara、Tashken t、Samarkan、Iran、A rab、C rimean、Amenian、Ossetian 。
从本文的群体遗传分析上看(见图1), 在从高加索地区到东亚(中国)的诸多民族中, 回族在遗传距离上居于西亚—中亚类群和东亚类群两大群体之间, 显示出回族这一中国少数民族独特的起源和形成过程, 两大类群都为回族群体贡献了DNA , 这正是民族融合导致基因交流的有力证据。同时, 这也有力地说明了回族不但拥有自己独特的历史文化特征, 在遗传学背景上同样拥有自己独特的特征。
此外, 亚美尼亚的K araka la人在图中显示与回族遗传关系较近, 而Esfahan人在图中显示与回族遗传关系较远, 这究竟是原始数据的代表性不可靠, 还是遗传关系本来如此, 还需要更多的DNA数据研究。
三、讨 论
在本文的研究中, 通过分析40个人群Y 染色体非重组区域的的单倍群数据, 使用A rlequ in 软件用单倍型频率进行遗传距离计算, 再用SPSS 软件进行PC 分析(图1)。结果发现回族和境外东干族的关系相距最近, 回族与各族群的遗传关系基本既符合群体地理分布特征又充分反映了群体基因交流的历史;显然, 这一结果可以和社会科学家们已有的一些研究成果相呼应。需要指出的是本文仅以宁夏回族为例进行了初步分析, 如果进一步将全国各地的回族分别进行研究, 很可能会得到更加深入的认识。
在本文的研究中, 通过分析40个人群Y 染色体非重组区域的的单倍群数据, 使用A rlequ in 软件用单倍型频率进行遗传距离计算, 再用SPSS 软件进行PC 分析(图1)。结果发现回族和境外东干族的关系相距最近, 回族与各族群的遗传关系基本既符合群体地理分布特征又充分反映了群体基因交流的历史;显然, 这一结果可以和社会科学家们已有的一些研究成果相呼应。需要指出的是本文仅以宁夏回族为例进行了初步分析, 如果进一步将全国各地的回族分别进行研究, 很可能会得到更加深入的认识。
随着现代科学技术的发展, 已经使得学科之间相互交叉、渗透的趋势日见加强, 并已取得了许多令人瞩目的成果。当今学科发展的特点就是强调运用多学科的知识和材料对一个科学问题进行研究, 从而求得一个多角度、全方位的认识。以DNA 分析为重要手段的群体遗传学研究同样也可以与历史学、人类学研究相结合, 为历史学、人类学研究提供科学可靠的基础资料。因为历史学、人类学本身就是一门综合性的学科, 在对某一人类群体(包括民族、部族等)进行研究时, 不仅要尽可能地运用考古学、语言学等学科的资料, 也同样应该重视群体遗传学的资料和研究成果。群体遗传学的资料和研究成果不但使人们得以了解该民族区别于其他民族的遗传结构和动态特征, 而且可以为民族渊源、民族关系以及民族文化的研究提供科学的佐证。因此, 将DNA 分析引入回族学领域的研究、分析应是回族学在21 世纪初实现多学科相互交叉的又一研究重点。
本文运用分子遗传学的方法对相关群体进行分析, 证实回族与西北各相关民族之间存在着相当大的融合, 并明确了回族中有较大比例的高加索人种混杂程度。在我们的研究中, 虽然血缘关系在遗传分析中占主导地位, 但是地缘关系对遗传关系也不可低估。本研究对Y 染色体的分子遗传学观察与民族研究、历史记载和语言学分类有很好的一致性, 显示出本研究方法具有较高的可靠性和科学性, 体现出分子遗传标记在回族学研究中具有非常值得关注的应用前景, 分子遗传学和生物信息学在回族学研究中的成果不仅要帮助社会科学工作者解决回族的起源演化问题, 还将为回族群体的医学基因组学、药物基因组学研究开辟新的领域, 直接为回族群体的人口健康服务, 将对回族学研究产生重要的推动作用。