【转】中国双眼皮的各地概率以及南北性别差异
【转自微基因公众号】
Lily 看到网络上盛传单眼皮发源于蒙古语族群,由于这一族群过去需要长期在寒冷风沙天气生存,需要抵挡寒冷,就进化出了眼部厚脂肪、单眼皮的性状。另外,中学生物试题上还出现了“单眼皮是隐性遗传”的结论。
为了验证这些结论的真伪,两周前,Lily 发起了一个眼皮性状调查,用数据探索答案~
截止到上周,共收到 1250 份问卷,其中,眼皮性状的分布差异见下图:
眼皮性状和用户性别的南北差异。
根据用户的籍贯与问卷数据,眼皮性状的南北分布如下图所示:
通过卡方检验判断出,南方人出现双眼皮的概率更高,单双眼皮具有显著的南北方差异(p-value:0.0006)。
为了从细节展示南北差异,我们对中国七大区(华北、华南、华东、华中、西南、西北、东北)用户的双眼皮概率进行统计,绘制了下图的热图。图片中颜色越深的地区,双眼皮的出现概率越高。
双眼皮指数地理热图
(双眼皮指数:设单眼皮为 1 分、双眼皮为 2 分,双眼皮指数为该组内,所有人眼皮性状的分数总和除以组内人数)
可以看出,双眼皮在不同地区出现的概率为:华南>西南>华东>华中>西北>华北>东北。
Lily 看到网络上盛传单眼皮发源于蒙古语族群,由于这一族群过去需要长期在寒冷风沙天气生存,需要抵挡寒冷,就进化出了眼部厚脂肪、单眼皮的性状。另外,中学生物试题上还出现了“单眼皮是隐性遗传”的结论。
为了验证这些结论的真伪,两周前,Lily 发起了一个眼皮性状调查,用数据探索答案~
截止到上周,共收到 1250 份问卷,其中,眼皮性状的分布差异见下图:
眼皮性状和用户性别的南北差异。
根据用户的籍贯与问卷数据,眼皮性状的南北分布如下图所示:
通过卡方检验判断出,南方人出现双眼皮的概率更高,单双眼皮具有显著的南北方差异(p-value:0.0006)。
为了从细节展示南北差异,我们对中国七大区(华北、华南、华东、华中、西南、西北、东北)用户的双眼皮概率进行统计,绘制了下图的热图。图片中颜色越深的地区,双眼皮的出现概率越高。
双眼皮指数地理热图
(双眼皮指数:设单眼皮为 1 分、双眼皮为 2 分,双眼皮指数为该组内,所有人眼皮性状的分数总和除以组内人数)
可以看出,双眼皮在不同地区出现的概率为:华南>西南>华东>华中>西北>华北>东北。
判断出了眼皮性状有南北差异后,接下来看看用户性别是否有南北差异。
用户性别与地域分布
通过卡方检验发现,用户性别并没有出现明显的南北差异(p-value:0.12),所以女性双眼皮更高并不是因为调查样本地域分布不均匀导致的。
用户性别与地域分布
通过卡方检验发现,用户性别并没有出现明显的南北差异(p-value:0.12),所以女性双眼皮更高并不是因为调查样本地域分布不均匀导致的。
性别不同,答题倾向有差吗?
前面提到了一个假说,认为女性因为爱美,可能在不确定自己眼皮性状的时候,倾向于选择双眼皮的选项,而这一因素导致了女性出现双眼皮的概率更高。
为了验证这一假说,我们去掉答题用户的性别变量,仅对男性用户填写的父母眼皮性状进行分析,并检验答题结果是否还会出现性别差异。 结果如下表所示。
男性用户双亲性别与眼皮性状表
卡方检验发现,男性用户填写的父母眼皮性状,仍然表现出显著的性别差异,女性仍然出现双眼皮的更高的概率(p-value:0.000038)。
所以,心理倾向假说也被否定了。
因此,我们初步得出了这个结论:眼皮性状确实呈现出性别差异,而且并非由于样本地域分布不均或者用户填写倾向所致。这个有趣的发现有待进一步探究。
前面提到了一个假说,认为女性因为爱美,可能在不确定自己眼皮性状的时候,倾向于选择双眼皮的选项,而这一因素导致了女性出现双眼皮的概率更高。
为了验证这一假说,我们去掉答题用户的性别变量,仅对男性用户填写的父母眼皮性状进行分析,并检验答题结果是否还会出现性别差异。 结果如下表所示。
男性用户双亲性别与眼皮性状表
卡方检验发现,男性用户填写的父母眼皮性状,仍然表现出显著的性别差异,女性仍然出现双眼皮的更高的概率(p-value:0.000038)。
所以,心理倾向假说也被否定了。
因此,我们初步得出了这个结论:眼皮性状确实呈现出性别差异,而且并非由于样本地域分布不均或者用户填写倾向所致。这个有趣的发现有待进一步探究。
高“蒙古”成分容易出现单眼皮?
为了证实眼皮性状是否与祖源中的蒙古语族群成分相关,我们对这两者的关系进行了分析。
这张气泡散点图展示了调查结果(气泡大小代表了在这一蒙古成分区间内的人数,频次小于10的数据因误差太大而忽略):
双眼皮指数与蒙古成分的散点气泡图
(蒙古成分区间:把蒙古成分为 0% - 40% 的用户分为 10 组区间,组间距为 10% 蒙古成分,重叠7%。例:前三组区间为【0-10%】、【3-13%】、【6-16】)
看散点图发现,双眼皮指数与蒙古成分并不呈现线性相关,使用 pearson 分析,也得出了蒙古成分和眼皮性状不相关的结论(p-value:0.87)。
双眼皮性状呈现出显著的南北差异,蒙古成分也是呈现南北差异的(社区内发过相关的研究,可查看热图),但令人意外的是,双眼皮性状却并未呈现显著的蒙古祖源成分差异,其中原因还需要进一步探究。
为了证实眼皮性状是否与祖源中的蒙古语族群成分相关,我们对这两者的关系进行了分析。
这张气泡散点图展示了调查结果(气泡大小代表了在这一蒙古成分区间内的人数,频次小于10的数据因误差太大而忽略):
双眼皮指数与蒙古成分的散点气泡图
(蒙古成分区间:把蒙古成分为 0% - 40% 的用户分为 10 组区间,组间距为 10% 蒙古成分,重叠7%。例:前三组区间为【0-10%】、【3-13%】、【6-16】)
看散点图发现,双眼皮指数与蒙古成分并不呈现线性相关,使用 pearson 分析,也得出了蒙古成分和眼皮性状不相关的结论(p-value:0.87)。
双眼皮性状呈现出显著的南北差异,蒙古成分也是呈现南北差异的(社区内发过相关的研究,可查看热图),但令人意外的是,双眼皮性状却并未呈现显著的蒙古祖源成分差异,其中原因还需要进一步探究。
总结:
1. 眼皮性状呈现显著的性别差异,女性比男性出现双眼皮的概率更高。
2. 眼皮性状呈现显著的南北地域差异,南方人比北方人出现双眼皮的概率更高。
3. 单眼皮可能不属于常染色体单基因隐性遗传。
4. 眼皮性状并未呈现显著的蒙古祖源成分差异。
1. 眼皮性状呈现显著的性别差异,女性比男性出现双眼皮的概率更高。
2. 眼皮性状呈现显著的南北地域差异,南方人比北方人出现双眼皮的概率更高。
3. 单眼皮可能不属于常染色体单基因隐性遗传。
4. 眼皮性状并未呈现显著的蒙古祖源成分差异。