普通遗传学小说阅读-第42节-玄幻-998读书网

子朐又諪1的方差基本相似。由于亲本是纯系，F1是基因型一致群体，因此，该性状在双亲与杂种F1表现出的变异明显属于非遗传因素所引起的环境变异。F1自交共得到233份F2单株，各单株花冠长度呈连续分布，出现较大的变异范围，其变异度比之亲本和杂种F1的变异度都大（图10…2）。F2中的个体所产生的F3家系表型间存在差异，如图所示将F2中3类植株分别自交获得3类F3家系植株，花冠长度不同的F2植株在F3中出现不同的分布情况，其花冠的平均长度与产生它们的F2植株的长度相当，如来自短花冠的
F2植株后代具有较短的花冠平均值，来自较长花冠的F2植株后代具有较长的花冠平均值，但这些家系的方差（或变异度）存在差异，有的方差极大，有的家系方差较小（图10…2）。这些结果表明，烟草花冠长度在不同世代中的变异既受环境影响，更有基因分离等遗传因素的效应。

图10…2　　烟草花冠长度在不同世代的表现频率分布
由此可以得到数量性状多基因假说的几个要点：
（1）数量性状是受许多效应微小的基因控制的；
（2）基因的效应相等且可加；
（3）等位基因间无显隐性关系；
（4）基因的作用受环境影响较大；
（5）微效多基因与质量性状的主基因一样，服从孟德尔的分离、重组等遗传规律。
近年来，借助分子标记技术及饱和连锁图谱，可以分析单个数量性状基因位点在染色体上的位置及遗传效应，许多对动植物的数量性状基因分析的结果表明，数量性状多基因的假说需要完善与补充。其中之一是，数量性状可以是许多微效基因所控制，也可以由少数效应较在的主效基因所决定，各种基因的效应大小可能不等；同时，基因的遗传效应除加性效应外，还有显性效应、上位性效应以及基因与环境互作效应，等等。因此，大多数量性状的遗传基础是比较复杂的，需要采用更多的统计学、生物学等方法来分析。
10。2　　基本的统计学概念与分析方法
10。2。1　　次数分布
在一个群体中，某一性状的许多观察值通常是连续性变异的（continuous　variation）；在统计上这些观察值被称为变数或变量，连续改变数的出现都有一定的数量范围。若将其可能出现的整个范围分成若干个互斥的组区间，再来统计出现在各区组间的变量个数（次数），则可能发现一定
的分布规律。这种由不同组区间内变量出现次数组成的分布，就叫变数的次数分布，简称次数分布。次数分布以图来表示，就是次数分布图，通常是以分组数列为横坐标，次数为纵坐标的方柱图或折线图。若将各变量的出现次数除样本容量后可转换为该变量的频率，变量的频率所构成的分布，称频率分布（frequency　distribution）。频率分布同样可用图示表示。上节的图10…1、图10…2均显示了性状的频率分布情况。
由次数分布或频率分布可以看到变量分布的两种明显特点，即集中性和离散性。其中平均数（arithmetic　mean）是反映集中性的参数，它是某一性状的许多观察值的算术平均。可用公式表示为：
x0=∑xi/n；（i=1；2；…，n）
x0为平均值（或均值），xi为性状的每一个观察值（或变量），n为观察值的总个数或变量数，∑表示求和。
也可利用变量的频率计算平均值，即加权平均数，表达如下式：
x0=∑fixi
fi为某一观察值出现的频率。
反映离散性的参数一般是方差（variance）或标准差（standard　deviation）方差是变量与平均数离差的平方和，标准差是方差开平方根植。两者均表示一组变量离开平均数的变异程度。方差越大，各观察值（变数）与平均数间的偏差就越大，反之，观察值与平均数间的偏差就小。总体方差是以变量与平均数间的偏差的平均平方之和来表示，记为O2。通常总体方差是通过样品方差S2来估计的。样品方差用公式表示为：
S2=∑（X2…XO）2/（n…1）=＇∑x2i…（∑（x2））2/n＇/（n…1）
n为观察值的样本数。
另外，生物统计可以用相关系数和协方差等统计参数描述两组或多组遗传上相关的变量之间的相互关系。相关系数（correlation　coefficient）是度量两组变量协同变化程度的统计量。将观察到的成对数据按下式可以计算得到相关系数。
rxy=∑（x…x0）（y…y0）/SQR＇∑（x…x0）2∑（y…y0）2＇
这里x；y为两个变数，x0；y0表示平均数，SQR为平方根。
而乘积和平均，记为协方差（covariance），它反映的也是两组变量协同变化程度或上下代间的依存关系，相关系数与协方差的关系用下式表示：
rxy=COVx。y/sxsy
这里COVx。y=∑（x…x0）（y…y0）/n。
由此可以认为，相关系数是标准化了的协方差。当然，遗传分析中的子代与亲代间的依存关系，也可以用回归系数来描叙。简单的直线回归系数byx表述是以x为自变量，y随着x的一个单位增加（或减少）所改变的单位数。其它义式为：
byx=∑（x…x0）（y…y0）/∑（x…x0）2
现以上述East的烟草花冠长度的遗传研究数据为例，说明数量性状的表型分布特点。表10…1是烟草不同世代单株的花冠长度的数据，经整理后的次数分布表。该表次数分布数据以图形表示就成为了图10…2。根据表中的观察数据，可以容易计算出平均数和方差等参数，如针对亲本P1，观测了49个单株个体一的花冠长度，得到1个观察数在34mm组间内，4个在37mm组间内，18个在40mm左右，16个为43mm，10个落在46mm组间。所以，其加权平均数为（1×34＋4×37＋18×40＋16×43＋10×46）/49=41。8，方差为8。56，标准差为2。92；同样其他群体的平均值、方差和标准差也可以获得（见表10…1下三行）。
表10…1　　不同世代的花冠长度数据整理为次数分布及参数估计情况
组中点值/mm P1 P2 F1 F2
34 1
37 4
40 18
43 16
46 10
49
52 2
55 4 4
58 10 2
61 41 24
64 75 37
67 40 31
70 3 38
73 35
76 27
79 21
82 5
85 6
88 2 1
91 16
94 32
97 6
100 1
N 49 57 173 233
X0 　　41。8 　　93。4 　　　63。5 　　　　69。8
S2 　　　　8。56 　　　　4。97 　　　　　8。57 　　　　　46。10
s 　　　　2。92 　　　　2。23 　　　　　2。92 　　　　　　6。79

表10…1可以看到，即使是基因型纯合的亲本，每个个体的观察值也是不样的，这种变异明显属于非遗传因素引起的环境变异，其方差的大小反映了该变异的大小。同样可以看到F2代方差比F1代方差及双亲都大，反映出F2代中基因重组分离引起的变异较大。而这种连续分布的变异（幅度）可以直观地在图10…2显示出来。
10。2。2　　基因型与表型分布
以控制某一性状的基因对数不同的F2群体的表型分开布为例，如果性状受一对或少数几对基因控制，表现为典型的质量性状，则分组方柱图明显（图10…1），每组基因型与表现型有较好的对应关系；尽管如此，若受非遗传因素的较大影响，不同基因型间的表现会存在相互交错的情况，性状表现的柱形图也会近似于连续性的分布图形；当性状受多对基因控制，许多基因间的差异会减少，加上环境因素的作用，性状表型将呈现连续变异的正太分布，表现出典型的数量性状特征（图10…2），这时从表型的结果推断其基因型会有相当大的困难。正态分布的一个主要特点就是群体中任何个体基因型出现的频率均可用正态分布的密度函数给出，而该密度函数完全决定于该群体的平均数和标准差。换言之，由于数量性状的表型一般呈正态分布，因此，知道了性状在群体中的平均表现和标准差，就可以知道每个个体性状的表型特点。
另外，在众多的生物性状中，有一类特殊的性状，其遗传基础是多基因控制的，但其表现呈非连续性变异，如与动物和人类的患病与健康等相关的性状。一般认为这类性状具有一个潜在的连续型变量分布，以连续分布上的一点（阈值）为界，其表型是间断或不连续的。如人体的易患性，其变异是连续的，但当一个个体易患性达到一定程度（阈值），该个体表现为患病。在一定条件下，阈值标志着患病所必需的最少基因数目的表达。
10。3　　数量性状分析的遗传模型
一个数量性状的表型值就是所度量或观察到的数值。可以理解，这个表型值是遗传与环境共同作用的结果。所以，性状的表型值理论上可以剖分为遗传和环境两个组成部分，用数学符号表示为：
P=G＋E
其中P为性状的表型值，G为基因型值，E为环境效应。
在一个群体内，环境对个体（基因型）的影响使得个体的表型值偏离基因型值，但由于环境作用效应的方向（如正负值）是随机的，所以就许多个体的平均而言，环境效应等于零，即群体的平均表型值实际上就等于基因型值。
由于基因型反映的是不同位点上等位基因的组成状况。因此，基因型值也可根据基因的组成进一步剖分为：基因的加性效应（additive　effect；简写为A）和基因的显性效应或显性离差（dominance　effect；D）以及互作效应或上位性（interaction　effect；I）。用式子表示为：
G=A＋D＋I
综合前述的表型值公式，则任何性状的观察值（表型值）可简单地用下列表示：P=A＋D＋I＋E
若忽略基因与环境的互作效应，则
P=A＋D＋E
它就是数量性状平均数的加性…显性遗传模型。
10。3。1　　群体基因型值的平均数
理论上，每个基因型的基因型值可以根据位点上基因的组成计算出来。考虑一个位点上有两个等位基因（如A；a）的情况，在群体中该位点可能存在3种基因型（AA；Aa；aa）其中一种纯合子（AA）的基因型值赋为a；另一种纯合子（aa），的基因型值赋为—a，杂合子基因型值指定d，假定A对性状有增效作用，a对性状有减效作用（注这里的大小写不是通常表示的基因显隐性），则各种基因型如图10…3所示。
基因型

基因型值
图10…3　一个位点一对等位基因的加性…显性效应模型
以两纯合子（亲本）基因型值的平均值（中亲值，记为m）为零，以此为度量点，三种基因型值可认为是距离中亲值的离差，a是基因加性效应与中亲值的离差理论值，d为由基因的显性效应引起的与中亲值的离差。d值大小决定于基因显性程度，若无显性存在，d=0；A对a为显性，d》0；若显性是完全的，则d=a；反之，a对A为显性，则da。
现在考虑群体中各等位基因的频率以及基因型率对基因型均值的影响。假定在一个随机交配的平衡群体中，一对等位基因（A，a）的频率为p和q，则在一个随机交配群体中，群体的平均基因型值计算如表10…2：
表10…2　　一个随机交配群体中群体的平均基因型值及频率
基因型基因型值频率频率×基因型值基因型基因型值频率频率×基因型值
AA a P2 P2a aa …a q2 …q2a
Aa d 2pq 2pq。d 总和 1 P2a＋2pqd…q2a
即群体基因型值的平均数（均值）为：
u=（p2a＋2p

《普通遗传学》

下载本书

普通遗传学- 第42节