高校生物では、「自然選択により有利な形質が集団に広まる」「遺伝的浮動は小集団で影響が大きい」と学びます。ハーディ・ワインベルグの法則は $p^2 + 2pq + q^2 = 1$ として計算問題にも登場しました。しかし、ある突然変異が集団に広まるのに何世代かかるのか、どのくらい小さな集団なら浮動が選択に勝つのかを問われると、高校の知識では答えられません。
大学の集団遺伝学では、選択係数 $s$ と有効集団サイズ $N_e$ という2つのパラメータを導入することで、これらの問いに定量的に答えます。そしてこの2つの積 $N_e s$ が、進化の運命を決める鍵となります。本記事では、ハーディ・ワインベルグの法則を出発点に、自然選択と遺伝的浮動の数理を一本の糸でつないでいきます。
高校生物で学ぶ集団遺伝学の内容を整理しましょう。まず、ハーディ・ワインベルグの法則です。ある遺伝子座に対立遺伝子 $A$(頻度 $p$)と $a$(頻度 $q = 1 - p$)がある二倍体の集団を考えます。いくつかの理想的な条件(十分大きな集団、ランダム交配、突然変異なし、選択なし、移入なし)が満たされるとき、遺伝子型頻度は次の関係を保ちます。
$$p^2 + 2pq + q^2 = 1$$
ここで $p^2$ は遺伝子型 $AA$ の頻度、$2pq$ は $Aa$ の頻度、$q^2$ は $aa$ の頻度です。この法則の重要なポイントは、条件が満たされる限り遺伝子頻度は世代を超えて変化しないということです。つまり、この法則は「進化が起きない条件」を定義しています。
高校では、ハーディ・ワインベルグの条件が崩れる要因として自然選択と遺伝的浮動を学びます。自然選択とは、生存や繁殖に有利な形質を持つ個体がより多くの子孫を残すことで、その形質に関わる遺伝子の頻度が世代とともに変化する過程です。遺伝的浮動とは、偶然による遺伝子頻度の変動であり、集団が小さいほどその影響が大きくなります。
高校ではさらに、木村資生が提唱した中立進化論についても概念的に学びます。分子レベルの進化の多くは自然選択ではなく遺伝的浮動によって起こるという理論です。
ここまでが高校の範囲です。しかし、次のような問いには答えられません。「有利な突然変異はどれくらいの速さで広まるのか」「集団がどのくらい小さければ浮動が選択に勝つのか」「中立とはどの程度の有利さ/不利さまでを含むのか」。次のセクションで、大学の集団遺伝学がこれらの問いにどう答えるかを見ていきましょう。
集団遺伝学の核心は、進化の方向性が選択係数 $s$(変異の有利さ/不利さ)と有効集団サイズ $N_e$(集団の「遺伝学的な大きさ」)の積 $N_e s$ で決まるということです。
$N_e s \gg 1$ のとき、自然選択が支配的であり、有利な変異は確実に集団に広まります。$N_e s \ll 1$ のとき、遺伝的浮動が支配的であり、変異の運命はほぼ偶然で決まります。この境界を定量的に理解することが、進化の予測を可能にします。
では、この2つのパラメータを具体的に定義し、それぞれがどのように進化を記述するかを見ていきましょう。まずは自然選択の数理から始めます。
「有利な形質が広まる」という高校の説明は、定性的には正しくても、予測力がありません。たとえば、マラリア流行地域で鎌状赤血球遺伝子がどの程度の頻度に達するかを予測するには、「有利さ」を数値で表す必要があります。これが適応度(fitness)と選択係数(selection coefficient)の考え方です。
適応度 $w$ とは、ある遺伝子型を持つ個体が次世代に残す子孫の相対的な数です。最も適応度が高い遺伝子型の適応度を $1$ とし、他の遺伝子型はそれに対する比率で表します。
選択係数 $s$ は、適応度の低下を表すパラメータです。たとえば、対立遺伝子 $A$ が有利で $a$ が不利な場合、以下のように適応度を設定します。
| 遺伝子型 | $AA$ | $Aa$ | $aa$ |
|---|---|---|---|
| 適応度 $w$ | $1$ | $1 - hs$ | $1 - s$ |
ここで $s$ は選択係数($0 \le s \le 1$)、$h$ は優性度(dominance coefficient)です。$h$ は $A$ の有利さがヘテロ接合体でどの程度発現するかを表します。
選択係数の値は、突然変異の種類によって大きく異なります。
誤:自然選択で有利な変異は必ず集団全体に広まる
正:有利な変異であっても、発生直後は1コピーしか存在しない。小さな集団では遺伝的浮動により偶然消失する確率が高い。$s = 0.01$ の有利な変異が集団に固定される確率は約 $2s = 0.02$(2%)にすぎない(後述)。
適応度と選択係数を定義できたので、次に、選択が世代を通じて遺伝子頻度をどのように変化させるかを数式で追跡してみましょう。
対立遺伝子 $A$(頻度 $p$)と $a$(頻度 $q = 1 - p$)を考えます。議論を明快にするため、まず $A$ が完全優性($h = 0$)の場合を考えましょう。適応度は $AA$: $1$、$Aa$: $1$、$aa$: $1 - s$ です。
自然選択は、各遺伝子型の繁殖成功度に差をつけます。選択後の遺伝子型頻度は、選択前の頻度に適応度をかけ、全体で割って正規化したものになります。
集団全体の平均適応度 $\bar{w}$ を計算します。
$$\bar{w} = p^2 \cdot 1 + 2pq \cdot 1 + q^2(1 - s) = 1 - sq^2$$
選択後の対立遺伝子 $a$ の頻度 $q'$ は次のように求められます。$aa$ 個体からの寄与は $q^2(1-s)/\bar{w}$、$Aa$ 個体からの寄与は $pq/\bar{w}$($Aa$ 個体は $a$ を確率 $1/2$ で渡すが、$2pq$ の $2$ と相殺)なので、
$$q' = \frac{q^2(1-s) + pq}{\bar{w}} = \frac{q[q(1-s) + p]}{1 - sq^2} = \frac{q(1 - sq)}{1 - sq^2}$$
1世代あたりの遺伝子頻度の変化量 $\Delta q = q' - q$ を計算しましょう。
Step 1:$\Delta q = q' - q$ を計算する。
$$\Delta q = \frac{q(1 - sq)}{1 - sq^2} - q = \frac{q(1 - sq) - q(1 - sq^2)}{1 - sq^2}$$
Step 2:分子を展開する。
$$q(1 - sq) - q(1 - sq^2) = q - sq^2 - q + sq^3 = -sq^2 + sq^3 = -sq^2(1 - q) = -spq^2$$
Step 3:したがって、
$$\Delta q = \frac{-spq^2}{1 - sq^2}$$
$s$ が小さいとき $\bar{w} \approx 1$ なので、近似的に $\Delta q \approx -spq^2$ と書けます。
この式から重要なことがわかります。$\Delta q < 0$、つまり不利な対立遺伝子 $a$ の頻度は世代ごとに減少します。その速さは $s$(選択の強さ)と $p$, $q$(現在の遺伝子頻度)に依存します。
議論を一般化しましょう。高校範囲を超えた集団遺伝学で最もよく使われるのは、相加的選択($h = 0.5$、半優性)のモデルです。適応度を $AA$: $1$、$Aa$: $1 - s/2$、$aa$: $1 - s$ と設定すると、有利な対立遺伝子 $A$ の頻度変化は近似的に次のようになります。
$$\frac{dp}{dt} \approx sp(1-p) \cdot \frac{1}{2}$$
$p$ は有利な対立遺伝子 $A$ の頻度、$s$ は選択係数、$t$ は世代数。$1/2$ の因子は相加的選択($h = 0.5$)に対応します。$p(1-p)$ の項は、$p$ が $0$ や $1$ に近いほど変化が遅くなることを意味します。
この微分方程式はロジスティック型の形をしています。$p$ が小さいときは指数的に増加($dp/dt \approx sp/2$)し、$p$ が $1$ に近づくと変化が鈍くなります。
この式から、有利な変異が集団に広まるのにかかる時間のオーダーを見積もることができます。$p$ が低い値から $1$ 近くに達するまでの時間は、おおよそ $1/s$ のオーダーの世代数です。
ヒトの場合(1世代 = 約25年)、$s = 0.01$ の有利な変異が広まるには数千年のオーダーが必要です。乳糖耐性(ラクターゼ持続性)がヨーロッパで過去約1万年のうちに広まったことは、かなり強い選択($s \approx 0.01$--$0.05$ と推定されている)を示唆しています。
適応度が $AA$: $1 - s_1$、$Aa$: $1$、$aa$: $1 - s_2$ のとき(ヘテロ接合体が最も有利)、遺伝子頻度は固定されず、$\hat{q} = s_1/(s_1 + s_2)$ という平衡値に収束します。マラリア流行地域の鎌状赤血球遺伝子はこの例で、ホモ接合体 $SS$ は重度の鎌状赤血球症、ホモ接合体 $AA$ はマラリア感受性が高く、ヘテロ接合体 $AS$ がマラリア抵抗性を持ちつつ貧血にならないため最も適応度が高くなっています。
ここまでで、自然選択が遺伝子頻度をどう変えるかを定量的に記述できるようになりました。しかし、この議論は集団が無限に大きいことを暗黙に仮定しています。現実の集団は有限であり、偶然の効果 ── 遺伝的浮動 ── が必ず存在します。次のセクションで、浮動の確率論的モデルを導入します。
遺伝的浮動を数理的に扱うために、1930年代にSewall WrightとRonald Fisherが定式化したライト-フィッシャーモデル(Wright-Fisher model)を導入します。このモデルは次のように集団を理想化します。
復元抽出とは何か、具体的にイメージしましょう。壺の中に $A$ と書かれた球が $2Np$ 個、$a$ と書かれた球が $2Nq$ 個入っています。この壺から球を1つ取り出し、記録して戻す、という操作を $2N$ 回繰り返します。次世代での $A$ の数は、この抽出の結果で決まります。
現世代で対立遺伝子 $A$ の頻度が $p$ のとき、次世代での $A$ のコピー数 $k$ は二項分布に従います。
$$P(k) = \binom{2N}{k} p^k (1-p)^{2N-k}$$
$k$ は次世代での対立遺伝子 $A$ のコピー数、$2N$ は遺伝子コピーの総数、$p$ は現世代での $A$ の頻度。次世代の $A$ の頻度は $p' = k/(2N)$ です。
二項分布の性質から、次世代での $A$ の頻度 $p'$ の期待値と分散が直ちに求まります。
$$E[p'] = p, \quad \mathrm{Var}(p') = \frac{p(1-p)}{2N}$$
期待値が $p$ のまま変わらないことは、浮動には方向性がないことを意味します。しかし分散は $1/(2N)$ に比例するため、集団が小さいほど1世代あたりの揺らぎが大きくなるのです。これが「遺伝的浮動は小集団で影響が大きい」という高校の説明の数学的根拠です。
現実の集団は、ライト-フィッシャーモデルの理想的な仮定からさまざまな点で逸脱します。性比の偏り、集団サイズの変動、非ランダム交配などです。有効集団サイズ $N_e$(effective population size)とは、実際の集団と同じ遺伝的浮動の強さを示す「理想集団の個体数」のことです。
つまり、実際の集団での浮動の分散が $\mathrm{Var}(p') = p(1-p)/(2N_e)$ となるような $N_e$ を定義します。一般に $N_e$ は実際の個体数 $N$ よりもかなり小さくなります。
いよいよ、選択と浮動の相対的な重要性を評価する指標に到達します。選択による1世代の頻度変化は $\Delta p \sim sp$ のオーダー、浮動による揺らぎの標準偏差は $\sqrt{p(1-p)/(2N_e)} \sim 1/\sqrt{N_e}$ のオーダーです。選択の効果が浮動の揺らぎを上回る条件は、大まかに次のように表されます。
$$N_e s \gg 1 \quad \Longrightarrow \quad \text{selection dominant}$$
$$N_e s \ll 1 \quad \Longrightarrow \quad \text{drift dominant}$$
$N_e$ は有効集団サイズ、$s$ は選択係数。$N_e s$ は無次元量であり、進化の「運命」を決める最も重要なパラメータです。$N_e s \approx 1$ の近傍では選択と浮動が拮抗します。
この結果の意味を具体的な数値で確認しましょう。
| 生物 | $N_e$(推定) | 中立とみなせる $s$ の範囲 |
|---|---|---|
| ヒト | $\sim 10^4$ | $|s| \ll 10^{-4}$ |
| ショウジョウバエ | $\sim 10^6$ | $|s| \ll 10^{-6}$ |
| 大腸菌 | $\sim 10^8$ | $|s| \ll 10^{-8}$ |
同じ変異(同じ $s$)であっても、ヒトの集団では中立的にふるまうものが、大腸菌の巨大な集団では選択の標的になり得ます。中立性は変異の固有の性質ではなく、集団サイズとの相対的な関係で決まるのです。
中立変異($s = 0$)が集団に固定される確率はいくつでしょうか。ライト-フィッシャーモデルでは、浮動に方向性がないことから、ある対立遺伝子が最終的に固定される確率は、現在のその頻度に等しくなります。新たに生じた突然変異は $2N$ 個のコピーのうちの1つなので、固定確率は次の通りです。
$$u_0 = \frac{1}{2N}$$
一方、中立変異が固定されるまでにかかる平均時間(固定するという条件のもとでの平均世代数)は次のように知られています。
$$\bar{t}_{\mathrm{fix}} \approx 4N_e \text{ 世代}$$
有利な変異($s > 0$)の場合、Kimura(1962)による拡散近似の結果が有名です。
$$u(s) = \frac{1 - e^{-2s}}{1 - e^{-4N_e s}} \approx \frac{2s}{1 - e^{-4N_e s}}$$
新規変異(初期頻度 $p_0 = 1/(2N)$)の固定確率。$N_e s \gg 1$ のとき $u(s) \approx 2s$、$s \to 0$ のとき $u(0) = 1/(2N_e)$ となります。
この公式から、$s = 0.01$ の有利な変異でも固定確率は約 $2\%$ にすぎないことがわかります。有利な変異の大多数は、発生直後に浮動によって失われるのです。
誤:有利な変異が生じれば、自然選択により確実に集団全体に広まる
正:有利な変異の固定確率は約 $2s$(相加的選択の場合)。$s = 0.01$ なら約2%。「有利な変異が広まりやすい」のは確かだが(中立変異の固定確率 $1/(2N)$ より格段に大きい)、多くの有利な変異は偶然失われる。
ここまでで、選択と浮動を統一的に扱う枠組みが整いました。最後に、この数理的枠組みの現代的な応用として、合祖理論の考え方を紹介します。
ここまでの議論は、現在の遺伝子頻度から未来の変化を予測する「前向き」のアプローチでした。1982年にJohn Kingmanが定式化した合祖理論(coalescent theory)は、発想を逆転させ、現在のサンプルから過去に向かって系譜を辿ります。
考え方はシンプルです。現在の集団から2つの遺伝子コピーをサンプリングしたとき、この2つが最後に「共通の祖先コピー」に由来した時点(合祖、coalescence)はいつだったのか、を確率的に追跡します。
ライト-フィッシャーモデルにおいて、$2N$ 個の遺伝子コピーから2つを選んだとき、1世代前にそれらが同じ親コピーに由来していた確率(合祖確率)は次の通りです。
$$P(\text{1 world back coalescence}) = \frac{1}{2N_e}$$
合祖が起きるまでの世代数は幾何分布に従い、その期待値は次のようになります。
$$E[T_2] = 2N_e \text{ 世代}$$
つまり、ヒト($N_e \approx 10{,}000$)の場合、任意の2つの遺伝子コピーは平均して約20,000世代前(約50万年前)に共通祖先を持つことになります。
合祖理論の最大の利点は、サンプルの系譜だけに注目するため、集団全体をシミュレーションする必要がないことです。これにより、ゲノムデータから集団サイズの変動史を推定したり、自然選択の痕跡を検出したりすることが可能になりました。
中立変異の集団への置換速度(新しい変異が古い変異と置き換わる速度)は、驚くべきことに、集団サイズに依存せず、突然変異率 $\mu$ に等しくなります。これは、新規変異の発生数($2N\mu$ 個/世代)と固定確率($1/(2N)$)の積が $\mu$ となることから導かれます。この結果が分子時計の理論的基盤であり、合祖理論の重要な帰結でもあります。詳しくは次の記事 B-1-2 で扱います。
合祖理論の詳細な数理は次の記事(B-1-2 中立進化の数理的基盤)で扱いますが、その基本的な発想が、本記事で学んだ有効集団サイズ $N_e$ と深く結びついていることを確認できました。次のセクションでは、この記事の内容と他のトピックとのつながりを整理します。
集団遺伝学の数理は、進化生物学の多くの分野の定量的基盤です。以下のトピックと密接に関連しています。
それでは最後に、本記事の要点をまとめましょう。
Q1. ハーディ・ワインベルグの法則が成り立つ条件のうち、自然選択に関するものと遺伝的浮動に関するものをそれぞれ1つ挙げ、それが崩れるとどうなるかを $s$ または $N_e$ を使って説明してください。
Q2. 選択係数 $s = 0.001$ の有利な突然変異が新たに生じたとき、この変異が集団に固定される確率はおよそいくらですか。
Q3. ヒト($N_e \approx 10{,}000$)とショウジョウバエ($N_e \approx 10^6$)で、$s = 10^{-5}$ の変異はそれぞれ「中立的」と言えますか。$N_e s$ の値で判断してください。
Q4. 中立変異の集団への置換速度が集団サイズに依存しない理由を、「突然変異の発生数」と「固定確率」の積として説明してください。
ある集団において、遺伝子座の対立遺伝子 $A$(頻度 $p = 0.6$)と $a$(頻度 $q = 0.4$)がある。適応度が $AA$: $1$, $Aa$: $1$, $aa$: $0.8$ であるとき、次の問いに答えよ。
(a) 選択係数 $s$ を求めよ。
(b) 集団の平均適応度 $\bar{w}$ を求めよ。
(c) 1世代後の対立遺伝子 $a$ の頻度 $q'$ を求めよ。
(a) $aa$ の適応度が $1 - s = 0.8$ なので、$s = 0.2$。
(b) $A$ が完全優性なので、$\bar{w} = 1 - sq^2 = 1 - 0.2 \times 0.16 = 1 - 0.032 = 0.968$。
(c) $q' = q(1 - sq)/\bar{w} = 0.4 \times (1 - 0.2 \times 0.4)/0.968 = 0.4 \times 0.92/0.968 = 0.368/0.968 \approx 0.380$。
$q$ は $0.400$ から $0.380$ へ、1世代で $0.020$ 低下しました。$s = 0.2$ は強い選択なので、目に見える速さで遺伝子頻度が変化します。近似式 $\Delta q \approx -spq^2 = -0.2 \times 0.6 \times 0.16 = -0.0192$ とも整合しています。
有効集団サイズ $N_e = 500$ の集団で、対立遺伝子 $A$ の頻度が $p = 0.3$ であるとする。遺伝的浮動のみが働くとき(選択なし)、次世代の $p'$ の期待値と標準偏差を求めよ。
期待値:$E[p'] = p = 0.3$。
分散:$\mathrm{Var}(p') = p(1-p)/(2N_e) = 0.3 \times 0.7/1000 = 0.00021$。
標準偏差:$\mathrm{SD}(p') = \sqrt{0.00021} \approx 0.0145$。
1世代あたりの揺らぎの標準偏差は約 $0.015$ であり、$p = 0.3$ に対して約 $5\%$ の相対的な揺らぎです。$N_e = 50$ であれば標準偏差は約 $0.046$ となり、揺らぎはおよそ3倍に増大します。集団サイズの効果が具体的に見えます。
ある突然変異の選択係数が $s = 10^{-4}$ であるとする。この変異が自然選択の標的として「見える」(選択が有効に働く)ために必要な有効集団サイズ $N_e$ の条件を、$N_e s$ の基準を用いて示せ。ヒト($N_e \approx 10^4$)と大腸菌($N_e \approx 10^8$)のそれぞれについて、この変異が中立的か選択的かを判定せよ。
選択が有効に働く条件は $N_e s \gg 1$、すなわち $N_e \gg 1/s = 10^4$。
ヒト:$N_e s = 10^4 \times 10^{-4} = 1$。選択と浮動が拮抗する境界付近であり、この変異はほぼ中立的にふるまう。
大腸菌:$N_e s = 10^8 \times 10^{-4} = 10^4 \gg 1$。選択が圧倒的に支配的であり、この変異は明確に選択の標的となる。
同じ $s$ でも集団サイズによって進化的意味が全く異なります。これが木村の「事実上中立」(nearly neutral)の概念の数学的実体です。ヒトのように $N_e$ が小さい生物では、弱い選択圧は浮動にかき消されます。一方、大腸菌のような巨大集団では、非常に弱い選択でも有効に働きます。
中立変異の集団への置換速度が突然変異率 $\mu$ に等しいことを、以下の手順で導出せよ。
(a) 二倍体集団(個体数 $N$)で1世代あたりに生じる新規中立変異の総数を求めよ。1遺伝子座あたりの突然変異率を $\mu$ とする。
(b) 新規中立変異が最終的に集団に固定される確率を求めよ。
(c) (a) と (b) の積として、1世代あたりの置換速度を導出せよ。
(a) 二倍体 $N$ 個体の遺伝子コピー数は $2N$。各コピーが確率 $\mu$ で変異するので、1世代あたりの新規変異数は $2N\mu$。
(b) 新規変異は $2N$ コピー中の1つなので、初期頻度は $1/(2N)$。中立変異の固定確率は初期頻度に等しいので、$1/(2N)$。
(c) 置換速度 $= 2N\mu \times 1/(2N) = \mu$。
$N$ が完全にキャンセルされることが本質的です。大きな集団では変異がたくさん生じるが固定確率が低く、小さな集団では変異は少ないが固定確率が高い。この2つの効果が正確に相殺するため、中立変異の置換速度は集団サイズに依存しません。これが分子時計の理論的根拠であり、木村の中立進化論の重要な帰結です。
超優性(heterozygote advantage)のモデルを考える。対立遺伝子 $A$, $a$ に対して、適応度が $AA$: $1 - s_1$, $Aa$: $1$, $aa$: $1 - s_2$ であるとする。以下の問いに答えよ。
(a) 平均適応度 $\bar{w}$ を $p$, $s_1$, $s_2$ で表せ。
(b) $\Delta p = 0$ となる内部平衡点($0 < \hat{p} < 1$)を求めよ。(ヒント:$\Delta p = 0$ の条件を、対立遺伝子 $A$ の頻度変化の式から導出する。)
(c) $s_1 = 0.1$, $s_2 = 0.2$ のとき、平衡時の $a$ の頻度 $\hat{q}$ を求め、マラリアと鎌状赤血球の例と関連づけて考察せよ。
(a) ハーディ・ワインベルグ平衡の遺伝子型頻度を仮定すると、
$$\bar{w} = p^2(1-s_1) + 2pq + q^2(1-s_2) = 1 - s_1 p^2 - s_2 q^2$$
(b) 対立遺伝子 $A$ の選択後の頻度は $p' = [p^2(1-s_1) + pq]/\bar{w}$ です。$\Delta p = p' - p = 0$ となる内部平衡の条件は、$p'=p$ すなわち分子 $= p\bar{w}$ を整理すると、
$$p^2(1-s_1) + pq = p(1 - s_1 p^2 - s_2 q^2)$$
$p \neq 0$ で割り、$q = 1-p$ を使って整理すると、
$$s_1 p = s_2 q = s_2(1-p)$$
$$\hat{p} = \frac{s_2}{s_1 + s_2}, \quad \hat{q} = \frac{s_1}{s_1 + s_2}$$
(c) $s_1 = 0.1$, $s_2 = 0.2$ のとき、$\hat{q} = 0.1/(0.1+0.2) = 1/3 \approx 0.33$。鎌状赤血球遺伝子($S$)の頻度がマラリア流行地域で比較的高い値で維持されているのは、$SS$ ホモ接合体(鎌状赤血球症、$s_2$ 大)と $AA$ ホモ接合体(マラリア感受性、$s_1$)の両方が不利であり、$AS$ ヘテロ接合体が最も適応度が高い超優性の状態にあるためです。
超優性(ヘテロ接合体の優位)では、自然選択自体が遺伝的多型を維持します。これを平衡選択(balancing selection)と呼びます。平衡頻度 $\hat{q} = s_1/(s_1+s_2)$ という式は、$s_1$ と $s_2$ の比だけで決まる簡潔な結果です。$s_2$($aa$ の不利さ)が大きいほど $\hat{q}$ は小さくなり、逆に $s_1$($AA$ の不利さ)が大きいほど $\hat{q}$ は大きくなるという直感的に理解できる関係です。