第1章 集団遺伝学の数理

集団遺伝学の数理
─ 選択係数と遺伝的浮動を定量的に理解する

高校生物では、「自然選択により有利な形質が集団に広まる」「遺伝的浮動は小集団で影響が大きい」と学びます。ハーディ・ワインベルグの法則は $p^2 + 2pq + q^2 = 1$ として計算問題にも登場しました。しかし、ある突然変異が集団に広まるのに何世代かかるのか、どのくらい小さな集団なら浮動が選択に勝つのかを問われると、高校の知識では答えられません。

大学の集団遺伝学では、選択係数 $s$有効集団サイズ $N_e$ という2つのパラメータを導入することで、これらの問いに定量的に答えます。そしてこの2つの積 $N_e s$ が、進化の運命を決める鍵となります。本記事では、ハーディ・ワインベルグの法則を出発点に、自然選択と遺伝的浮動の数理を一本の糸でつないでいきます。

1高校での扱い ── ハーディ・ワインベルグの法則と進化の概念

高校生物で学ぶ集団遺伝学の内容を整理しましょう。まず、ハーディ・ワインベルグの法則です。ある遺伝子座に対立遺伝子 $A$(頻度 $p$)と $a$(頻度 $q = 1 - p$)がある二倍体の集団を考えます。いくつかの理想的な条件(十分大きな集団、ランダム交配、突然変異なし、選択なし、移入なし)が満たされるとき、遺伝子型頻度は次の関係を保ちます。

$$p^2 + 2pq + q^2 = 1$$

ここで $p^2$ は遺伝子型 $AA$ の頻度、$2pq$ は $Aa$ の頻度、$q^2$ は $aa$ の頻度です。この法則の重要なポイントは、条件が満たされる限り遺伝子頻度は世代を超えて変化しないということです。つまり、この法則は「進化が起きない条件」を定義しています。

自然選択と遺伝的浮動の概念

高校では、ハーディ・ワインベルグの条件が崩れる要因として自然選択遺伝的浮動を学びます。自然選択とは、生存や繁殖に有利な形質を持つ個体がより多くの子孫を残すことで、その形質に関わる遺伝子の頻度が世代とともに変化する過程です。遺伝的浮動とは、偶然による遺伝子頻度の変動であり、集団が小さいほどその影響が大きくなります。

高校ではさらに、木村資生が提唱した中立進化論についても概念的に学びます。分子レベルの進化の多くは自然選択ではなく遺伝的浮動によって起こるという理論です。

ここまでが高校の範囲です。しかし、次のような問いには答えられません。「有利な突然変異はどれくらいの速さで広まるのか」「集団がどのくらい小さければ浮動が選択に勝つのか」「中立とはどの程度の有利さ/不利さまでを含むのか」。次のセクションで、大学の集団遺伝学がこれらの問いにどう答えるかを見ていきましょう。

2大学の視点 ── 2つのパラメータで進化を予測する

高校 vs 大学:集団遺伝学
高校:自然選択で有利な形質が広まる(定性的理解)
大学:選択係数 $s$ を導入し、遺伝子頻度の変化速度を微分方程式で記述する
高校:遺伝的浮動は小集団で影響が大きい(定性的理解)
大学:有効集団サイズ $N_e$ を定義し、浮動の強さを確率分布で定量化する
高校:中立進化論 ── 分子進化の多くは浮動による(概念理解)
大学:$N_e s \ll 1$ のとき変異は「事実上中立」── $N_e s$ で選択と浮動の境界を定量化する
ここが本質 ── $N_e s$ が進化の運命を決める

集団遺伝学の核心は、進化の方向性が選択係数 $s$(変異の有利さ/不利さ)と有効集団サイズ $N_e$(集団の「遺伝学的な大きさ」)の積 $N_e s$ で決まるということです。

$N_e s \gg 1$ のとき、自然選択が支配的であり、有利な変異は確実に集団に広まります。$N_e s \ll 1$ のとき、遺伝的浮動が支配的であり、変異の運命はほぼ偶然で決まります。この境界を定量的に理解することが、進化の予測を可能にします。

では、この2つのパラメータを具体的に定義し、それぞれがどのように進化を記述するかを見ていきましょう。まずは自然選択の数理から始めます。

3自然選択の数理 ── 選択係数と適応度

なぜ定量化が必要か

「有利な形質が広まる」という高校の説明は、定性的には正しくても、予測力がありません。たとえば、マラリア流行地域で鎌状赤血球遺伝子がどの程度の頻度に達するかを予測するには、「有利さ」を数値で表す必要があります。これが適応度(fitness)と選択係数(selection coefficient)の考え方です。

適応度と選択係数の定義

適応度 $w$ とは、ある遺伝子型を持つ個体が次世代に残す子孫の相対的な数です。最も適応度が高い遺伝子型の適応度を $1$ とし、他の遺伝子型はそれに対する比率で表します。

選択係数 $s$ は、適応度の低下を表すパラメータです。たとえば、対立遺伝子 $A$ が有利で $a$ が不利な場合、以下のように適応度を設定します。

遺伝子型 $AA$ $Aa$ $aa$
適応度 $w$ $1$ $1 - hs$ $1 - s$

ここで $s$ は選択係数($0 \le s \le 1$)、$h$ は優性度(dominance coefficient)です。$h$ は $A$ の有利さがヘテロ接合体でどの程度発現するかを表します。

  • $h = 0$ のとき:$A$ は完全優性。ヘテロ接合体 $Aa$ の適応度は $AA$ と同じ $1$。
  • $h = 0.5$ のとき:相加的(中間的)。$Aa$ の適応度は $AA$ と $aa$ の中間。
  • $h = 1$ のとき:$a$ が完全優性。ヘテロ接合体 $Aa$ の適応度は $aa$ と同じ $1 - s$。

選択係数の具体例

選択係数の値は、突然変異の種類によって大きく異なります。

  • 鎌状赤血球遺伝子(マラリア流行地域でのヘテロ接合体の有利さ):$s \approx 0.1$--$0.2$。これは非常に強い選択です。
  • 抗生物質耐性遺伝子(抗生物質存在下での細菌):$s$ は $0.01$--$0.5$ と幅広い。
  • タンパク質のアミノ酸置換(一般的な場合):$|s| \approx 10^{-4}$--$10^{-3}$ 程度が多い。非常に弱い選択です。
  • 同義置換(アミノ酸が変わらない塩基置換):$s \approx 0$。ほぼ中立。
「有利な変異」は常に広まるとは限らない

誤:自然選択で有利な変異は必ず集団全体に広まる

正:有利な変異であっても、発生直後は1コピーしか存在しない。小さな集団では遺伝的浮動により偶然消失する確率が高い。$s = 0.01$ の有利な変異が集団に固定される確率は約 $2s = 0.02$(2%)にすぎない(後述)。

適応度と選択係数を定義できたので、次に、選択が世代を通じて遺伝子頻度をどのように変化させるかを数式で追跡してみましょう。

4選択下での遺伝子頻度変化

1世代の遺伝子頻度変化

対立遺伝子 $A$(頻度 $p$)と $a$(頻度 $q = 1 - p$)を考えます。議論を明快にするため、まず $A$ が完全優性($h = 0$)の場合を考えましょう。適応度は $AA$: $1$、$Aa$: $1$、$aa$: $1 - s$ です。

自然選択は、各遺伝子型の繁殖成功度に差をつけます。選択後の遺伝子型頻度は、選択前の頻度に適応度をかけ、全体で割って正規化したものになります。

集団全体の平均適応度 $\bar{w}$ を計算します。

$$\bar{w} = p^2 \cdot 1 + 2pq \cdot 1 + q^2(1 - s) = 1 - sq^2$$

選択後の対立遺伝子 $a$ の頻度 $q'$ は次のように求められます。$aa$ 個体からの寄与は $q^2(1-s)/\bar{w}$、$Aa$ 個体からの寄与は $pq/\bar{w}$($Aa$ 個体は $a$ を確率 $1/2$ で渡すが、$2pq$ の $2$ と相殺)なので、

$$q' = \frac{q^2(1-s) + pq}{\bar{w}} = \frac{q[q(1-s) + p]}{1 - sq^2} = \frac{q(1 - sq)}{1 - sq^2}$$

1世代あたりの遺伝子頻度の変化量 $\Delta q = q' - q$ を計算しましょう。

$\Delta q$ の導出(完全優性の場合)

Step 1:$\Delta q = q' - q$ を計算する。

$$\Delta q = \frac{q(1 - sq)}{1 - sq^2} - q = \frac{q(1 - sq) - q(1 - sq^2)}{1 - sq^2}$$

Step 2:分子を展開する。

$$q(1 - sq) - q(1 - sq^2) = q - sq^2 - q + sq^3 = -sq^2 + sq^3 = -sq^2(1 - q) = -spq^2$$

Step 3:したがって、

$$\Delta q = \frac{-spq^2}{1 - sq^2}$$

$s$ が小さいとき $\bar{w} \approx 1$ なので、近似的に $\Delta q \approx -spq^2$ と書けます。

この式から重要なことがわかります。$\Delta q < 0$、つまり不利な対立遺伝子 $a$ の頻度は世代ごとに減少します。その速さは $s$(選択の強さ)と $p$, $q$(現在の遺伝子頻度)に依存します。

より一般的な場合:相加的選択

議論を一般化しましょう。高校範囲を超えた集団遺伝学で最もよく使われるのは、相加的選択($h = 0.5$、半優性)のモデルです。適応度を $AA$: $1$、$Aa$: $1 - s/2$、$aa$: $1 - s$ と設定すると、有利な対立遺伝子 $A$ の頻度変化は近似的に次のようになります。

相加的選択下での遺伝子頻度変化(連続近似)

$$\frac{dp}{dt} \approx sp(1-p) \cdot \frac{1}{2}$$

$p$ は有利な対立遺伝子 $A$ の頻度、$s$ は選択係数、$t$ は世代数。$1/2$ の因子は相加的選択($h = 0.5$)に対応します。$p(1-p)$ の項は、$p$ が $0$ や $1$ に近いほど変化が遅くなることを意味します。

この微分方程式はロジスティック型の形をしています。$p$ が小さいときは指数的に増加($dp/dt \approx sp/2$)し、$p$ が $1$ に近づくと変化が鈍くなります。

選択にかかる時間のスケール

この式から、有利な変異が集団に広まるのにかかる時間のオーダーを見積もることができます。$p$ が低い値から $1$ 近くに達するまでの時間は、おおよそ $1/s$ のオーダーの世代数です。

  • $s = 0.1$(強い選択):約 $10$ 世代程度のオーダーで大きな頻度変化。
  • $s = 0.01$(中程度の選択):約 $100$ 世代のオーダー。
  • $s = 0.001$(弱い選択):約 $1{,}000$ 世代のオーダー。

ヒトの場合(1世代 = 約25年)、$s = 0.01$ の有利な変異が広まるには数千年のオーダーが必要です。乳糖耐性(ラクターゼ持続性)がヨーロッパで過去約1万年のうちに広まったことは、かなり強い選択($s \approx 0.01$--$0.05$ と推定されている)を示唆しています。

超優性と平衡頻度 ── 鎌状赤血球の例

適応度が $AA$: $1 - s_1$、$Aa$: $1$、$aa$: $1 - s_2$ のとき(ヘテロ接合体が最も有利)、遺伝子頻度は固定されず、$\hat{q} = s_1/(s_1 + s_2)$ という平衡値に収束します。マラリア流行地域の鎌状赤血球遺伝子はこの例で、ホモ接合体 $SS$ は重度の鎌状赤血球症、ホモ接合体 $AA$ はマラリア感受性が高く、ヘテロ接合体 $AS$ がマラリア抵抗性を持ちつつ貧血にならないため最も適応度が高くなっています。

ここまでで、自然選択が遺伝子頻度をどう変えるかを定量的に記述できるようになりました。しかし、この議論は集団が無限に大きいことを暗黙に仮定しています。現実の集団は有限であり、偶然の効果 ── 遺伝的浮動 ── が必ず存在します。次のセクションで、浮動の確率論的モデルを導入します。

5遺伝的浮動の確率論的モデル

ライト-フィッシャーモデル

遺伝的浮動を数理的に扱うために、1930年代にSewall WrightとRonald Fisherが定式化したライト-フィッシャーモデル(Wright-Fisher model)を導入します。このモデルは次のように集団を理想化します。

  • 集団は $N$ 個体の二倍体生物からなる(遺伝子のコピー数は $2N$)。
  • 世代は離散的で重ならない(親世代は全員同時に次世代と置き換わる)。
  • 次世代の $2N$ 個の遺伝子コピーは、現世代の遺伝子プールから復元抽出で選ばれる。

復元抽出とは何か、具体的にイメージしましょう。壺の中に $A$ と書かれた球が $2Np$ 個、$a$ と書かれた球が $2Nq$ 個入っています。この壺から球を1つ取り出し、記録して戻す、という操作を $2N$ 回繰り返します。次世代での $A$ の数は、この抽出の結果で決まります。

現世代で対立遺伝子 $A$ の頻度が $p$ のとき、次世代での $A$ のコピー数 $k$ は二項分布に従います。

ライト-フィッシャーモデルの遷移確率

$$P(k) = \binom{2N}{k} p^k (1-p)^{2N-k}$$

$k$ は次世代での対立遺伝子 $A$ のコピー数、$2N$ は遺伝子コピーの総数、$p$ は現世代での $A$ の頻度。次世代の $A$ の頻度は $p' = k/(2N)$ です。

浮動による遺伝子頻度の分散

二項分布の性質から、次世代での $A$ の頻度 $p'$ の期待値分散が直ちに求まります。

$$E[p'] = p, \quad \mathrm{Var}(p') = \frac{p(1-p)}{2N}$$

期待値が $p$ のまま変わらないことは、浮動には方向性がないことを意味します。しかし分散は $1/(2N)$ に比例するため、集団が小さいほど1世代あたりの揺らぎが大きくなるのです。これが「遺伝的浮動は小集団で影響が大きい」という高校の説明の数学的根拠です。

有効集団サイズ $N_e$

現実の集団は、ライト-フィッシャーモデルの理想的な仮定からさまざまな点で逸脱します。性比の偏り、集団サイズの変動、非ランダム交配などです。有効集団サイズ $N_e$(effective population size)とは、実際の集団と同じ遺伝的浮動の強さを示す「理想集団の個体数」のことです。

つまり、実際の集団での浮動の分散が $\mathrm{Var}(p') = p(1-p)/(2N_e)$ となるような $N_e$ を定義します。一般に $N_e$ は実際の個体数 $N$ よりもかなり小さくなります。

  • ヒト:現在の人口は約80億ですが、$N_e$ は約 $10{,}000$--$20{,}000$ と推定されています。これは過去のボトルネック(集団サイズの急激な減少)を反映しています。
  • ショウジョウバエ:$N_e \approx 10^6$ 程度。
  • 大腸菌:$N_e \approx 10^8$ 程度(非常に大きい)。

$N_e s$ ── 選択と浮動の分水嶺

いよいよ、選択と浮動の相対的な重要性を評価する指標に到達します。選択による1世代の頻度変化は $\Delta p \sim sp$ のオーダー、浮動による揺らぎの標準偏差は $\sqrt{p(1-p)/(2N_e)} \sim 1/\sqrt{N_e}$ のオーダーです。選択の効果が浮動の揺らぎを上回る条件は、大まかに次のように表されます。

選択と浮動の境界条件

$$N_e s \gg 1 \quad \Longrightarrow \quad \text{selection dominant}$$

$$N_e s \ll 1 \quad \Longrightarrow \quad \text{drift dominant}$$

$N_e$ は有効集団サイズ、$s$ は選択係数。$N_e s$ は無次元量であり、進化の「運命」を決める最も重要なパラメータです。$N_e s \approx 1$ の近傍では選択と浮動が拮抗します。

この結果の意味を具体的な数値で確認しましょう。

生物 $N_e$(推定) 中立とみなせる $s$ の範囲
ヒト $\sim 10^4$ $|s| \ll 10^{-4}$
ショウジョウバエ $\sim 10^6$ $|s| \ll 10^{-6}$
大腸菌 $\sim 10^8$ $|s| \ll 10^{-8}$

同じ変異(同じ $s$)であっても、ヒトの集団では中立的にふるまうものが、大腸菌の巨大な集団では選択の標的になり得ます。中立性は変異の固有の性質ではなく、集団サイズとの相対的な関係で決まるのです。

中立変異の固定確率と固定時間

中立変異($s = 0$)が集団に固定される確率はいくつでしょうか。ライト-フィッシャーモデルでは、浮動に方向性がないことから、ある対立遺伝子が最終的に固定される確率は、現在のその頻度に等しくなります。新たに生じた突然変異は $2N$ 個のコピーのうちの1つなので、固定確率は次の通りです。

$$u_0 = \frac{1}{2N}$$

一方、中立変異が固定されるまでにかかる平均時間(固定するという条件のもとでの平均世代数)は次のように知られています。

$$\bar{t}_{\mathrm{fix}} \approx 4N_e \text{ 世代}$$

有利な変異($s > 0$)の場合、Kimura(1962)による拡散近似の結果が有名です。

新規変異の固定確率(木村の公式)

$$u(s) = \frac{1 - e^{-2s}}{1 - e^{-4N_e s}} \approx \frac{2s}{1 - e^{-4N_e s}}$$

新規変異(初期頻度 $p_0 = 1/(2N)$)の固定確率。$N_e s \gg 1$ のとき $u(s) \approx 2s$、$s \to 0$ のとき $u(0) = 1/(2N_e)$ となります。

この公式から、$s = 0.01$ の有利な変異でも固定確率は約 $2\%$ にすぎないことがわかります。有利な変異の大多数は、発生直後に浮動によって失われるのです。

「有利な変異は集団に広まる」の正確な意味

誤:有利な変異が生じれば、自然選択により確実に集団全体に広まる

正:有利な変異の固定確率は約 $2s$(相加的選択の場合)。$s = 0.01$ なら約2%。「有利な変異が広まりやすい」のは確かだが(中立変異の固定確率 $1/(2N)$ より格段に大きい)、多くの有利な変異は偶然失われる。

ここまでで、選択と浮動を統一的に扱う枠組みが整いました。最後に、この数理的枠組みの現代的な応用として、合祖理論の考え方を紹介します。

6応用・発展 ── 合祖理論への入口

時間を「逆向き」に辿る

ここまでの議論は、現在の遺伝子頻度から未来の変化を予測する「前向き」のアプローチでした。1982年にJohn Kingmanが定式化した合祖理論(coalescent theory)は、発想を逆転させ、現在のサンプルから過去に向かって系譜を辿ります。

考え方はシンプルです。現在の集団から2つの遺伝子コピーをサンプリングしたとき、この2つが最後に「共通の祖先コピー」に由来した時点(合祖、coalescence)はいつだったのか、を確率的に追跡します。

合祖時間の期待値

ライト-フィッシャーモデルにおいて、$2N$ 個の遺伝子コピーから2つを選んだとき、1世代前にそれらが同じ親コピーに由来していた確率(合祖確率)は次の通りです。

$$P(\text{1 world back coalescence}) = \frac{1}{2N_e}$$

合祖が起きるまでの世代数は幾何分布に従い、その期待値は次のようになります。

$$E[T_2] = 2N_e \text{ 世代}$$

つまり、ヒト($N_e \approx 10{,}000$)の場合、任意の2つの遺伝子コピーは平均して約20,000世代前(約50万年前)に共通祖先を持つことになります。

なぜ合祖理論が有用か

合祖理論の最大の利点は、サンプルの系譜だけに注目するため、集団全体をシミュレーションする必要がないことです。これにより、ゲノムデータから集団サイズの変動史を推定したり、自然選択の痕跡を検出したりすることが可能になりました。

  • ヒトの「出アフリカ」:合祖理論に基づく解析から、現生人類がアフリカを出たときにボトルネック(集団サイズの急減)を経験したことが示されました。
  • 選択スイープの検出:強い正の選択が働いた領域では、近傍の遺伝的多様性が低下します(選択スイープ)。合祖理論は、この多様性低下のパターンから選択を検出する統計的手法の基盤となっています。
  • 集団サイズの推定:遺伝的多様性のレベルから $N_e$ を推定できます。たとえば、チーターの遺伝的多様性が極めて低いことから、過去に深刻なボトルネックがあったことが推定されています。
分子時計と合祖理論の接点

中立変異の集団への置換速度(新しい変異が古い変異と置き換わる速度)は、驚くべきことに、集団サイズに依存せず、突然変異率 $\mu$ に等しくなります。これは、新規変異の発生数($2N\mu$ 個/世代)と固定確率($1/(2N)$)の積が $\mu$ となることから導かれます。この結果が分子時計の理論的基盤であり、合祖理論の重要な帰結でもあります。詳しくは次の記事 B-1-2 で扱います。

合祖理論の詳細な数理は次の記事(B-1-2 中立進化の数理的基盤)で扱いますが、その基本的な発想が、本記事で学んだ有効集団サイズ $N_e$ と深く結びついていることを確認できました。次のセクションでは、この記事の内容と他のトピックとのつながりを整理します。

7つながりマップ

集団遺伝学の数理は、進化生物学の多くの分野の定量的基盤です。以下のトピックと密接に関連しています。

  • B-1-2 中立進化の数理的基盤:本記事で導入した $N_e s$ の枠組みを使い、分子レベルの進化を定量的に扱います。中立変異の置換速度が突然変異率に等しいこと(分子時計の基盤)、dN/dS比による選択の検出など、本記事の直接的な続きです。
  • B-2-2 進化ゲーム理論:集団内での戦略の頻度変化は、選択下での遺伝子頻度変化と数学的に類似した構造を持ちます。有限集団での確率的なゲーム理論は、遺伝的浮動のモデルの拡張です。
  • B-14-1 ロジスティック方程式:本記事の選択下での遺伝子頻度変化の微分方程式はロジスティック型であり、個体群動態のロジスティック方程式と同じ数学的構造を持ちます。生態学と遺伝学の数理的なつながりを示す好例です。
  • B-16-1 ハミルトンの法則:利他行動の進化条件 $rB > C$ は、集団遺伝学の枠組みで導出されます。血縁度 $r$ は合祖理論とも関連する概念です。

それでは最後に、本記事の要点をまとめましょう。

Sまとめ
  • 適応度 $w$ と選択係数 $s$ を導入することで、自然選択の強さを数値化できる。相加的選択下での遺伝子頻度変化は $dp/dt \approx sp(1-p)/2$ と記述される。
  • ライト-フィッシャーモデルでは、遺伝的浮動を二項分布のサンプリングとしてモデル化する。1世代の遺伝子頻度の分散は $p(1-p)/(2N)$ であり、集団が小さいほど揺らぎが大きい。
  • 有効集団サイズ $N_e$ は、実際の集団と同じ浮動の強さを示す理想集団の個体数。一般に実際の個体数よりかなり小さい。
  • $N_e s \gg 1$ なら選択が支配的、$N_e s \ll 1$ なら浮動が支配的。「中立」とは変異の固有の性質ではなく、集団サイズとの相対的な関係で決まる。
  • 新規の有利な変異の固定確率は約 $2s$。有利であっても大多数は偶然失われる。合祖理論は時間を逆向きに辿ることで、ゲノムデータから集団の歴史を推定する強力な枠組みを与える。

9確認テスト

理解度チェック

Q1. ハーディ・ワインベルグの法則が成り立つ条件のうち、自然選択に関するものと遺伝的浮動に関するものをそれぞれ1つ挙げ、それが崩れるとどうなるかを $s$ または $N_e$ を使って説明してください。

クリックして解答を表示 自然選択に関する条件は「選択がないこと」($s = 0$)。これが崩れると、$\Delta p \approx sp(1-p)/2$ に従って遺伝子頻度が方向性を持って変化します。遺伝的浮動に関する条件は「集団が十分大きいこと」($N \to \infty$、すなわち $N_e$ が十分大きい)。これが崩れると、分散 $p(1-p)/(2N_e)$ の確率的な揺らぎにより遺伝子頻度がランダムに変動します。

Q2. 選択係数 $s = 0.001$ の有利な突然変異が新たに生じたとき、この変異が集団に固定される確率はおよそいくらですか。

クリックして解答を表示 木村の公式より、$N_e s \gg 1$ のとき固定確率は $u(s) \approx 2s = 2 \times 0.001 = 0.002$、つまり約0.2%です。1000回のうち約2回しか固定されないことを意味します。

Q3. ヒト($N_e \approx 10{,}000$)とショウジョウバエ($N_e \approx 10^6$)で、$s = 10^{-5}$ の変異はそれぞれ「中立的」と言えますか。$N_e s$ の値で判断してください。

クリックして解答を表示 ヒト:$N_e s = 10^4 \times 10^{-5} = 0.1 \ll 1$ なので事実上中立。ショウジョウバエ:$N_e s = 10^6 \times 10^{-5} = 10 \gg 1$ なので選択が有効に働きます。同じ変異でも、集団サイズによって中立かどうかが異なります。

Q4. 中立変異の集団への置換速度が集団サイズに依存しない理由を、「突然変異の発生数」と「固定確率」の積として説明してください。

クリックして解答を表示 1世代あたりの新規中立変異の発生数は $2N\mu$($2N$ 個の遺伝子コピーそれぞれが確率 $\mu$ で変異するため)。各変異の固定確率は $1/(2N)$。よって置換速度 = $2N\mu \times 1/(2N) = \mu$ となり、$N$ がキャンセルされます。これが分子時計の理論的基盤です。

10演習問題

問1 A 計算

ある集団において、遺伝子座の対立遺伝子 $A$(頻度 $p = 0.6$)と $a$(頻度 $q = 0.4$)がある。適応度が $AA$: $1$, $Aa$: $1$, $aa$: $0.8$ であるとき、次の問いに答えよ。

(a) 選択係数 $s$ を求めよ。

(b) 集団の平均適応度 $\bar{w}$ を求めよ。

(c) 1世代後の対立遺伝子 $a$ の頻度 $q'$ を求めよ。

クリックして解答を表示
解答

(a) $aa$ の適応度が $1 - s = 0.8$ なので、$s = 0.2$。

(b) $A$ が完全優性なので、$\bar{w} = 1 - sq^2 = 1 - 0.2 \times 0.16 = 1 - 0.032 = 0.968$。

(c) $q' = q(1 - sq)/\bar{w} = 0.4 \times (1 - 0.2 \times 0.4)/0.968 = 0.4 \times 0.92/0.968 = 0.368/0.968 \approx 0.380$。

解説

$q$ は $0.400$ から $0.380$ へ、1世代で $0.020$ 低下しました。$s = 0.2$ は強い選択なので、目に見える速さで遺伝子頻度が変化します。近似式 $\Delta q \approx -spq^2 = -0.2 \times 0.6 \times 0.16 = -0.0192$ とも整合しています。

問2 A 計算

有効集団サイズ $N_e = 500$ の集団で、対立遺伝子 $A$ の頻度が $p = 0.3$ であるとする。遺伝的浮動のみが働くとき(選択なし)、次世代の $p'$ の期待値と標準偏差を求めよ。

クリックして解答を表示
解答

期待値:$E[p'] = p = 0.3$。

分散:$\mathrm{Var}(p') = p(1-p)/(2N_e) = 0.3 \times 0.7/1000 = 0.00021$。

標準偏差:$\mathrm{SD}(p') = \sqrt{0.00021} \approx 0.0145$。

解説

1世代あたりの揺らぎの標準偏差は約 $0.015$ であり、$p = 0.3$ に対して約 $5\%$ の相対的な揺らぎです。$N_e = 50$ であれば標準偏差は約 $0.046$ となり、揺らぎはおよそ3倍に増大します。集団サイズの効果が具体的に見えます。

問3 B 論述

ある突然変異の選択係数が $s = 10^{-4}$ であるとする。この変異が自然選択の標的として「見える」(選択が有効に働く)ために必要な有効集団サイズ $N_e$ の条件を、$N_e s$ の基準を用いて示せ。ヒト($N_e \approx 10^4$)と大腸菌($N_e \approx 10^8$)のそれぞれについて、この変異が中立的か選択的かを判定せよ。

クリックして解答を表示
解答

選択が有効に働く条件は $N_e s \gg 1$、すなわち $N_e \gg 1/s = 10^4$。

ヒト:$N_e s = 10^4 \times 10^{-4} = 1$。選択と浮動が拮抗する境界付近であり、この変異はほぼ中立的にふるまう。

大腸菌:$N_e s = 10^8 \times 10^{-4} = 10^4 \gg 1$。選択が圧倒的に支配的であり、この変異は明確に選択の標的となる。

解説

同じ $s$ でも集団サイズによって進化的意味が全く異なります。これが木村の「事実上中立」(nearly neutral)の概念の数学的実体です。ヒトのように $N_e$ が小さい生物では、弱い選択圧は浮動にかき消されます。一方、大腸菌のような巨大集団では、非常に弱い選択でも有効に働きます。

問4 B 導出

中立変異の集団への置換速度が突然変異率 $\mu$ に等しいことを、以下の手順で導出せよ。

(a) 二倍体集団(個体数 $N$)で1世代あたりに生じる新規中立変異の総数を求めよ。1遺伝子座あたりの突然変異率を $\mu$ とする。

(b) 新規中立変異が最終的に集団に固定される確率を求めよ。

(c) (a) と (b) の積として、1世代あたりの置換速度を導出せよ。

クリックして解答を表示
解答

(a) 二倍体 $N$ 個体の遺伝子コピー数は $2N$。各コピーが確率 $\mu$ で変異するので、1世代あたりの新規変異数は $2N\mu$。

(b) 新規変異は $2N$ コピー中の1つなので、初期頻度は $1/(2N)$。中立変異の固定確率は初期頻度に等しいので、$1/(2N)$。

(c) 置換速度 $= 2N\mu \times 1/(2N) = \mu$。

解説

$N$ が完全にキャンセルされることが本質的です。大きな集団では変異がたくさん生じるが固定確率が低く、小さな集団では変異は少ないが固定確率が高い。この2つの効果が正確に相殺するため、中立変異の置換速度は集団サイズに依存しません。これが分子時計の理論的根拠であり、木村の中立進化論の重要な帰結です。

問5 C 発展

超優性(heterozygote advantage)のモデルを考える。対立遺伝子 $A$, $a$ に対して、適応度が $AA$: $1 - s_1$, $Aa$: $1$, $aa$: $1 - s_2$ であるとする。以下の問いに答えよ。

(a) 平均適応度 $\bar{w}$ を $p$, $s_1$, $s_2$ で表せ。

(b) $\Delta p = 0$ となる内部平衡点($0 < \hat{p} < 1$)を求めよ。(ヒント:$\Delta p = 0$ の条件を、対立遺伝子 $A$ の頻度変化の式から導出する。)

(c) $s_1 = 0.1$, $s_2 = 0.2$ のとき、平衡時の $a$ の頻度 $\hat{q}$ を求め、マラリアと鎌状赤血球の例と関連づけて考察せよ。

クリックして解答を表示
解答

(a) ハーディ・ワインベルグ平衡の遺伝子型頻度を仮定すると、

$$\bar{w} = p^2(1-s_1) + 2pq + q^2(1-s_2) = 1 - s_1 p^2 - s_2 q^2$$

(b) 対立遺伝子 $A$ の選択後の頻度は $p' = [p^2(1-s_1) + pq]/\bar{w}$ です。$\Delta p = p' - p = 0$ となる内部平衡の条件は、$p'=p$ すなわち分子 $= p\bar{w}$ を整理すると、

$$p^2(1-s_1) + pq = p(1 - s_1 p^2 - s_2 q^2)$$

$p \neq 0$ で割り、$q = 1-p$ を使って整理すると、

$$s_1 p = s_2 q = s_2(1-p)$$

$$\hat{p} = \frac{s_2}{s_1 + s_2}, \quad \hat{q} = \frac{s_1}{s_1 + s_2}$$

(c) $s_1 = 0.1$, $s_2 = 0.2$ のとき、$\hat{q} = 0.1/(0.1+0.2) = 1/3 \approx 0.33$。鎌状赤血球遺伝子($S$)の頻度がマラリア流行地域で比較的高い値で維持されているのは、$SS$ ホモ接合体(鎌状赤血球症、$s_2$ 大)と $AA$ ホモ接合体(マラリア感受性、$s_1$)の両方が不利であり、$AS$ ヘテロ接合体が最も適応度が高い超優性の状態にあるためです。

解説

超優性(ヘテロ接合体の優位)では、自然選択自体が遺伝的多型を維持します。これを平衡選択(balancing selection)と呼びます。平衡頻度 $\hat{q} = s_1/(s_1+s_2)$ という式は、$s_1$ と $s_2$ の比だけで決まる簡潔な結果です。$s_2$($aa$ の不利さ)が大きいほど $\hat{q}$ は小さくなり、逆に $s_1$($AA$ の不利さ)が大きいほど $\hat{q}$ は大きくなるという直感的に理解できる関係です。