第1章 進化の数理

生命の起源と化学進化
── RNAワールドから最初の細胞へ

高校生物では「原始地球で無機物から有機物が生じ(化学進化)、やがて最初の生命が誕生した」と学びます。しかし、非生物的な分子からどうやって自己複製する系が生まれたのか、遺伝暗号はどう成立したのか、最初の細胞膜はどこから来たのか──これらは生物学最大の未解決問題です。この記事では、RNAワールド仮説を中心に、化学進化の分子論理を探ります。

1高校での扱い

高校生物で学ぶ生命の起源に関する知識は次の通りです。

  • 原始地球の環境:約46億年前に地球が誕生。原始大気にはCH₄、NH₃、H₂O、H₂などが含まれ、酸素はなかった。
  • ミラーの実験(1953年):原始大気を模した混合気体に放電すると、アミノ酸などの有機物が生成された。
  • 化学進化:無機物→簡単な有機物→高分子→原始生命体という段階的進化。
  • 細胞内共生説:ミトコンドリアと葉緑体は、かつて独立した原核生物が真核細胞に取り込まれて共生したもの(マーグリス、1967年)。

しかし、「自己複製する分子はどう生まれたのか」「最初の遺伝情報担体はDNAかRNAか」「細胞膜なしに生命は成立するのか」── 高校ではこれらの根本的な問いに答えていません。

2大学の視点 ── 自己複製系の起源

高校 vs 大学:生命の起源
高校:無機物→有機物→生命(段階を記述)
大学:「鶏と卵」問題の解決──RNAが情報と触媒の両方を担うRNAワールド仮説
高校:コアセルベート(概念レベル)
大学:脂肪酸小胞の自己組織化とプロトセルの実験的再構成
ここが本質 ── 「鶏と卵」問題

現在の生命ではDNAが情報を保存し、タンパク質(酵素)が化学反応を触媒します。しかし、DNAの複製にはタンパク質が必要で、タンパク質の合成にはDNAが必要です。では最初に何があったのか? この「鶏と卵」問題に対する現在の最有力仮説がRNAワールド仮説です。RNAは情報の保存(塩基配列)と化学反応の触媒(リボザイム)の両方の能力を持つため、最初の自己複製系はRNAだけで成立し得たと考えられています。

3RNAワールド仮説

リボザイムの発見

1982年、チェック(Cech)はテトラヒメナのrRNA前駆体が自己スプライシングすることを発見しました。また、アルトマン(Altman)はRNase PのRNA成分が触媒活性を持つことを示しました(1989年ノーベル化学賞)。これらの発見により、RNAが酵素として機能しうること(リボザイム)が証明されました。

リボソームはリボザイムである

2000年のX線結晶構造解析により、リボソームのペプチド結合形成反応を触媒するのは23S rRNA(タンパク質ではない)であることが判明しました。つまり、現在の生命でタンパク質合成を担う装置そのものがリボザイムです。これはRNAワールドの「化石」と解釈されています。

なぜそういえるのか ── SELEX実験

SELEX(Systematic Evolution of Ligands by EXponential enrichment)は、ランダムなRNA配列のライブラリから特定の機能を持つRNA(アプタマー)を選択する実験系です。$10^{15}$種類のランダムRNA配列から出発して、「結合→洗浄→増幅」のサイクルを繰り返すと、特定のリガンドに結合するRNAや、特定の化学反応を触媒するRNAが選択されます。SELEX実験により、RNAがRNA複製酵素活性を持ちうることが示され、RNAワールド仮説を実験的に支持しています。

数式で理解する ── 自己複製の閾値

自己複製するRNA分子が進化するには、複製の正確性がある閾値を超えている必要があります。アイゲン(Eigen)のエラーカタストロフ理論によると、複製1塩基あたりの正確性を $q$、ゲノム長を $L$ とすると、遺伝情報が維持される条件は

$$q^L > \frac{1}{s}$$

ここで $s$ は選択優位性です。$q = 0.99$(1%の誤り率)で $s = 2$ なら $L < \ln 2 / \ln(1/0.99) \approx 69$ 塩基。つまり、原始的なRNA複製酵素(誤り率数%)では、約100塩基以下の短いRNAしか忠実に複製できません。これが「アイゲンのパラドックス」であり、生命の起源における根本的な制約です。

4原始細胞膜の自己組織化

生命の起源には自己複製する分子だけでなく、それを包む区画(コンパートメント)が必要です。現在の細胞膜はリン脂質二重層ですが、リン脂質の合成には酵素が必要です。では最初の膜は何だったのか?

脂肪酸小胞

ショスタク(Szostak)らは、単純な脂肪酸(例えばオレイン酸)が水溶液中で自発的に小胞(ベシクル)を形成し、以下の性質を持つことを示しました。

  • 膜を通してヌクレオチドなどの小分子を取り込める(リン脂質膜より透過性が高い)
  • 脂肪酸分子の追加供給により成長・分裂できる
  • 内部にRNA鋳型を封入した状態で非酵素的RNA複製が起こりうる

このような脂肪酸小胞はプロトセル(原始細胞)のモデルとして研究されています。

ここで注意 ── よくある誤解

誤:コアセルベート(オパーリンのモデル)が最初の細胞のモデルとして有力

正:コアセルベートは高分子の凝集体であり、遺伝情報の複製や成長・分裂の能力がありません。現在の研究では、脂肪酸小胞に基づくプロトセルモデルが主流です。コアセルベートは歴史的に重要ですが、現在の生命起源研究の中心ではありません。

5遺伝暗号の起源

なぜ特定のコドンが特定のアミノ酸に対応するのか? 遺伝暗号の成立には3つの仮説があります。

  1. 立体化学仮説:コドン(またはアンチコドン)配列とアミノ酸の側鎖の間に物理化学的な親和性がある。アプタマー実験で部分的に支持。
  2. 凍結事故仮説(クリック, 1968年):初期のコドン-アミノ酸対応は偶然に決まったが、一度確立されると変更すると全タンパク質が壊れるため「凍結」された。
  3. 適応仮説:類似したアミノ酸が類似したコドンに割り当てられているのは、翻訳誤りの影響を最小化する自然選択の結果。
発展的な視点 ── 遺伝暗号の普遍性の例外

遺伝暗号はほぼ全ての生物で共通(普遍的)ですが、ミトコンドリアや一部の原生生物では例外があります。例えば、ヒトのミトコンドリアではUGAが終止コドンではなくトリプトファンをコードし、AGAは終止コドンとして機能します。これらの例外は、遺伝暗号が完全に「凍結」されておらず、小さなゲノム(翻訳される遺伝子が少ない系)ではコドンの再割り当てが起こりうることを示しています。

6LUCA ── 全生物の最終共通祖先

LUCA(Last Universal Common Ancestor)は、現存する全ての生物の最終共通祖先です。LUCAは化石として発見されたわけではなく、全生物に共通する分子的特徴から推定されます。

LUCAの推定される特徴

  • DNAゲノムを持ち、半保存的複製を行う
  • 遺伝暗号は現在とほぼ同じ(普遍的遺伝暗号)
  • リボソーム(70S型)による翻訳系を持つ
  • ATP合成酵素(回転型分子モーター)を持つ
  • おそらく好熱性(高温環境に適応)──分子系統学的推定
  • 推定生存時期:約38〜42億年前
数式で理解する ── 分子時計によるLUCAの年代推定

B-1-2で学んだ分子時計の概念を使って、LUCAの年代を推定できます。全生物に共通するリボソームRNA(16S/18S rRNA)の配列比較から、細菌と古細菌の分岐年代を逆算すると、LUCAは約38〜42億年前に存在したと推定されます。最古の確実な微化石は約35億年前のものであり、分子時計の推定と整合しています。

なぜそういえるのか ── LUCAはDNAを持っていたか

細菌・古細菌・真核生物の3ドメイン全てがDNAゲノムとほぼ同一の遺伝暗号を持つことから、LUCAは既にDNAゲノムを獲得していたと推定されます。ただし、DNA複製に関わるタンパク質(DNAポリメラーゼ)は細菌と古細菌/真核生物で系統的に異なるため、LUCAのDNA複製系はまだ原始的だった可能性があります。

7つながりマップ

まとめ

  • 生命の起源の「鶏と卵」問題(DNA vs タンパク質)に対する最有力仮説がRNAワールド仮説。RNAは情報保存と触媒の両能力を持つ。
  • リボザイムの発見(Cech, Altman)とリボソームがリボザイムであるという発見がRNAワールド仮説を支持する。
  • SELEX実験により、ランダムRNA配列から触媒活性RNAが選択可能であることが実験的に示された。
  • アイゲンのエラーカタストロフ理論は、原始的RNA複製酵素では約100塩基以下しか忠実に複製できないという制約を示す。
  • 脂肪酸小胞(プロトセル)は、リン脂質膜より透過性が高く、成長・分裂能力を持ち、原始細胞のモデルとなる。
  • LUCA(最終共通祖先)はDNAゲノム・リボソーム・ATP合成酵素を持ち、約38〜42億年前に存在したと推定される。

9確認テスト

理解度チェック

Q1. RNAワールド仮説が「鶏と卵」問題を解決する理由を説明せよ。

クリックして解答を表示 現在の生命ではDNAが情報を保存し、タンパク質が触媒を担うが、両者は互いに依存している。RNAは情報保存(塩基配列)と触媒活性(リボザイム)の両方を持つため、最初の自己複製系はRNAだけで成立し得る。これにより「先にDNAかタンパク質か」という問題が解消される。 RNAの二重機能性が鍵です。リボソームがリボザイムであること(現存する「RNAワールドの化石」)が最も強力な証拠です。

Q2. アイゲンのエラーカタストロフとは何か。原始的RNA複製における制約を数値を用いて説明せよ。

クリックして解答を表示 複製の誤り率がある閾値を超えると、世代を経るうちに遺伝情報が失われてしまう現象。条件は$q^L > 1/s$($q$:1塩基あたりの正確性、$L$:ゲノム長、$s$:選択優位性)。$q=0.99$、$s=2$の場合、$L < 69$塩基。原始的RNA複製酵素では約100塩基以下の短いRNAしか忠実に複製できないため、複雑な機能を持つ長いRNA分子は維持できないというパラドックスが生じる。 このパラドックスの解決策として、ハイパーサイクル(相互扶助的な短いRNA群)や区画化(小胞による囲い込み)が提案されています。

Q3. 脂肪酸小胞がリン脂質膜と比較して原始細胞のモデルとして適している理由を2つ挙げよ。

クリックして解答を表示 (1)脂肪酸は非酵素的に合成可能であり、水溶液中で自発的に小胞を形成する(リン脂質の合成には酵素が必要)。(2)脂肪酸膜はリン脂質膜より透過性が高く、ヌクレオチドなどの小分子を取り込める(原始的な代謝に有利)。 さらに脂肪酸小胞は、外部からの脂肪酸分子の供給により成長・分裂でき、自己複製的な振る舞いを示します。

Q4. コアセルベートとプロトセル(脂肪酸小胞モデル)の違いを説明せよ。

クリックして解答を表示 コアセルベートは高分子の凝集体であり、液-液相分離で形成される。成長・分裂や遺伝情報の複製能力がない。一方、プロトセル(脂肪酸小胞)は二分子膜で囲まれた区画であり、膜を通した物質取り込み、成長・分裂、内部でのRNA複製が可能で、より現実的な原始細胞モデルである。 オパーリンのコアセルベートは生命起源研究の歴史的出発点ですが、現在の研究ではプロトセルが主流です。

Q5. LUCAが持っていたと推定される4つの分子的特徴を挙げよ。

クリックして解答を表示 (1)DNAゲノムと半保存的複製、(2)普遍的遺伝暗号による翻訳系、(3)70S型リボソーム、(4)回転型ATP合成酵素。これらは3ドメイン(細菌・古細菌・真核生物)全てに共通するため、LUCAが既に獲得していたと推定される。 化学浸透圧説によるATP合成機構が全生物に共通することは、LUCAの時点で既にプロトン駆動力によるエネルギー代謝が確立していたことを示唆します。

10演習問題

問1 B 論述

 RNAワールドからDNA/タンパク質ワールドへの移行はどのように起こったと考えられるか。「なぜDNAが情報保存を引き継いだのか」「なぜタンパク質が触媒機能を引き継いだのか」をそれぞれ分子の化学的性質から考察せよ。

クリックして解答を表示
解答

DNAが情報保存を引き継いだ理由:(1)DNAの2'-デオキシリボースはRNAの2'-OHを欠くため化学的に安定(アルカリ加水分解を受けにくい)、(2)チミン(5-メチルウラシル)はシトシンの脱アミノ化産物(ウラシル)と区別可能で、修復が容易。タンパク質が触媒を引き継いだ理由:20種類のアミノ酸は4種類のヌクレオチドよりも側鎖の化学的多様性が高く、酸塩基触媒、金属配位、疎水性ポケット形成など多様な触媒機構を実現できる。

解説

DNAの化学的安定性は長期的な情報保存に有利であり、タンパク質の化学的多様性は触媒の汎用性に有利です。RNAは両方を「そこそこ」できますが、専門化した分子にはかないません。

問2 B 論述

 遺伝暗号の「凍結事故仮説」と「適応仮説」の違いを説明し、現在の遺伝暗号表の特徴(類似アミノ酸が類似コドンに割り当てられている)がどちらの仮説をより支持するか、根拠とともに考察せよ。

クリックして解答を表示
解答

凍結事故仮説:コドン-アミノ酸対応は偶然に決まったが、一度確立されると変更コストが大きすぎて凍結された(クリック, 1968年)。適応仮説:翻訳誤りの影響を最小化するように自然選択が働いた。遺伝暗号表の特徴として、疎水性アミノ酸(Val, Ile, Leu)は類似コドン(GUX, AUX, CUX)に、親水性アミノ酸(Asp, Glu)は類似コドン(GAX)に割り当てられている。1塩基の翻訳誤りが化学的に類似したアミノ酸への置換になるため、タンパク質機能への影響が最小化される。この特徴は適応仮説をより支持する。

解説

ランダムなコドン表10万種をシミュレーションすると、現実の遺伝暗号表が「翻訳誤りによるアミノ酸変化の化学的距離」を最小化する点で上位0.01%に入ることが示されています。これは適応仮説の定量的支持です。

問3 C 発展

 Eigenのエラーカタストロフ理論によれば、自己複製分子が情報を維持できる最大ゲノム長 $L_{\max}$ は、1塩基あたりの複製忠実度 $q$ と選択優位 $s$ によって制約される。忠実度条件は $q^L > 1/s$(ここで $s$ は野生型の適応度を変異体集団の平均適応度で割った値)で与えられる。以下の問いに答えよ。

(a) 忠実度条件 $q^L > 1/s$ を変形して、維持可能な最大ゲノム長 $L_{\max}$ を $q$ と $s$ を用いて表せ。RNAポリメラーゼの忠実度が $q = 0.999$(1塩基あたりのエラー率 $10^{-3}$)、選択優位 $s = 10$ のとき、$L_{\max}$ を計算せよ。

(b) 上記の $L_{\max}$ はRNAウイルスの実際のゲノムサイズと比較してどうか。コロナウイルス(約30,000塩基)がこの限界を超えてゲノムを維持できる理由を、校正活性(ExoN)の観点から説明せよ。

(c) Eigenのハイパーサイクルモデルでは、複数の自己複製分子が協同的に結合することでエラーカタストロフの制約を回避できるとされる。ハイパーサイクルが $n$ 種の複製子から構成されるとき、各複製子のゲノム長が $L_{\max}$ 以下であれば系全体として $n \times L_{\max}$ の情報を維持できる理由を説明せよ。また、ハイパーサイクルの安定性を脅かす「寄生体問題」とは何か、その解決策としての区画化(プロトセル)の役割を論じよ。

クリックして解答を表示
解答

(a) $q^L > 1/s$ の両辺の対数をとると $L \ln q > -\ln s$ となる。$\ln q < 0$ なので $L < \ln s / (-\ln q) = \ln s / |\ln q|$。よって

$$L_{\max} = \frac{\ln s}{|\ln q|}$$

$q = 0.999$ のとき $|\ln 0.999| \approx 0.001$、$s = 10$ のとき $\ln 10 \approx 2.303$。したがって

$$L_{\max} = \frac{2.303}{0.001} \approx 2300$$

すなわち、約2,300塩基が維持可能な最大ゲノム長である。

(b) 多くのRNAウイルス(インフルエンザ約13,500塩基、HIV約9,700塩基)はゲノムを分節化するか、$L_{\max}$ の範囲に収まる戦略をとっている。一方、コロナウイルス(約30,000塩基)は $L_{\max} \approx 2,300$ を大幅に超える。これはコロナウイルスが持つnsp14のExoN(3'→5'エキソヌクレアーゼ)校正活性により、実効的な忠実度が $q \approx 0.99999$(エラー率 $\sim 10^{-5}$)に向上するためである。この場合 $L_{\max} = \ln 10 / 10^{-5} \approx 230,000$ 塩基となり、30,000塩基のゲノムを十分維持できる。

(c) ハイパーサイクルでは、複製子 $I_1 \to I_2 \to \cdots \to I_n \to I_1$ が環状の触媒ネットワークを形成し、各複製子が次の複製子の複製を触媒する。各複製子は独立に $q^{L_i} > 1/s_i$ の忠実度条件を満たせばよく、系全体の情報量は $\sum_{i=1}^{n} L_i \leq n \times L_{\max}$ まで拡張される。寄生体問題とは、ネットワークに貢献せず他の複製子の触媒活性だけを利用する「フリーライダー」変異体が出現し、協同ネットワークを崩壊させることである。区画化(脂質膜によるプロトセルの形成)は、寄生体を含む区画が増殖で不利になることでグループ選択を可能にし、寄生体を排除する。これがRNAワールドからプロトセルへの移行の選択圧となったと考えられている。

解説

エラーカタストロフの閾値条件は、RNAウイルスの進化やがんの変異誘発治療(リバビリン等によるlethal mutagenesis)にも応用されています。ハイパーサイクルは理論的にはエレガントですが、寄生体問題という深刻な弱点を持ちます。Szathmaryらは、区画化によるグループ選択が「確率的修正因子」として機能し、寄生体を統計的に排除することを示しました。この理論は生命の起源における「個体」の誕生とも深く関わっています。