第15章生態系と生物多様性の理論

生物多様性の定量的理解
── 種数面積関係と多様度指数

「この森は生物多様性が高い」── 高校生物でもよく出てくる表現ですが、「高い」とは具体的にどういう意味でしょうか。種数が多ければ多様性が高いのか、それだけで十分なのか。たとえば、100種が記録された森林でも、1種が個体数の99%を占めていたら、その森は本当に「多様」といえるでしょうか。

大学の生態学では、多様性を情報量として定量化します。シャノン・ウィーナー指数 $H' = -\sum p_i \ln p_i$ は、群集から無作為に取り出した1個体が「どの種であるかの不確実性」を測る指標です。種数が多いほど、そして各種の個体数が均等であるほど、不確実性は大きくなる ── つまり多様性が高いのです。

本記事では、「種数だけでは多様性を測れない」という問題提起から出発し、シャノン指数とシンプソン指数の導出と意味を理解し、さらに空間スケールに応じた多様性の階層構造（$\alpha$・$\beta$・$\gamma$ 多様性）を学びます。前記事 B-15-1 で学んだ種数面積関係 $S = cA^z$ とのつながりも見ていきましょう。

CONTENTS

高校での扱い ── 生物多様性の3つのレベル
大学の視点 ── 多様性を「情報量」で測る
シャノン・ウィーナー指数の導出と意味
シンプソンの多様度指数と均等度
空間スケールの多様性 ── $\alpha$・$\beta$・$\gamma$
応用・発展 ── 希薄化曲線と中間かく乱仮説
つながりマップ
まとめ
確認テスト
演習問題

1高校での扱い ── 生物多様性の3つのレベル

高校生物では、生物多様性を3つのレベルで整理しました。

遺伝的多様性：同じ種の中での遺伝子の多様さ（例：ゲンジボタルの地域ごとの発光パターンの違い）
種多様性：ある地域にどれだけ多くの種が存在するか
生態系多様性：森林・草原・湿地・河川など、さまざまなタイプの生態系が存在すること

また、種間関係（競争・捕食・共生・すみわけ）やかく乱（台風、山火事など）が多様性に影響を与えることも学びました。特に「適度なかく乱が多様性を高める」という中間かく乱仮説は、高校の教科書や問題集でもよく取り上げられるテーマです。

しかし、高校では「多様性が高い／低い」という判断を直感的に行っていました。種数が多ければ多様性が高い、とざっくり捉えていたはずです。では、次のような2つの群集を比べてみましょう。

群集	種数	各種の個体数（100個体中）
群集A	4種	25, 25, 25, 25
群集B	4種	97, 1, 1, 1

どちらも種数は4で同じです。しかし直感的に、群集Aのほうが「多様」に感じませんか。群集Bでは事実上1種が独占しており、残り3種に出会うことはほとんどありません。種数だけでは、この違いを表現できないのです。次のセクションでは、大学の生態学がこの問題にどう答えるかを見ていきます。

2大学の視点 ── 多様性を「情報量」で測る

高校生物 vs 大学生物学

高校：生物多様性は「遺伝的・種・生態系」の3レベルで定性的に理解する

大学：多様度指数（シャノン指数・シンプソン指数）で定量化し、種数と均等度の両面から評価する

高校：種数が多い＝多様性が高い、と暗黙に仮定する

大学：種数（richness）と均等度（evenness）を明確に区別し、両方を考慮する

高校：「ある地域の多様性」を漠然と一括りに考える

大学：空間スケールに応じて $\alpha$（局所）・$\beta$（間）・$\gamma$（地域全体）多様性を階層的に定義する

ここが本質 ── 多様性とは「不確実性」である

群集から無作為に1個体を取り出したとき、それがどの種であるかの予測しにくさが多様性の正体です。

1種しかいなければ結果は確実（多様性ゼロ）。種数が多く、かつ各種の個体数が均等であるほど、結果は不確実（多様性が高い）。

この「不確実性」を情報理論の枠組みで定量化したのがシャノン・ウィーナー指数であり、確率論の枠組みで定量化したのがシンプソンの多様度指数です。

この考え方は、1948年にクロード・シャノン（Claude Shannon）が通信理論の文脈で定式化した情報エントロピーに由来します。シャノンは「メッセージに含まれる情報量とは、そのメッセージを受け取る前の不確実性のことだ」と洞察しました。生態学者たちは1960年代にこの概念を生物群集の解析に応用しました。では、シャノン指数がどのように導かれるかを、次のセクションで一歩ずつ見ていきましょう。

3シャノン・ウィーナー指数の導出と意味

出発点：「驚き」の量を測る

多様性を定量化するための出発点は、「ある事象が起こったとき、どれだけ驚くか」を数値化することです。まず、1種類の事象（＝ある種を引く）に対する「驚き」を定義し、その後で群集全体の平均的な驚きを計算します。

ある種 $i$ の相対頻度（その群集における個体数の割合）を $p_i$ とします。 $p_i$ が小さい種（珍しい種）を引いたら驚きが大きく、$p_i$ が大きい種（ありふれた種）を引いたら驚きが小さい ── これは直感に合います。数学的には、この「驚き」（情報量）を次のように定義します。

自己情報量（驚きの量）

$$I(p_i) = -\ln p_i$$

$p_i$：種 $i$ の相対頻度（$0 < p_i \leq 1$）。$p_i = 1$（確実）のとき $I = 0$（驚きなし）。 $p_i$ が小さいほど $I$ は大きい。対数を使うのは、独立な事象の驚きが加法的になるようにするためです。

なぜ対数なのでしょうか。たとえば、コインを2回投げて両方表が出る確率は $p = 1/4$ です。「1回目が表」の驚きと「2回目が表」の驚きを足したものが「2回とも表」の驚きに等しくなってほしい。確率は掛け算（$1/2 \times 1/2 = 1/4$）ですが、対数をとれば $\ln(1/4) = \ln(1/2) + \ln(1/2)$ と足し算になります。このように、対数を使うことで「独立事象の情報量が加法的になる」という自然な性質が得られるのです。

群集全体の「平均的な驚き」

群集に $S$ 種が含まれ、種 $i$ の相対頻度が $p_i$ であるとします（$\sum_{i=1}^{S} p_i = 1$）。この群集から無作為に1個体を取り出したとき、「平均してどれくらい驚くか」を計算します。種 $i$ を引く確率は $p_i$、そのときの驚きは $-\ln p_i$ なので、驚きの期待値は次のようになります。

シャノン・ウィーナー多様度指数（Shannon-Wiener index）

$$H' = -\sum_{i=1}^{S} p_i \ln p_i$$

$S$：種数、$p_i$：種 $i$ の相対頻度。$H'$ は群集から無作為に1個体を取り出したときの、種の同定に関する「平均的な不確実性」を表します。単位は「ナット」（nat、自然対数の場合）。底を2にすれば「ビット」（bit）になります。

導出：シャノン指数の最大値と最小値

最小値：1種が個体数の100%を占める場合（$p_1 = 1$, 他は $p_i = 0$）。このとき $H' = -1 \cdot \ln 1 = 0$。次に何が出るか完全に予測できるので、不確実性はゼロです。（なお、$\lim_{p \to 0} p \ln p = 0$ なので、$p_i = 0$ の種は和に寄与しません。）

最大値：$S$ 種がすべて均等な頻度 $p_i = 1/S$ のとき。ラグランジュの未定乗数法で示せますが、直感的には「最も予測しにくい＝最も均等に散らばっている」状態です。このとき、

$$H'_{\max} = -\sum_{i=1}^{S} \frac{1}{S} \ln \frac{1}{S} = -S \cdot \frac{1}{S} \cdot \ln \frac{1}{S} = \ln S$$

つまり、$H'$ の最大値は種数 $S$ の対数です。種数が多いほど、上限が高くなります。

具体例で確認する

セクション1で挙げた2つの群集で $H'$ を計算してみましょう。

群集A（4種、各25個体）：$p_i = 0.25$ が4種。

$$H'_A = -4 \times 0.25 \ln 0.25 = -\ln 0.25 = \ln 4 \approx 1.386$$

群集B（4種、97:1:1:1）：$p_1 = 0.97$, $p_2 = p_3 = p_4 = 0.01$。

$$H'_B = -(0.97 \ln 0.97 + 3 \times 0.01 \ln 0.01) \approx -(0.97 \times (-0.0305) + 3 \times 0.01 \times (-4.605))$$

$$\approx -(- 0.0296 - 0.1382) = 0.168$$

群集Aの $H' \approx 1.39$、群集Bの $H' \approx 0.17$ ── 種数は同じ4でも、シャノン指数は大きく異なります。均等に分布している群集Aは $H'_{\max} = \ln 4 \approx 1.39$ に達しており、群集Bは最大値の12%程度にすぎません。これが「種数だけでは多様性を測れない」ことの定量的な証拠です。

$H'$ の値だけを比較するときの注意

注意：種数の異なる2群集で $H'$ の値を単純に比較してはいけません。$H'_{\max} = \ln S$ は種数に依存するため、種数100の群集と種数10の群集では上限が異なります。

対処：異なる種数の群集を比較するときは、後述する均等度（$H' / H'_{\max}$）を使うか、希薄化曲線で同じサンプルサイズに揃えてから比較します。

シャノン指数は情報理論に基づく多様度の測り方でした。しかし、多様性を測る方法はこれだけではありません。次のセクションでは、確率論に基づくシンプソンの指数と、種数・均等度を分離する方法を見ていきます。

4シンプソンの多様度指数と均等度

シンプソン指数：「同種に出会う確率」で測る

シンプソン（E. H. Simpson, 1949）は、多様性を直感的に理解しやすい別の方法で定量化しました。その発想は極めてシンプルです。「群集から無作為に2個体を取り出したとき、その2個体が同じ種である確率」を考えます。この確率が低いほど、多様性が高いということになります。

種 $i$ から2個体を取り出す確率は $p_i^2$（復元抽出の場合）なので、いずれかの種で2個体が一致する確率は $\sum p_i^2$ です。この値は多様性が高いほど小さくなるので、それを引いた値を指数として使います。

シンプソンの多様度指数（Simpson's diversity index）

$$D = 1 - \sum_{i=1}^{S} p_i^2$$

$\sum p_i^2$ は「同種に出会う確率」。$D$ はその補数であり、「異種に出会う確率」に対応します。 $D = 0$（1種のみ）が最低、$D = 1 - 1/S$（完全均等）が最高です。なお、$1/\sum p_i^2$ を逆シンプソン指数と呼び、「等価な種数」として解釈できます。

具体例で確認する

再び群集AとBで計算しましょう。

群集A：$\sum p_i^2 = 4 \times 0.25^2 = 4 \times 0.0625 = 0.25$。よって $D_A = 1 - 0.25 = 0.75$。

群集B：$\sum p_i^2 = 0.97^2 + 3 \times 0.01^2 = 0.9409 + 0.0003 = 0.9412$。よって $D_B = 1 - 0.9412 = 0.059$。

群集Aでは無作為に選んだ2個体が異種である確率が75%ですが、群集Bではわずか5.9%です。日常的な感覚に非常に近い結果が得られます。

シャノン指数 vs シンプソン指数

2つの指数はどちらも多様性を測りますが、重みづけが異なります。

特性	シャノン指数 $H'$	シンプソン指数 $D$
理論的基盤	情報理論（不確実性の平均）	確率論（同種遭遇確率の補数）
希少種への感度	比較的高い（$\ln p_i$ が小さい $p_i$ で急増）	低い（$p_i^2$ は小さい $p_i$ でほぼゼロ）
優占種への感度	中程度	高い（$p_i^2$ は大きい $p_i$ で支配的）
値の範囲	$0 \leq H' \leq \ln S$	$0 \leq D \leq 1 - 1/S$
解釈のしやすさ	情報量の単位（やや抽象的）	確率として直感的に理解可能

シャノン指数は希少種の存在に敏感であり、シンプソン指数は優占種の影響を強く反映します。生態学の調査では、目的に応じて両方を計算し、多様性の異なる側面を捉えるのが一般的です。

均等度（evenness）：種数と均一さを分離する

多様性は「種数」と「均等さ」の2つの要因から成り立っています。これらを分離して評価するために、均等度（evenness）が定義されます。

ピエルーの均等度（Pielou's evenness）

$$J = \frac{H'}{H'_{\max}} = \frac{H'}{\ln S}$$

$0 \leq J \leq 1$。$J = 1$ は完全均等（全種が同じ個体数）、$J$ が小さいほど特定の種が優占していることを示します。

群集Aでは $J_A = 1.386 / \ln 4 = 1.386 / 1.386 = 1.00$（完全均等）。群集Bでは $J_B = 0.168 / 1.386 = 0.12$（著しく不均等）。均等度を使えば、種数が異なる群集の「均一さ」の側面だけを比較できます。

深掘り：ヒルの数（Hill numbers）── 多様度指数の統一的枠組み

実は、シャノン指数やシンプソン指数は、ヒル（Mark O. Hill, 1973）が提唱した一般化された多様度の特殊ケースです。次数 $q$ のヒルの数は ${}^{q}\!D = \left(\sum p_i^q\right)^{1/(1-q)}$ と定義され、$q = 0$ で種数、$q \to 1$ で $\exp(H')$（シャノン指数の指数変換）、$q = 2$ で逆シンプソン指数に対応します。$q$ が大きいほど優占種に重みが置かれ、小さいほど希少種の影響が大きくなります。近年のメタ解析ではヒルの数を使った比較が標準になりつつあります。

ここまでで、ひとつの場所（ひとつの群集）の多様性を測る方法を学びました。しかし、生態学で「多様性」を議論するとき、空間スケールの違いが重要になります。次のセクションでは、多様性を空間的な階層に分けて考える枠組みを見ていきます。

5空間スケールの多様性 ── $\alpha$・$\beta$・$\gamma$

ホイッタカーの多様性の3層構造

ロバート・ホイッタカー（Robert Whittaker, 1960, 1972）は、生物多様性を空間スケールに応じて3つの層に分けて考えることを提案しました。これは生態学における最も基本的な概念の枠組みの一つです。

$\alpha$ 多様性（アルファ多様性）：ある一つの局所的な場所（調査区、ハビタット）における種の多様性。ここまでの $H'$ や $D$ はまさに $\alpha$ 多様性を測っています
$\gamma$ 多様性（ガンマ多様性）：複数の局所的な場所を含む地域全体の多様性。地域に含まれる全種の多様性です
$\beta$ 多様性（ベータ多様性）：場所ごとの種組成の違いを表す多様性。「場所によってどれだけ異なる種がいるか」を測ります

たとえば、ある山地の森林を考えましょう。標高500mの地点と標高1500mの地点では、それぞれ異なる種が見られます。各地点の $\alpha$ 多様性が同程度でも、2地点の種組成が大きく異なれば $\beta$ 多様性が高く、結果として山地全体の $\gamma$ 多様性は高くなります。

$\alpha$・$\beta$・$\gamma$ の数学的関係

ホイッタカーは、3つの多様性の間に次のような関係を定義しました。

多様性の乗法的分割（Whittaker, 1960）

$$\gamma = \alpha \times \beta$$

ここで $\alpha$, $\beta$, $\gamma$ は種数として考えます。平均的な局所の種数を $\bar{\alpha}$、地域全体の種数を $\gamma$ とすると、$\beta = \gamma / \bar{\alpha}$ です。 $\beta$ が大きいほど、場所間の種組成の入れ替わり（ターンオーバー）が大きいことを意味します。

一方、ランデ（R. Lande, 1996）は加法的な分割も提案しています。

多様性の加法的分割（Lande, 1996）

$$\gamma = \bar{\alpha} + \beta$$

シャノン指数やシンプソン指数を用いる場合、加法的分割が自然です。$\bar{\alpha}$ は各局所の多様度指数の平均、$\beta = \gamma - \bar{\alpha}$ は場所間の違いによる多様性の「上乗せ分」です。

具体例：2つの池の比較

ある地域に2つの池があり、それぞれの魚類群集が以下のとおりだとします。

	種A	種B	種C	種D	種E	種数
池1	50	30	20	0	0	3
池2	0	0	10	40	50	3

各池の $\alpha$ 多様性（種数）は3です。しかし、地域全体（2つの池を合わせた $\gamma$）の種数は5です。乗法的分割では $\beta = 5 / 3 \approx 1.67$ となり、場所間で種の入れ替わりがあることがわかります。もし2つの池の種組成が完全に同じなら $\beta = 1$（入れ替わりなし）、完全に異なれば $\beta = 2$（各池に固有の種のみ）です。

$\beta$ 多様性が重要な理由

自然保護の実務において、$\beta$ 多様性の概念は極めて重要です。地域の多様性（$\gamma$）を最大化するには、$\alpha$ 多様性を高めるだけでは不十分で、異なるタイプの生息地を保全する（$\beta$ 多様性を維持する）必要があります。

たとえば、10 ha の森林を保全するとき、同質な森林を10 ha 保全するより、湿地・乾燥林・渓流沿いなど多様な環境をモザイク状に保全するほうが、$\beta$ 多様性を通じて $\gamma$ 多様性は高くなります。

$\alpha$・$\beta$・$\gamma$ の枠組みは、前記事 B-15-1 で学んだ種数面積関係 $S = cA^z$ ともつながります。面積 $A$ を大きくすると種数 $S$ が増えるのは、面積が大きい地域ほど多様な環境（ハビタット）を含み、$\beta$ 多様性が蓄積されるためです。次のセクションでは、この空間スケールの多様性をさらに実用的に扱う方法と、多様性を生み出すメカニズムについて見ていきます。

6応用・発展 ── 希薄化曲線と中間かく乱仮説

希薄化曲線（rarefaction curve）

フィールド調査では、調査努力量（採集した個体数やサンプル数）が群集間で異なることがほとんどです。 100個体しか採集していない群集と1000個体を採集した群集では、後者のほうが多くの種が記録されるのは当然です。調査努力量が異なる群集間で種の多様性を公平に比較するにはどうすればよいでしょうか。

希薄化（rarefaction）は、この問題に対する統計的な解決法です。多くの個体を採集した群集から、少ない方のサンプルサイズに合わせて無作為にサブサンプルを抽出し、その期待種数を計算します。

希薄化の期待種数

$$E(S_n) = S - \sum_{i=1}^{S} \frac{\binom{N - N_i}{n}}{\binom{N}{n}}$$

$S$：観測された総種数、$N$：総個体数、$N_i$：種 $i$ の個体数、$n$：希薄化後のサンプルサイズ、$\binom{a}{b}$：二項係数。この式は、$n$ 個体を無作為に抽出したときに種 $i$ が少なくとも1個体含まれる確率を、全種について合計したものです。

希薄化曲線は、横軸にサンプルサイズ $n$、縦軸に期待種数 $E(S_n)$ をプロットしたものです。この曲線は常に上に凸な単調増加関数です。サンプルサイズが小さいうちは種数が急速に増え、新しい個体を採るたびに新種に出会う確率が高いですが、やがて曲線は飽和に近づきます。

複数の群集を比較する際には、同じサンプルサイズ $n$ における $E(S_n)$ を比較します。これにより、調査努力量の違いを統計的に補正した公平な比較が可能になります。

中間かく乱仮説の数理的背景

高校生物でも紹介される中間かく乱仮説（intermediate disturbance hypothesis, IDH）は、コネル（Joseph Connell, 1978）が提唱しました。「かく乱の頻度・強度が中程度のとき、種多様性が最大になる」という仮説です。高校ではこれを「適度なかく乱があると多様性が高まる」と定性的に学びましたが、その背景にある論理を大学レベルで掘り下げてみましょう。

この仮説の理論的根拠は、競争排除と初期化のバランスにあります。

かく乱が少ない場合：競争的優位種が他の種を排除していく（競争排除則）。十分な時間が経つと少数の優占種だけが残り、$\alpha$ 多様性は低下する
かく乱が多すぎる場合：かく乱に耐えられる少数の「強靱な種」だけが生き残る。多くの種は個体群を維持できず、種数は減少する
かく乱が中程度の場合：競争排除が完了する前に系がリセットされるため、競争的に劣位な種も存続できる。同時に、かく乱に弱い種も完全に排除されない。結果として最も多くの種が共存する

中間かく乱仮説を多様度指数で理解する

かく乱が少ない状態を考えます。優占種（種A）の $p_A$ が時間とともに増大し、他の種の $p_i$ が減少します。$H' = -\sum p_i \ln p_i$ において、ある1つの $p_i$ が1に近づくと $H' \to 0$ です。つまり、競争排除が進むと均等度が低下し、シャノン指数は減少します。

かく乱が起こると、優占種の個体数が減少して $p_A$ が下がり、他の種の $p_i$ が相対的に上昇します。これは均等度の回復を意味し、$H'$ が増大します。

かく乱が多すぎると、種数 $S$ そのものが減少するため、$H'_{\max} = \ln S$ の上限が下がります。

したがって、$H'$ は種数 $S$ と均等度 $J$ の積（$H' = J \cdot \ln S$）の観点から、中間のかく乱頻度で最大になるのです。

深掘り：中間かく乱仮説への批判と再評価

中間かく乱仮説は直感的に魅力的ですが、2010年代以降、実証的・理論的な再検討が進んでいます。フォックス（Jeremy Fox, 2013）は、メタ解析でかく乱強度と多様性の関係が単峰型（山型）になるとは限らないことを示しました。また、かく乱の「頻度」「強度」「種類」を区別せずに「中程度」と言うことの曖昧さも指摘されています。現代の生態学では、IDH を出発点としつつも、より精密なモデル（トレードオフ理論、中立理論など）で補完する方向に進んでいます。

種数面積関係との接続

前記事 B-15-1 で学んだ種数面積関係 $S = cA^z$ は、マクロな視点での多様性パターンを記述するものでした。本記事で学んだ多様度指数は、特定の群集の内部構造を記述するものです。この2つは、$\beta$ 多様性を通じてつながっています。

面積が大きいほど多様なハビタットが含まれ、ハビタット間の種組成の違い（$\beta$ 多様性）が蓄積されます。種数面積関係のべき指数 $z$ は、この $\beta$ 多様性の蓄積の速さを反映しているとも解釈できます。大陸の内部では $z \approx 0.1 \sim 0.2$（面積が増えてもハビタットが類似）、島嶼間では $z \approx 0.2 \sim 0.4$（孤立した島ほど独自の種がいる）という経験的パターンは、$\beta$ 多様性の空間構造の違いとして理解できるのです。

以上で、生物多様性の定量的な測定法と、その空間的・動態的な背景を一通り見てきました。次のセクションでは、これまでの内容が他の記事とどうつながるかを確認します。

7つながりマップ

前提：B-15-1 島の生物地理学理論 ── 種数面積関係 $S = cA^z$ はマクロな種数パターンを記述し、本記事の多様度指数は群集の内部構造を記述します。$\beta$ 多様性が両者をつなぐ概念です
発展：B-15-3 食物網の安定性理論 ── 「多様性が高い生態系は安定か」というメイのパラドックスは、本記事の多様度指数で測られる多様性と系の安定性の関係を問う問題です
関連：B-14-3 ロトカ・ヴォルテラ競争モデル ── 競争排除則は「なぜ多様性が維持されるのか」という問いの出発点であり、中間かく乱仮説は競争排除を抑制するメカニズムとして位置づけられます
関連：B-1-1 集団遺伝学の基礎 ── 遺伝的多様性もシャノン指数で測ることができます。対立遺伝子の頻度 $p_i$ を種の頻度と読み替えれば同じ数学的枠組みが適用されます

Sまとめ

種数だけでは多様性を測れない。種数（richness）と均等度（evenness）の両面を考慮する必要がある
シャノン・ウィーナー指数 $H' = -\sum p_i \ln p_i$ は情報理論に基づき、群集から1個体を取り出したときの種の不確実性（平均情報量）を測る。最大値は $\ln S$（完全均等時）
シンプソンの多様度指数 $D = 1 - \sum p_i^2$ は確率論に基づき、2個体が異種である確率を測る。シャノン指数は希少種に敏感、シンプソン指数は優占種に敏感という特徴の違いがある
空間スケールに応じて、$\alpha$（局所）・$\beta$（場所間の違い）・$\gamma$（地域全体）多様性を区別する。$\gamma = \bar{\alpha} \times \beta$（乗法的分割）または $\gamma = \bar{\alpha} + \beta$（加法的分割）の関係がある
希薄化曲線は調査努力量の違いを補正し、中間かく乱仮説は競争排除と初期化のバランスによって中程度のかく乱で多様性が最大になることを説明する

9確認テスト

理解度チェック

Q1. 種数が同じ2つの群集でシャノン指数 $H'$ が異なることがあるのはなぜですか。均等度の概念を用いて説明してください。

クリックして解答を表示 $H'$ は種数だけでなく各種の相対頻度（均等度）にも依存するためです。$H' = J \cdot \ln S$ と分解でき、種数 $S$ が同じでも均等度 $J$ が異なれば $H'$ は異なります。全種が均等な頻度のとき $J = 1$ で $H' = \ln S$（最大）、1種が優占すると $J$ が低下して $H'$ も低下します。

Q2. シャノン指数とシンプソン指数は、それぞれ希少種と優占種のどちらに対してより敏感ですか。その理由も述べてください。

クリックして解答を表示シャノン指数は希少種に対してより敏感です。$-p_i \ln p_i$ は $p_i$ が小さい領域でも比較的大きな値を持つため、希少種の追加・消失が $H'$ に影響を与えます。一方、シンプソン指数は優占種に対してより敏感です。$p_i^2$ は $p_i$ が大きい種ほど値が大きく、$\sum p_i^2$ を支配するため、優占種の頻度変化が $D$ に強く反映されます。

Q3. $\alpha$ 多様性、$\beta$ 多様性、$\gamma$ 多様性の違いを、具体例を挙げて説明してください。

クリックして解答を表示ある山地に標高の異なる3つの調査区があるとします。各調査区の種数（$\alpha$ 多様性）が平均10種、調査区間で種の入れ替わり（$\beta$ 多様性）があるため、山地全体（$\gamma$ 多様性）には25種が記録されるとします。$\alpha$ は1つの場所の多様性、$\gamma$ は地域全体の多様性、$\beta$ は場所間の種組成の違いを測り、$\beta = 25/10 = 2.5$（乗法的分割）です。

Q4. 調査努力量が異なる2つの群集の多様性を比較するとき、希薄化曲線はどのような役割を果たしますか。

クリックして解答を表示希薄化曲線は、サンプルサイズを統計的に揃えることで公平な比較を可能にします。多くの個体を採集した群集のデータから、少ない方のサンプルサイズに合わせてランダムにサブサンプルを抽出したときの期待種数を計算します。これにより、調査努力量の違いによるバイアスを除去し、同じサンプルサイズにおける種数を比較できます。

10演習問題

問1 A 基本計算

ある草原で植物の個体数調査を行ったところ、以下の結果が得られました。

種	個体数
種A	40
種B	30
種C	20
種D	10

(a) 各種の相対頻度 $p_i$ を求めてください。

(b) シャノン・ウィーナー指数 $H'$ を計算してください。

(d) ピエルーの均等度 $J$ を求めてください。

クリックして解答を表示

解答

(a) 総個体数 $= 100$。$p_A = 0.40$, $p_B = 0.30$, $p_C = 0.20$, $p_D = 0.10$。

(b) $H' = -(0.40 \ln 0.40 + 0.30 \ln 0.30 + 0.20 \ln 0.20 + 0.10 \ln 0.10)$

$= -(0.40 \times (-0.916) + 0.30 \times (-1.204) + 0.20 \times (-1.609) + 0.10 \times (-2.303))$

$= -(- 0.366 - 0.361 - 0.322 - 0.230) = 1.279$

(c) $\sum p_i^2 = 0.16 + 0.09 + 0.04 + 0.01 = 0.30$。$D = 1 - 0.30 = 0.70$。

(d) $J = H' / \ln S = 1.279 / \ln 4 = 1.279 / 1.386 = 0.923$。均等度は高いが完全ではありません。

問2 A 基本概念

次の記述が正しいか誤りかを判定し、誤りの場合は正しく訂正してください。

(a) シャノン指数は、1種だけからなる群集で最大値をとる。

(b) シンプソンの多様度指数 $D$ は、無作為に選んだ2個体が異なる種である確率に対応する。

クリックして解答を表示

解答

(a) 誤り。1種のみの群集では $H' = -1 \cdot \ln 1 = 0$ で最小値です。$H'$ は全種が均等な頻度のときに最大値 $\ln S$ をとります。

(b) 正しい。$\sum p_i^2$ は同種に出会う確率であり、$D = 1 - \sum p_i^2$ はその補数、すなわち異種に出会う確率です。

(c) 誤り。ある一つの場所の多様性は $\alpha$ 多様性です。$\beta$ 多様性は場所間の種組成の違い（ターンオーバー）を測る指標です。

問3 B 導出

シャノン指数 $H' = -\sum_{i=1}^{S} p_i \ln p_i$（ただし $\sum p_i = 1$）が、すべての種が均等な頻度 $p_i = 1/S$ のときに最大値 $\ln S$ をとることを、ラグランジュの未定乗数法を用いて示してください。

ヒント：$L = -\sum p_i \ln p_i - \lambda(\sum p_i - 1)$ として、$\partial L / \partial p_i = 0$ を各 $i$ について解きます。

クリックして解答を表示

解答

制約条件 $\sum_{i=1}^{S} p_i = 1$ のもとで $H' = -\sum p_i \ln p_i$ を最大化します。

ラグランジュ関数を構成します。

$$L = -\sum_{i=1}^{S} p_i \ln p_i - \lambda\left(\sum_{i=1}^{S} p_i - 1\right)$$

各 $p_i$ で偏微分してゼロとおきます。

$$\frac{\partial L}{\partial p_i} = -\ln p_i - 1 - \lambda = 0$$

$$\ln p_i = -(1 + \lambda) \quad \Longrightarrow \quad p_i = e^{-(1+\lambda)}$$

すべての $i$ について同じ値なので $p_1 = p_2 = \cdots = p_S$。制約条件 $\sum p_i = 1$ より $S \cdot p_i = 1$、すなわち $p_i = 1/S$。

このとき $H' = -S \cdot \dfrac{1}{S} \ln \dfrac{1}{S} = \ln S$。

解説

ラグランジュの未定乗数法は、制約条件つきの最適化問題を解く一般的な手法です。ここでは $\partial L / \partial p_i$ がすべて同じ式になるため、すべての $p_i$ が等しいという結果が自然に導かれます。これは「最も情報量が多い分布＝最も均等な分布」というエントロピー最大の原理に対応しています。

問4 B 応用

ある地域に3つの森林区画があり、樹木種の調査結果は以下のとおりです。

	種A	種B	種C	種D	種E	種F
区画1	30	20	0	0	0	0
区画2	0	10	25	15	0	0
区画3	0	0	0	5	20	25

(a) 各区画の種数（$\alpha$ 多様性）の平均 $\bar{\alpha}$ を求めてください。

(b) 地域全体の種数（$\gamma$ 多様性）を求めてください。

(d) この地域の $\beta$ 多様性が比較的高い理由を、種組成の観点から説明してください。

クリックして解答を表示

解答

(a) 区画1：2種、区画2：3種、区画3：3種。$\bar{\alpha} = (2 + 3 + 3)/3 \approx 2.67$ 種。

(b) 種A〜Fの6種すべてが地域のどこかに出現しているので、$\gamma = 6$ 種。

(c) $\beta = \gamma / \bar{\alpha} = 6 / 2.67 \approx 2.25$。

(d) 3つの区画で種組成がほとんど重複していません（共有種は区画1-2間の種Bと区画2-3間の種Dのみ）。各区画が異なる種の組み合わせを持っているため、場所間のターンオーバーが大きく、$\beta$ 多様性が高くなっています。もし3区画が同じ種組成なら $\beta = 1$ ですが、実際には $\beta \approx 2.25$ であり、場所間の入れ替わりが顕著です。

問5 C 発展

ヒルの数（Hill numbers）は次のように定義されます。

$${}^{q}\!D = \left(\sum_{i=1}^{S} p_i^q\right)^{1/(1-q)}$$

(a) $q = 0$ のとき ${}^{0}\!D$ が種数 $S$ に等しいことを示してください。（ヒント：$p_i^0 = 1$ です。）

(b) $q = 2$ のとき ${}^{2}\!D$ が逆シンプソン指数 $1/\sum p_i^2$ に等しいことを示してください。

(c) $q \to 1$ のとき ${}^{q}\!D \to \exp(H')$ となることを示してください。（ヒント：$\sum p_i^q = \sum p_i \cdot p_i^{q-1}$ と書き、$q \to 1$ で $p_i^{q-1} \to 1 + (q-1)\ln p_i$ とテイラー展開します。）

(d) パラメータ $q$ を大きくすると、ヒルの数は優占種と希少種のどちらに重みを置くようになりますか。その理由を数学的に説明してください。

クリックして解答を表示

解答

(a) $q = 0$ のとき、$p_i^0 = 1$（$p_i > 0$ の種のみ考慮）なので $\sum p_i^0 = S$（存在する種の数）。${}^{0}\!D = S^{1/(1-0)} = S^1 = S$。

(b) $q = 2$ のとき、${}^{2}\!D = \left(\sum p_i^2\right)^{1/(1-2)} = \left(\sum p_i^2\right)^{-1} = \dfrac{1}{\sum p_i^2}$。

(c) $\sum p_i^q = \sum p_i \cdot p_i^{q-1}$ とし、$p_i^{q-1} = e^{(q-1)\ln p_i} \approx 1 + (q-1)\ln p_i$（$q \to 1$ のとき）を使うと、

$$\sum p_i^q \approx \sum p_i(1 + (q-1)\ln p_i) = 1 + (q-1)\sum p_i \ln p_i = 1 - (q-1)H'$$

$${}^{q}\!D = (1 - (q-1)H')^{1/(1-q)}$$

$\varepsilon = q - 1 \to 0$ とおくと、$(1 - \varepsilon H')^{-1/\varepsilon} \to e^{H'}$（$\lim_{\varepsilon \to 0}(1 - \varepsilon x)^{-1/\varepsilon} = e^x$ を利用）。

したがって $\lim_{q \to 1} {}^{q}\!D = e^{H'}$。

(d) $q$ が大きいほど優占種に重みが置かれます。$p_i^q$ において、$p_i$ が大きい種は $q$ 乗しても大きな値を保ちますが、$p_i$ が小さい種は $q$ 乗すると急速にゼロに近づきます。したがって、$q$ が大きいほど $\sum p_i^q$ は優占種の $p_i$ に支配され、希少種の情報は失われます。

解説

ヒルの数の枠組みは、種数（$q = 0$）、シャノン指数（$q = 1$）、シンプソン指数（$q = 2$）がそれぞれ独立な指標ではなく、パラメータ $q$ で連続的につながった「多様性の族」であることを示しています。$q$ は希少種にどれだけ重みを置くかを制御するパラメータであり、$q = 0$（希少種も同等に数える）から $q \to \infty$（最優占種のみ反映）まで連続的に変化します。