「この森は生物多様性が高い」── 高校生物でもよく出てくる表現ですが、「高い」とは具体的にどういう意味でしょうか。
種数が多ければ多様性が高いのか、それだけで十分なのか。
たとえば、100種が記録された森林でも、1種が個体数の99%を占めていたら、その森は本当に「多様」といえるでしょうか。
大学の生態学では、多様性を情報量として定量化します。
シャノン・ウィーナー指数 $H' = -\sum p_i \ln p_i$ は、群集から無作為に取り出した1個体が「どの種であるかの不確実性」を測る指標です。
種数が多いほど、そして各種の個体数が均等であるほど、不確実性は大きくなる ── つまり多様性が高いのです。
本記事では、「種数だけでは多様性を測れない」という問題提起から出発し、シャノン指数とシンプソン指数の導出と意味を理解し、さらに空間スケールに応じた多様性の階層構造($\alpha$・$\beta$・$\gamma$ 多様性)を学びます。
前記事 B-15-1 で学んだ種数面積関係 $S = cA^z$ とのつながりも見ていきましょう。
高校生物では、生物多様性を3つのレベルで整理しました。
また、種間関係(競争・捕食・共生・すみわけ)やかく乱(台風、山火事など)が多様性に影響を与えることも学びました。 特に「適度なかく乱が多様性を高める」という中間かく乱仮説は、高校の教科書や問題集でもよく取り上げられるテーマです。
しかし、高校では「多様性が高い/低い」という判断を直感的に行っていました。 種数が多ければ多様性が高い、とざっくり捉えていたはずです。 では、次のような2つの群集を比べてみましょう。
| 群集 | 種数 | 各種の個体数(100個体中) |
|---|---|---|
| 群集A | 4種 | 25, 25, 25, 25 |
| 群集B | 4種 | 97, 1, 1, 1 |
どちらも種数は4で同じです。しかし直感的に、群集Aのほうが「多様」に感じませんか。 群集Bでは事実上1種が独占しており、残り3種に出会うことはほとんどありません。 種数だけでは、この違いを表現できないのです。 次のセクションでは、大学の生態学がこの問題にどう答えるかを見ていきます。
群集から無作為に1個体を取り出したとき、それがどの種であるかの予測しにくさが多様性の正体です。
1種しかいなければ結果は確実(多様性ゼロ)。種数が多く、かつ各種の個体数が均等であるほど、結果は不確実(多様性が高い)。
この「不確実性」を情報理論の枠組みで定量化したのがシャノン・ウィーナー指数であり、確率論の枠組みで定量化したのがシンプソンの多様度指数です。
この考え方は、1948年にクロード・シャノン(Claude Shannon)が通信理論の文脈で定式化した情報エントロピーに由来します。 シャノンは「メッセージに含まれる情報量とは、そのメッセージを受け取る前の不確実性のことだ」と洞察しました。 生態学者たちは1960年代にこの概念を生物群集の解析に応用しました。 では、シャノン指数がどのように導かれるかを、次のセクションで一歩ずつ見ていきましょう。
多様性を定量化するための出発点は、「ある事象が起こったとき、どれだけ驚くか」を数値化することです。 まず、1種類の事象(=ある種を引く)に対する「驚き」を定義し、その後で群集全体の平均的な驚きを計算します。
ある種 $i$ の相対頻度(その群集における個体数の割合)を $p_i$ とします。 $p_i$ が小さい種(珍しい種)を引いたら驚きが大きく、$p_i$ が大きい種(ありふれた種)を引いたら驚きが小さい ── これは直感に合います。 数学的には、この「驚き」(情報量)を次のように定義します。
$$I(p_i) = -\ln p_i$$
$p_i$:種 $i$ の相対頻度($0 < p_i \leq 1$)。$p_i = 1$(確実)のとき $I = 0$(驚きなし)。 $p_i$ が小さいほど $I$ は大きい。対数を使うのは、独立な事象の驚きが加法的になるようにするためです。
なぜ対数なのでしょうか。たとえば、コインを2回投げて両方表が出る確率は $p = 1/4$ です。 「1回目が表」の驚きと「2回目が表」の驚きを足したものが「2回とも表」の驚きに等しくなってほしい。 確率は掛け算($1/2 \times 1/2 = 1/4$)ですが、対数をとれば $\ln(1/4) = \ln(1/2) + \ln(1/2)$ と足し算になります。 このように、対数を使うことで「独立事象の情報量が加法的になる」という自然な性質が得られるのです。
群集に $S$ 種が含まれ、種 $i$ の相対頻度が $p_i$ であるとします($\sum_{i=1}^{S} p_i = 1$)。 この群集から無作為に1個体を取り出したとき、「平均してどれくらい驚くか」を計算します。 種 $i$ を引く確率は $p_i$、そのときの驚きは $-\ln p_i$ なので、驚きの期待値は次のようになります。
$$H' = -\sum_{i=1}^{S} p_i \ln p_i$$
$S$:種数、$p_i$:種 $i$ の相対頻度。$H'$ は群集から無作為に1個体を取り出したときの、種の同定に関する「平均的な不確実性」を表します。 単位は「ナット」(nat、自然対数の場合)。底を2にすれば「ビット」(bit)になります。
最小値:1種が個体数の100%を占める場合($p_1 = 1$, 他は $p_i = 0$)。このとき $H' = -1 \cdot \ln 1 = 0$。次に何が出るか完全に予測できるので、不確実性はゼロです。(なお、$\lim_{p \to 0} p \ln p = 0$ なので、$p_i = 0$ の種は和に寄与しません。)
最大値:$S$ 種がすべて均等な頻度 $p_i = 1/S$ のとき。ラグランジュの未定乗数法で示せますが、直感的には「最も予測しにくい=最も均等に散らばっている」状態です。このとき、
$$H'_{\max} = -\sum_{i=1}^{S} \frac{1}{S} \ln \frac{1}{S} = -S \cdot \frac{1}{S} \cdot \ln \frac{1}{S} = \ln S$$
つまり、$H'$ の最大値は種数 $S$ の対数です。種数が多いほど、上限が高くなります。
セクション1で挙げた2つの群集で $H'$ を計算してみましょう。
群集A(4種、各25個体):$p_i = 0.25$ が4種。
$$H'_A = -4 \times 0.25 \ln 0.25 = -\ln 0.25 = \ln 4 \approx 1.386$$
群集B(4種、97:1:1:1):$p_1 = 0.97$, $p_2 = p_3 = p_4 = 0.01$。
$$H'_B = -(0.97 \ln 0.97 + 3 \times 0.01 \ln 0.01) \approx -(0.97 \times (-0.0305) + 3 \times 0.01 \times (-4.605))$$
$$\approx -(- 0.0296 - 0.1382) = 0.168$$
群集Aの $H' \approx 1.39$、群集Bの $H' \approx 0.17$ ── 種数は同じ4でも、シャノン指数は大きく異なります。 均等に分布している群集Aは $H'_{\max} = \ln 4 \approx 1.39$ に達しており、群集Bは最大値の12%程度にすぎません。 これが「種数だけでは多様性を測れない」ことの定量的な証拠です。
注意:種数の異なる2群集で $H'$ の値を単純に比較してはいけません。$H'_{\max} = \ln S$ は種数に依存するため、種数100の群集と種数10の群集では上限が異なります。
対処:異なる種数の群集を比較するときは、後述する均等度($H' / H'_{\max}$)を使うか、希薄化曲線で同じサンプルサイズに揃えてから比較します。
シャノン指数は情報理論に基づく多様度の測り方でした。 しかし、多様性を測る方法はこれだけではありません。 次のセクションでは、確率論に基づくシンプソンの指数と、種数・均等度を分離する方法を見ていきます。
シンプソン(E. H. Simpson, 1949)は、多様性を直感的に理解しやすい別の方法で定量化しました。 その発想は極めてシンプルです。 「群集から無作為に2個体を取り出したとき、その2個体が同じ種である確率」を考えます。 この確率が低いほど、多様性が高いということになります。
種 $i$ から2個体を取り出す確率は $p_i^2$(復元抽出の場合)なので、いずれかの種で2個体が一致する確率は $\sum p_i^2$ です。 この値は多様性が高いほど小さくなるので、それを引いた値を指数として使います。
$$D = 1 - \sum_{i=1}^{S} p_i^2$$
$\sum p_i^2$ は「同種に出会う確率」。$D$ はその補数であり、「異種に出会う確率」に対応します。 $D = 0$(1種のみ)が最低、$D = 1 - 1/S$(完全均等)が最高です。 なお、$1/\sum p_i^2$ を逆シンプソン指数と呼び、「等価な種数」として解釈できます。
再び群集AとBで計算しましょう。
群集A:$\sum p_i^2 = 4 \times 0.25^2 = 4 \times 0.0625 = 0.25$。よって $D_A = 1 - 0.25 = 0.75$。
群集B:$\sum p_i^2 = 0.97^2 + 3 \times 0.01^2 = 0.9409 + 0.0003 = 0.9412$。よって $D_B = 1 - 0.9412 = 0.059$。
群集Aでは無作為に選んだ2個体が異種である確率が75%ですが、群集Bではわずか5.9%です。 日常的な感覚に非常に近い結果が得られます。
2つの指数はどちらも多様性を測りますが、重みづけが異なります。
| 特性 | シャノン指数 $H'$ | シンプソン指数 $D$ |
|---|---|---|
| 理論的基盤 | 情報理論(不確実性の平均) | 確率論(同種遭遇確率の補数) |
| 希少種への感度 | 比較的高い($\ln p_i$ が小さい $p_i$ で急増) | 低い($p_i^2$ は小さい $p_i$ でほぼゼロ) |
| 優占種への感度 | 中程度 | 高い($p_i^2$ は大きい $p_i$ で支配的) |
| 値の範囲 | $0 \leq H' \leq \ln S$ | $0 \leq D \leq 1 - 1/S$ |
| 解釈のしやすさ | 情報量の単位(やや抽象的) | 確率として直感的に理解可能 |
シャノン指数は希少種の存在に敏感であり、シンプソン指数は優占種の影響を強く反映します。 生態学の調査では、目的に応じて両方を計算し、多様性の異なる側面を捉えるのが一般的です。
多様性は「種数」と「均等さ」の2つの要因から成り立っています。 これらを分離して評価するために、均等度(evenness)が定義されます。
$$J = \frac{H'}{H'_{\max}} = \frac{H'}{\ln S}$$
$0 \leq J \leq 1$。$J = 1$ は完全均等(全種が同じ個体数)、$J$ が小さいほど特定の種が優占していることを示します。
群集AではJ $J_A = 1.386 / \ln 4 = 1.386 / 1.386 = 1.00$(完全均等)。 群集Bでは $J_B = 0.168 / 1.386 = 0.12$(著しく不均等)。 均等度を使えば、種数が異なる群集の「均一さ」の側面だけを比較できます。
実は、シャノン指数やシンプソン指数は、ヒル(Mark O. Hill, 1973)が提唱した一般化された多様度の特殊ケースです。次数 $q$ のヒルの数は ${}^{q}\!D = \left(\sum p_i^q\right)^{1/(1-q)}$ と定義され、$q = 0$ で種数、$q \to 1$ で $\exp(H')$(シャノン指数の指数変換)、$q = 2$ で逆シンプソン指数に対応します。$q$ が大きいほど優占種に重みが置かれ、小さいほど希少種の影響が大きくなります。近年のメタ解析ではヒルの数を使った比較が標準になりつつあります。
ここまでで、ひとつの場所(ひとつの群集)の多様性を測る方法を学びました。 しかし、生態学で「多様性」を議論するとき、空間スケールの違いが重要になります。 次のセクションでは、多様性を空間的な階層に分けて考える枠組みを見ていきます。
ロバート・ホイッタカー(Robert Whittaker, 1960, 1972)は、生物多様性を空間スケールに応じて3つの層に分けて考えることを提案しました。 これは生態学における最も基本的な概念の枠組みの一つです。
たとえば、ある山地の森林を考えましょう。 標高500mの地点と標高1500mの地点では、それぞれ異なる種が見られます。 各地点の $\alpha$ 多様性が同程度でも、2地点の種組成が大きく異なれば $\beta$ 多様性が高く、結果として山地全体の $\gamma$ 多様性は高くなります。
ホイッタカーは、3つの多様性の間に次のような関係を定義しました。
$$\gamma = \alpha \times \beta$$
ここで $\alpha$, $\beta$, $\gamma$ は種数として考えます。平均的な局所の種数を $\bar{\alpha}$、地域全体の種数を $\gamma$ とすると、$\beta = \gamma / \bar{\alpha}$ です。 $\beta$ が大きいほど、場所間の種組成の入れ替わり(ターンオーバー)が大きいことを意味します。
一方、ランデ(R. Lande, 1996)は加法的な分割も提案しています。
$$\gamma = \bar{\alpha} + \beta$$
シャノン指数やシンプソン指数を用いる場合、加法的分割が自然です。$\bar{\alpha}$ は各局所の多様度指数の平均、$\beta = \gamma - \bar{\alpha}$ は場所間の違いによる多様性の「上乗せ分」です。
ある地域に2つの池があり、それぞれの魚類群集が以下のとおりだとします。
| 種A | 種B | 種C | 種D | 種E | 種数 | |
|---|---|---|---|---|---|---|
| 池1 | 50 | 30 | 20 | 0 | 0 | 3 |
| 池2 | 0 | 0 | 10 | 40 | 50 | 3 |
各池の $\alpha$ 多様性(種数)は3です。しかし、地域全体(2つの池を合わせた $\gamma$)の種数は5です。 乗法的分割では $\beta = 5 / 3 \approx 1.67$ となり、場所間で種の入れ替わりがあることがわかります。 もし2つの池の種組成が完全に同じなら $\beta = 1$(入れ替わりなし)、完全に異なれば $\beta = 2$(各池に固有の種のみ)です。
自然保護の実務において、$\beta$ 多様性の概念は極めて重要です。地域の多様性($\gamma$)を最大化するには、$\alpha$ 多様性を高めるだけでは不十分で、異なるタイプの生息地を保全する($\beta$ 多様性を維持する)必要があります。
たとえば、10 ha の森林を保全するとき、同質な森林を10 ha 保全するより、湿地・乾燥林・渓流沿いなど多様な環境をモザイク状に保全するほうが、$\beta$ 多様性を通じて $\gamma$ 多様性は高くなります。
$\alpha$・$\beta$・$\gamma$ の枠組みは、前記事 B-15-1 で学んだ種数面積関係 $S = cA^z$ ともつながります。 面積 $A$ を大きくすると種数 $S$ が増えるのは、面積が大きい地域ほど多様な環境(ハビタット)を含み、$\beta$ 多様性が蓄積されるためです。 次のセクションでは、この空間スケールの多様性をさらに実用的に扱う方法と、多様性を生み出すメカニズムについて見ていきます。
フィールド調査では、調査努力量(採集した個体数やサンプル数)が群集間で異なることがほとんどです。 100個体しか採集していない群集と1000個体を採集した群集では、後者のほうが多くの種が記録されるのは当然です。 調査努力量が異なる群集間で種の多様性を公平に比較するにはどうすればよいでしょうか。
希薄化(rarefaction)は、この問題に対する統計的な解決法です。 多くの個体を採集した群集から、少ない方のサンプルサイズに合わせて無作為にサブサンプルを抽出し、その期待種数を計算します。
$$E(S_n) = S - \sum_{i=1}^{S} \frac{\binom{N - N_i}{n}}{\binom{N}{n}}$$
$S$:観測された総種数、$N$:総個体数、$N_i$:種 $i$ の個体数、$n$:希薄化後のサンプルサイズ、$\binom{a}{b}$:二項係数。 この式は、$n$ 個体を無作為に抽出したときに種 $i$ が少なくとも1個体含まれる確率を、全種について合計したものです。
希薄化曲線は、横軸にサンプルサイズ $n$、縦軸に期待種数 $E(S_n)$ をプロットしたものです。 この曲線は常に上に凸な単調増加関数です。 サンプルサイズが小さいうちは種数が急速に増え、新しい個体を採るたびに新種に出会う確率が高いですが、やがて曲線は飽和に近づきます。
複数の群集を比較する際には、同じサンプルサイズ $n$ における $E(S_n)$ を比較します。 これにより、調査努力量の違いを統計的に補正した公平な比較が可能になります。
高校生物でも紹介される中間かく乱仮説(intermediate disturbance hypothesis, IDH)は、コネル(Joseph Connell, 1978)が提唱しました。 「かく乱の頻度・強度が中程度のとき、種多様性が最大になる」という仮説です。 高校ではこれを「適度なかく乱があると多様性が高まる」と定性的に学びましたが、その背景にある論理を大学レベルで掘り下げてみましょう。
この仮説の理論的根拠は、競争排除と初期化のバランスにあります。
かく乱が少ない状態を考えます。優占種(種A)の $p_A$ が時間とともに増大し、他の種の $p_i$ が減少します。$H' = -\sum p_i \ln p_i$ において、ある1つの $p_i$ が1に近づくと $H' \to 0$ です。つまり、競争排除が進むと均等度が低下し、シャノン指数は減少します。
かく乱が起こると、優占種の個体数が減少して $p_A$ が下がり、他の種の $p_i$ が相対的に上昇します。これは均等度の回復を意味し、$H'$ が増大します。
かく乱が多すぎると、種数 $S$ そのものが減少するため、$H'_{\max} = \ln S$ の上限が下がります。
したがって、$H'$ は種数 $S$ と均等度 $J$ の積($H' = J \cdot \ln S$)の観点から、中間のかく乱頻度で最大になるのです。
中間かく乱仮説は直感的に魅力的ですが、2010年代以降、実証的・理論的な再検討が進んでいます。フォックス(Jeremy Fox, 2013)は、メタ解析でかく乱強度と多様性の関係が単峰型(山型)になるとは限らないことを示しました。また、かく乱の「頻度」「強度」「種類」を区別せずに「中程度」と言うことの曖昧さも指摘されています。現代の生態学では、IDH を出発点としつつも、より精密なモデル(トレードオフ理論、中立理論など)で補完する方向に進んでいます。
前記事 B-15-1 で学んだ種数面積関係 $S = cA^z$ は、マクロな視点での多様性パターンを記述するものでした。 本記事で学んだ多様度指数は、特定の群集の内部構造を記述するものです。 この2つは、$\beta$ 多様性を通じてつながっています。
面積が大きいほど多様なハビタットが含まれ、ハビタット間の種組成の違い($\beta$ 多様性)が蓄積されます。 種数面積関係のべき指数 $z$ は、この $\beta$ 多様性の蓄積の速さを反映しているとも解釈できます。 大陸の内部では $z \approx 0.1 \sim 0.2$(面積が増えてもハビタットが類似)、島嶼間では $z \approx 0.2 \sim 0.4$(孤立した島ほど独自の種がいる)という経験的パターンは、$\beta$ 多様性の空間構造の違いとして理解できるのです。
以上で、生物多様性の定量的な測定法と、その空間的・動態的な背景を一通り見てきました。 次のセクションでは、これまでの内容が他の記事とどうつながるかを確認します。
Q1. 種数が同じ2つの群集でシャノン指数 $H'$ が異なることがあるのはなぜですか。均等度の概念を用いて説明してください。
Q2. シャノン指数とシンプソン指数は、それぞれ希少種と優占種のどちらに対してより敏感ですか。その理由も述べてください。
Q3. $\alpha$ 多様性、$\beta$ 多様性、$\gamma$ 多様性の違いを、具体例を挙げて説明してください。
Q4. 調査努力量が異なる2つの群集の多様性を比較するとき、希薄化曲線はどのような役割を果たしますか。
ある草原で植物の個体数調査を行ったところ、以下の結果が得られました。
| 種 | 個体数 |
|---|---|
| 種A | 40 |
| 種B | 30 |
| 種C | 20 |
| 種D | 10 |
(a) 各種の相対頻度 $p_i$ を求めてください。
(b) シャノン・ウィーナー指数 $H'$ を計算してください。
(c) シンプソンの多様度指数 $D$ を計算してください。
(d) ピエルーの均等度 $J$ を求めてください。
(a) 総個体数 $= 100$。$p_A = 0.40$, $p_B = 0.30$, $p_C = 0.20$, $p_D = 0.10$。
(b) $H' = -(0.40 \ln 0.40 + 0.30 \ln 0.30 + 0.20 \ln 0.20 + 0.10 \ln 0.10)$
$= -(0.40 \times (-0.916) + 0.30 \times (-1.204) + 0.20 \times (-1.609) + 0.10 \times (-2.303))$
$= -(- 0.366 - 0.361 - 0.322 - 0.230) = 1.279$
(c) $\sum p_i^2 = 0.16 + 0.09 + 0.04 + 0.01 = 0.30$。$D = 1 - 0.30 = 0.70$。
(d) $J = H' / \ln S = 1.279 / \ln 4 = 1.279 / 1.386 = 0.923$。均等度は高いが完全ではありません。
次の記述が正しいか誤りかを判定し、誤りの場合は正しく訂正してください。
(a) シャノン指数は、1種だけからなる群集で最大値をとる。
(b) シンプソンの多様度指数 $D$ は、無作為に選んだ2個体が異なる種である確率に対応する。
(c) $\beta$ 多様性は、ある一つの場所における種の多様性を意味する。
(a) 誤り。1種のみの群集では $H' = -1 \cdot \ln 1 = 0$ で最小値です。$H'$ は全種が均等な頻度のときに最大値 $\ln S$ をとります。
(b) 正しい。$\sum p_i^2$ は同種に出会う確率であり、$D = 1 - \sum p_i^2$ はその補数、すなわち異種に出会う確率です。
(c) 誤り。ある一つの場所の多様性は $\alpha$ 多様性です。$\beta$ 多様性は場所間の種組成の違い(ターンオーバー)を測る指標です。
シャノン指数 $H' = -\sum_{i=1}^{S} p_i \ln p_i$(ただし $\sum p_i = 1$)が、すべての種が均等な頻度 $p_i = 1/S$ のときに最大値 $\ln S$ をとることを、ラグランジュの未定乗数法を用いて示してください。
ヒント:$L = -\sum p_i \ln p_i - \lambda(\sum p_i - 1)$ として、$\partial L / \partial p_i = 0$ を各 $i$ について解きます。
制約条件 $\sum_{i=1}^{S} p_i = 1$ のもとで $H' = -\sum p_i \ln p_i$ を最大化します。
ラグランジュ関数を構成します。
$$L = -\sum_{i=1}^{S} p_i \ln p_i - \lambda\left(\sum_{i=1}^{S} p_i - 1\right)$$
各 $p_i$ で偏微分してゼロとおきます。
$$\frac{\partial L}{\partial p_i} = -\ln p_i - 1 - \lambda = 0$$
$$\ln p_i = -(1 + \lambda) \quad \Longrightarrow \quad p_i = e^{-(1+\lambda)}$$
すべての $i$ について同じ値なので $p_1 = p_2 = \cdots = p_S$。制約条件 $\sum p_i = 1$ より $S \cdot p_i = 1$、すなわち $p_i = 1/S$。
このとき $H' = -S \cdot \dfrac{1}{S} \ln \dfrac{1}{S} = \ln S$。
ラグランジュの未定乗数法は、制約条件つきの最適化問題を解く一般的な手法です。ここでは $\partial L / \partial p_i$ がすべて同じ式になるため、すべての $p_i$ が等しいという結果が自然に導かれます。これは「最も情報量が多い分布=最も均等な分布」というエントロピー最大の原理に対応しています。
ある地域に3つの森林区画があり、樹木種の調査結果は以下のとおりです。
| 種A | 種B | 種C | 種D | 種E | 種F | |
|---|---|---|---|---|---|---|
| 区画1 | 30 | 20 | 0 | 0 | 0 | 0 |
| 区画2 | 0 | 10 | 25 | 15 | 0 | 0 |
| 区画3 | 0 | 0 | 0 | 5 | 20 | 25 |
(a) 各区画の種数($\alpha$ 多様性)の平均 $\bar{\alpha}$ を求めてください。
(b) 地域全体の種数($\gamma$ 多様性)を求めてください。
(c) ホイッタカーの乗法的分割に基づいて $\beta$ 多様性を計算してください。
(d) この地域の $\beta$ 多様性が比較的高い理由を、種組成の観点から説明してください。
(a) 区画1:2種、区画2:3種、区画3:3種。$\bar{\alpha} = (2 + 3 + 3)/3 \approx 2.67$ 種。
(b) 種A〜Fの6種すべてが地域のどこかに出現しているので、$\gamma = 6$ 種。
(c) $\beta = \gamma / \bar{\alpha} = 6 / 2.67 \approx 2.25$。
(d) 3つの区画で種組成がほとんど重複していません(共有種は区画1-2間の種Bと区画2-3間の種Dのみ)。各区画が異なる種の組み合わせを持っているため、場所間のターンオーバーが大きく、$\beta$ 多様性が高くなっています。もし3区画が同じ種組成なら $\beta = 1$ ですが、実際には $\beta \approx 2.25$ であり、場所間の入れ替わりが顕著です。
ヒルの数(Hill numbers)は次のように定義されます。
$${}^{q}\!D = \left(\sum_{i=1}^{S} p_i^q\right)^{1/(1-q)}$$
(a) $q = 0$ のとき ${}^{0}\!D$ が種数 $S$ に等しいことを示してください。(ヒント:$p_i^0 = 1$ です。)
(b) $q = 2$ のとき ${}^{2}\!D$ が逆シンプソン指数 $1/\sum p_i^2$ に等しいことを示してください。
(c) $q \to 1$ のとき ${}^{q}\!D \to \exp(H')$ となることを示してください。(ヒント:$\sum p_i^q = \sum p_i \cdot p_i^{q-1}$ と書き、$q \to 1$ で $p_i^{q-1} \to 1 + (q-1)\ln p_i$ とテイラー展開します。)
(d) パラメータ $q$ を大きくすると、ヒルの数は優占種と希少種のどちらに重みを置くようになりますか。その理由を数学的に説明してください。
(a) $q = 0$ のとき、$p_i^0 = 1$($p_i > 0$ の種のみ考慮)なので $\sum p_i^0 = S$(存在する種の数)。${}^{0}\!D = S^{1/(1-0)} = S^1 = S$。
(b) $q = 2$ のとき、${}^{2}\!D = \left(\sum p_i^2\right)^{1/(1-2)} = \left(\sum p_i^2\right)^{-1} = \dfrac{1}{\sum p_i^2}$。
(c) $\sum p_i^q = \sum p_i \cdot p_i^{q-1}$ とし、$p_i^{q-1} = e^{(q-1)\ln p_i} \approx 1 + (q-1)\ln p_i$($q \to 1$ のとき)を使うと、
$$\sum p_i^q \approx \sum p_i(1 + (q-1)\ln p_i) = 1 + (q-1)\sum p_i \ln p_i = 1 - (q-1)H'$$
$${}^{q}\!D = (1 - (q-1)H')^{1/(1-q)}$$
$\varepsilon = q - 1 \to 0$ とおくと、$(1 - \varepsilon H')^{-1/\varepsilon} \to e^{H'}$($\lim_{\varepsilon \to 0}(1 - \varepsilon x)^{-1/\varepsilon} = e^x$ を利用)。
したがって $\lim_{q \to 1} {}^{q}\!D = e^{H'}$。
(d) $q$ が大きいほど優占種に重みが置かれます。$p_i^q$ において、$p_i$ が大きい種は $q$ 乗しても大きな値を保ちますが、$p_i$ が小さい種は $q$ 乗すると急速にゼロに近づきます。したがって、$q$ が大きいほど $\sum p_i^q$ は優占種の $p_i$ に支配され、希少種の情報は失われます。
ヒルの数の枠組みは、種数($q = 0$)、シャノン指数($q = 1$)、シンプソン指数($q = 2$)がそれぞれ独立な指標ではなく、パラメータ $q$ で連続的につながった「多様性の族」であることを示しています。$q$ は希少種にどれだけ重みを置くかを制御するパラメータであり、$q = 0$(希少種も同等に数える)から $q \to \infty$(最優占種のみ反映)まで連続的に変化します。