« LED電球の電磁波ノイズ (3) 他製品と比較 | トップページ | シマリスと暮らす(3)惜別 »

2011年2月26日 (土)

Excelで検証しよう! - 血液型と相性

性格や人間関係と血液型の相関について、神聖な教義であるがごとく信じている人から敵対する異教徒を見るように否定する人まで、様々だ。しかし、同じステレオタイプを共有しているのは間違いないだろう。「A型はチャランポランで、B型はマジメ」と言われている、と思っている人はまず居ない、という意味である。

よく知られていることだが、この発端は能見 正比古の一連の著書だ。バイブル、たぶん新約聖書である。と言うのは、旧約聖書と言うべき先行する書籍があったらしいからである。コーランはまだ書かれていないようだ。

関連書籍も多数出ている。かなりホンキなものから、ほとんどオアソビと言えるものまで様々だ。その中でもオアソビの極致というべきなのが以下の一連の本だろう。実は私の好みだったりするわけだが。

これらは以前単行本(\1,050)で出されていたものが、最近文庫化されたものだ。単行本では最初にB型が2007年9月1日に出た後、翌年4月3日にA型、6月13日にAB型、そしてB型の11ヶ月後になる8月1日にO型の分が出ている。この順番そのものも、色々と想像できておもしろい。なお中間にポストカード版(\735)も出ており、いまでも全て買えるようだ。

B型自分の説明書

A型自分の説明書

AB型自分の説明書

O型自分の説明書

B型自分の説明書ポストカードブック

A型自分の説明書ポストカードブック

AB型自分の説明書ポストカードブック

O型自分の説明書ポストカードブック

好き嫌いがはっきりしそうなネタ本なので、敢えて高いほうをおススメするわけではないが、お好きなら・・・と見え透いた営業はこのくらいにして、本題である。

世間ではA型とB型は相性が悪い、と言われている。立場・性別を問わなければ10位、異性間のことなら15位と16位、つまり最悪である。これが本当かどうか、遺伝の法則を利用して検証できそうなことに気付いてしまったのだ。

/*-----------  -----------*/

今回のお題

ABO式血液型は、かなり稀な例外を除き、メンデルの法則に従って遺伝する。これによれば、AB型のヒトはA型とB型のカップルからしか生まれない。
もし相性が悪ければ、A型とB型がカップルになりAB型の子孫を残す割合が、血液型による相性の影響が全く無い場合に比べて、明らかに減るだろう。
今回のお題は、この仮説を検証することである。


メンデルの法則のおさらい

遺伝するABO式血液型のような特徴を遺伝形質と言うが、これは両親から1つずつ引き継いだ2つ一組の遺伝子で決まる。
両親それぞれについて、どちらの遺伝子が子に伝わるかランダムであると考えられている。
両親のどちらから引き継いだかによる差は無いので、遺伝子型AOとOAなどは区別しない。
遺伝子はA、BおよびO型の3種類あるが、AとB型の遺伝子が優性で、AAとAOはどちらも血液型はA型、BBとBOはB型になる。

1_4

血液型A型の大半を占めるAOと、同じくB型の大半を占めるBOのカップルからは、全てのABO式血液型の子が生まれる可能性がある。
ただし4人子供がいれば全てそろう、と言うことではない。4人とも同じ血液型になることも、確率1/64であり得る。

遺伝子型と血液型の関係を下の図にまとめておく。

2


集団遺伝学とHardy–Weinbergの原理

進化論や民族間の遺伝形質の違いに関しては、ある程度まとまった個体数の集団に関する遺伝を考える必要がある。このような分野を取り扱うのが集団遺伝学である。

集団遺伝学の基礎となるのがHardy–Weinbergの原理(以下HWP)だと言われている。日本語版Wikikpediaの内容は肝心な部分が欠落しているように思えるので、2011年2月25日時点の英語版Wikipediaの該当ページの冒頭1段落を引用、そして翻訳する。

Hardy–Weinberg principle
The Hardy–Weinberg principle (also known by a variety of names: HWP, Hardy–Weinberg equilibrium, Hardy–Weinberg Theorem, HWE, or Hardy–Weinberg law) states that both allele and genotype frequencies in a population remain constant—that is, they are in equilibrium—from generation to generation unless specific disturbing influences are introduced. Those disturbing influences include non-random mating, mutations, selection, limited population size, "overlapping generations", random genetic drift, gene flow and meiotic drive. It is important to understand that outside the lab, one or more of these "disturbing influences" are always in effect. That is, Hardy–Weinberg equilibrium is impossible in nature. Genetic equilibrium is an ideal state that provides a baseline against which to measure change.

Hardy–Weinbergの原理
Hardy–Weinbergの原理(HWP、Hardy–Weinberg平衡、Hardy–Weinbergの定理、HWE、およびHardy–Weinbergの法則とも言われる)は、十分大きい個体群では何らかの妨害要因がない限り、世代交代を重ねても遺伝子および遺伝子型頻度はどちらも一定、すなわち平衡状態になると言っている。『妨害要因』には、非ランダム交配、突然変異、選択、限られた個体群の大きさ、一斉に世代交代が起こらないこと、偶然に左右された変動(遺伝的浮動)、他個体群からの遺伝子の流入、および遺伝子が減数分裂の際にとる異常な行動(meiotic drive)が含まれる。研究室の外では、常に一つ以上の妨害要因が作用していることを理解するのが重要である。つまり、自然界ではHardy–Weinberg平衡は実現不可能なのだ。遺伝的平衡は、ズレの程度を測るのに必要な基準点を得るための、一種の理想的な状態である。

私なりに平易な日本語になるよう心がけたので、意訳のやり過ぎや、正確さを欠く訳や用語があるかもしれないが、ご容赦のほど。

上記の言葉を借りて、お題の仮説を書き直すと;

「血液型による相性が原因の非ランダム交配が発生するため、血液型の比率がHWPで予想される比率と有意に食い違う」

となる。


HWPについて、もう少し詳しく見てみよう

十分大きな孤立した個体群(遺伝子プールと言う場合もある)で完全にランダムな世代交代が行われたとすると、個体群全体に関するABO式血液型遺伝子の割合(頻度)は世代交代の前後で同じになることは自明と言っていいだろう。

3

各遺伝子頻度が一定に決まることを前提に、各遺伝子型の出現確率を計算する。

4

実際に観測されたのは血液型である。今日では遺伝子型を調べることも不可能ではないが、血液型に比べると、いまだにかなり困難を伴うのではないかと思う。
実際のサンプルに基づき、各血液型の個体数の予測値とχ(カイ)二乗値を計算する。

5

Excelシートに計算モデルを作成し、ソルバーを使ってχ二乗値が最小となる、AおよびB型遺伝子頻度を求める。

『ソルバー』は、1つのセルの値(計算結果)が指定した値に予め設定した誤差範囲で一致する、最大になる、または最小となるよう、同じシート上の複数のセルの値を調整してくれる機能である。この使い方については、『Excel ソルバー』で検索すれば多数ヒットするので、省略する。なお私が調べた範囲では、Excel以外ではOpenOffice Calcにもソルバーがあるので、同じように使えると思う(未確認)。

Pearsonの検定で使うχ二乗分布値(正確には1から累積χ二乗分布値を引いたもののようだが)は、ExcelではCHIDIST関数で得ることができる。これには自由度を指定する必要がある。ABO式血液型の場合4つの合計が全体になるので、どれか3つが決まれば残り1つも決まるため、自由度は3である。しかし、HWPに基づくモデルでχ二乗値を最小化するよう2つのパラメーターを調整しているので、その分自由度が減って1になる。

なおχ二乗値は、観測値と予測値の間に一定割合の誤差があると考えた場合、サンプル数に比例する。これはサンプル数が多いほど偶然生じる差異が小さくなることを反映している。従って、割合とか%ではなく、実際のサンプル数で計算しなければダメである。


結果発表!

今回使用した観測値は、原典が「O・プロコプ,W・ゲーラー著.石山昱夫訳:『遺伝血清学』(学会出版センター)」だとしているこちらのwebページから孫引きさせてもらった。管理人の方は筋金入りの血液型信者と拝察する。サンプル数が明記されているwebページが他に見つからなかったので、こちらを選んだ。1960年代か、それ以前の数字と思われるが、他のwebページでも同じ%の数字が並んでいたりするので、いわゆる4:3:2:1の比率の原典だろうと思われる。
で、肝心の結果は、かなり高い水準でHWPに適合している、すなわち今回のお題の仮説が棄却された。

6

血液型割合の観測値を見る限り、日本のA型とB型のカップルの相性が悪いとは言えない。
「相性が悪くても子供はできる」との物言いに一定の説得力はあるが、「子孫を残す」ことは単に子供が「できちゃった」だけではなく、更に孫以降につながらなければならないことを考えると、やはり相性が悪ければ血液型比率が歪むと考えるほうが自然だろう。


外国はどうなのか

あっさりとシンプルな答えが出てしまったので、振り上げた拳の下ろし処がみつからない。
念のため、日本以外についてサンプル数上位10位まで調べてみよう。観測値の出所は日本の分と同じである。

7

スペイン、ノールウェー、およびフランスの3カ国はHWPに文句無く適合している。
アメリカ(白人)とイギリスはグレーゾーンだ。残り5カ国はHWPと有意に食い違っている!

Pearsonのχ二乗検定で予測値と観測値の適合・不適合を判定できるが、不適合の場合どこがどんな具合に合っていないのかまでは、わからない。


どうする?

HWPに基づく数式モデルと観測値間の自由度は1だった。
このことは、モデルにもう一つ有効なパラメーターを追加すれば、全ての血液型の予測値を観測値と一致させることが可能だ、と言うことである。

有効なパラメーターは、既にあるパラメーターとは独立に血液型の比率に影響を与えることができなくてはならない。

さらに、以下の条件を満たす必要がある。

  • パラメーターを追加したモデルで、世代交代の前後で遺伝子頻度が変わらないこと
  • パラメーターの値が、現実の現象と結び付けられること

最初の条件は、平衡状態を実現するために必要である。
2番目の条件は、モデルの解が得られても解釈できなくては意味が無い、と言うことだ。


非ランダム交配で平衡状態になるか?

HWPに従う場合、遺伝子頻度が平衡状態になるのは、ほぼ自明である。
また遺伝子型と遺伝形質の頻度が平衡状態になるのは、数式で示した。
まずはこれらについて、もう少しリアリティのあるシミュレーションをしてみよう。

シミュレーションの基本的な仕組みは、下の図の通りである。

8_2

このシミュレーションは、HWPと若干異なる点がある。
HWPは1年生の草本植物や魚のアユのように、一斉に世代交代することを想定している。
しかしこのシミュレーションでは、親と同世代の個体がまだ残っているうちに子が世代交代する場合がある。
これは、ヒトの場合に近づけるための変更である。

この仕組みをExcelのワークシートで実現するのは、あまり得策ではない。何らかのプログラミング言語を使うべきである。
ExcelのVBAでも可能だが、生産性が高く使い慣れたPythonでシミュレーションを行い、結果のグラフ化だけExcelを使った。
なお「誕生から0.5世代交代時間より若い固体を避け」の処理は、どちらか片方でもそのような個体が選ばれた場合、もう一度カップルを選びなおしている。

遺伝子頻度は数式モデルで得られた結果に合わせている。
ただし平衡状態への到達を見るため、シミュレーションでは全て遺伝子型AA、BBおよびOOであるとした、著しく偏った初期条件から開始している。

9

完全にHWPの通りの条件だと、1回世代交代すると完全に平衡状態に達するはずだ。
しかしヒトに近づけたシミュレーションでは、平衡状態に達するのに4回程度の世代交代を要している。

10

さて、ここまでは準備運動だ。
始まりはこれまでと同じだが、5回目の世代交代が終わった時点以降、血液型AとBは相性が悪いのでカップルになれないことにする(AB交配制限)。
この処理も若い個体を避けるのと同じように、もし選ばれたらもう一度選びなおしている。

11

5世代目までは前回と同じである。
10世代目までに、予想通りAB型がほぼ絶滅している。
遺伝子頻度は、これだけ大きな配偶行動の変化があったにもかかわらず、最初からほとんど変わらない。
波及効果として、A型とB型が増え、O型が減っている。
HWPからの乖離による各血液型の増減は、AとB型、およびABとO型が連動するようだ。

以上から、極端に交配を制限しても、ランダム交配の場合と同じ遺伝子頻度を維持できる場合があると言える。
従って、何れかの時点で血液型AとBの相性が悪いというのは無かったことにすれば、第5世代の遺伝子型と血液型比率が再現されるはずだ。


HWPを修正する

シミュレーションでは配偶行動の偏りを再現できたが、数式モデルでは難しい。
シミュレーション結果の方を真似て『AB型バイアス』の導入を試みる。

12

「血液型AとBの相性が悪い」というのは、『AB型バイアス』の値が負であることに相当する。
AB交配制限のシミュレーション条件は、『AB型バイアス』が-1(-100%)に相当すると考えられる。
この場合、上記図の説明とは逆にABとO型が減り、AとB型が増え、シミュレーションと同じ傾向が再現できるはずだ。

HWPに適合していることが明らかな3国を除いた7カ国について『AB型バイアス』で修正したモデルを適用した。

13_2

『AB型バイアス』は-7.0%から6.6%の範囲に分布していることが判明した。
このことから血液型比率を歪ませる、部分的な交配制限のようなものがあると考えられるが、それが何であるか断定できない。
これらの国々に『相性』に相当する概念すら無いかもしれないから、少なくとも血液型AとBの相性ではないと思う。
思いつく仮説はいくつかあるが、どれも裏付けの無い、想像の域を脱しないものばかりである。

これに決着をつけるには、当該国・地域の事実に関する情報が足りない。想像したのではダメである。


もう一度日本

血液型による相性の影響は無いと結論を出した日本のデータは、私の記憶が正しければ1960年代か、それ以前のものだったはずである。
もしそのとおりなら、血液型ステレオタイプが蔓延する以前の状況について検討した事になる。

『血液型ステレオタイプ』は、日本の心理学業界でポピュラーなテーマのようだ。

『ブラットタイプ・ハラスメント』なんていうキーワードがあったりして、少々ドッキリさせられる。

こう言った状況と、今まで私の行った分析結果を突き合わせると、日本の最新の正確かつ詳細な血液型比率のデータが欲しくなる。
仮に血液型ステレオタイプが配偶行動に影響を与えるなら、それが蔓延してから平均2回程度世代交代しているので、血液型比率の変化で検証できるかもしれないからだ。

新生児はほぼ100%血液型検査をしていると思うので、少なくとも若い人の元データはあるはずだ。変化を見るには、これだけでも十分である。
しかし、個人情報ナントカのせいでこういった情報の収集は難しくなっているんじゃあないだろうか。

「血液型比率が数十年単位でもあまり変わらないことを、集団遺伝の法則が保証している」という趣旨の記述を見た記憶があるが、これは明らかな誤りである。


おまけ

ネタ情報を、最後まで読んでくれたあなたにプレゼント!
最初に営業させていただいた本の関連サイトがある。

こんなことや

血液型 自分の説明書メーカー | O型菅直人さんの説明書 

こんなことも

血液型 自分の説明書メーカー | O型菅直人さんとB型小沢一郎さんの相性の説明書 

できてしまう。まぁ、楽しんでもらいたい。

|

« LED電球の電磁波ノイズ (3) 他製品と比較 | トップページ | シマリスと暮らす(3)惜別 »

学問・資格」カテゴリの記事

心と体」カテゴリの記事

日記・コラム・つぶやき」カテゴリの記事

書籍・雑誌」カテゴリの記事

趣味」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/543745/50969801

この記事へのトラックバック一覧です: Excelで検証しよう! - 血液型と相性:

« LED電球の電磁波ノイズ (3) 他製品と比較 | トップページ | シマリスと暮らす(3)惜別 »