小保方論文の本当の憂鬱

小保方晴子さんが iPS 細胞を超える STAP 細胞という大発見をしたとして、2014年1月にマスメディアの寵児となった。しかし、翌月には、論文に怪しい箇所があると雲行きが怪しくなり、そろそろ論文撤回*1が決まりそうだ。
その論文の疑惑については、小保方晴子のSTAP細胞論文の疑惑 というページが詳しい。ただ、図や文章がコピーというようなところは誰でも分かるように書かれているが、致命的な箇所は専門家と思しき人の掲示板への書き込み*2の引用しかない。だから、誰にでも分かるように解説してみたい。


まず、生物は細胞からできている。細胞の材料はかなりがタンパク質だ。タンパク質の設計図が、遺伝子。人間の遺伝子は3万くらいしかない。

一つの遺伝子から作られるタンパク質はだいたい一つに決まっているのだけれども、大きな例外が免疫システム。免疫システムでは、外来からのいろいろ侵入物を認識するために、いろんなタンパク質に結合できる様々な形の"抗体"を作るんだ。抗体ももちろんタンパク質でできている。
この多様な抗体を作る原理を説明したのが、利根川進ノーベル賞に選ばれた業績、V(D)J遺伝子再構成(遺伝子再編成)というやつだ。

遺伝子再構成っていうのは、要するに、本来必要なよりもずっと長い遺伝子を用意しておいて、無駄なところを後で捨てると、捨て方によって、色々な種類ができるということ。
例えば、英文で {I You He She We} {ate drank killed} {books chairs tables trees}. というのを考えると、これだけでも5*3*4=60通り作れる。

これが、免疫細胞ができる(分化する)ときに遺伝子に起きているというのが遺伝子再構成で、それまでの常識を覆すものだった。1976年の話ね。
つまり、免疫細胞になる時に、ある遺伝子は、その大部分を捨て去ることで抗体のタンパク質を生み出せるようになり、その捨て方によって色々な抗体を持った免疫細胞ができるという話だ。

さらに、遺伝子再構成以外にも免疫細胞の種類を増やす方法があって、諸々合わせて、最終的に作られるタンパク質は10^18通り以上とかあるらしい。1キロ=10^3、1ギガ=10^6、1メガ=10^9、1テラ=10^12、1ペタ=10^15、1エクサ=10^18だね。


小保方さんの Nature の論文は、さらに衝撃的で、遺伝子再構成されたものが、元に戻る万能細胞になる*3って言っているんだ。酸につけるだけで。
これ、食いかけのゆで卵をお酢につけたら、生卵まるまる一個に戻ったみたいなものだよ。だって、遺伝子の大半は捨て去られてるんだもん。「過去何百年の細胞生物学の歴史を愚弄するものだ」ろ?
「誰も信じてくれなかったことが何よりも大変だった」というか、信じないよね。これが本当だったとすると、元の遺伝子がどこかに隠してあって、元に戻せるようになっていたこれだけ複雑な変化をしたものが、簡単に戻るように作られていた*4ということだから。

というわけで、実は、Nature 論文が出た直後から話題になっていたけれども、医者みたいな生命科学のユーザーは大絶賛して夢が広がりんぐしていたけれども、近い分野の研究者は追試がなされるまでは信じないと言っていた人のほうが多そうだった。そりゃ、マスコミにマイク向けられたら、そんなこといわないけどね。「誠に驚くべき内容で、続報に期待する」とかいうでしょう。揉めたくないもん。

Nature は今でこそ権威があるけども、商業誌でもともとはゴシップ誌に近い。とある助教は、Nature に出たということは嘘だと冗談めかして言っていた。別にいいんですよ。論文っていうのは、研究者同士のコミニケーション手段だから、別に論文がでたところでどうということはない。あと、査読だけど、一流研究室だと、論文を出していいという教授の許可のほうが大変で、そこを通れば査読にはまず落ちない。まあ、だから、Nature に出た程度で信じない、ってことね。


ここまでが前提で、その捏造が疑われている箇所というのが、STAP ができている直接のSTAP 細胞が免疫細胞由来である証拠とされているんだけれども、よく考えると、とんでもなく不思議。

簡単にいうと、「細胞の中の特定の遺伝子だけ選んで、その長さの分布を測る」ことができる技術があるの。それを使うと、
{I You He She We} {ate drank killed} {books chairs tables trees}. <- 長い
She killed tables. <- 短い
と、細胞内にどういう長さの遺伝子があるかが分かる。

論文によるとね、遺伝子再構成の前(ES 細胞)の遺伝子の長さをはかると、長い。遺伝子再構成後(免疫細胞)の遺伝子の長さをはかると、短い。そして、それを酸で処理した STAP 細胞は一部だが長い短いものと長いものがある。だから、これは、STAP 細胞が一部万能細胞に戻った免疫細胞由来である証拠だ、っていうんだ。ところが、実はこの時点で何かがおかしい。

というのもね、遺伝子のセットは両親から一組ずつ受け取る。だから、同じ遺伝子が二つずつあるんだ。これを対立遺伝子とかいう。対立遺伝子の組の挙動は、さまざまだ。たとえば、優性・劣性というのは、中学でやるね。つまり、優性な方の形質がでる場合がある。血液型のB型とO型の遺伝子を持っていると、B型が優性なのでB型になる。これが、A型とB型だと、両方の形質が出てAB型になる。
でも、抗体の場合はそうはならないんだ。対立する片方の遺伝子が発生の途中で使えなくなる(不活化する)んだ。同じ現象は、たとえば、三毛猫の毛の色でもみられる。「茶色で上書きする」遺伝子と「何もしない」遺伝子というのが対立遺伝子なんだ。他の遺伝子が、「黒地に白ぶち」なネコにしようとしているときに、「茶色で上書き」と「何もしない」が一つずつあると、一方が細胞ごとにランダムに使えなくなる。だから、「黒地に白斑」と「茶」の部分が体中にできる。これが三毛猫。遺伝子が使えなくなるといっても、捨てられるというよりは、鍵がかかる感じだ。オッドアイも同じ原理だ。

つまり、話を戻すと、「免疫細胞の遺伝子の長さをはかると、短い」っていうこと自体がおかしいんだ。対立遺伝子の一方は不活化しているから再構成されず、元の長さのまま、もう一方は抗体を作るために遺伝子再構成をうけて短くなる。だから遺伝子再構成後の免疫細胞の遺伝子の長さは「半分は短く、半分は長い」という結果が出るはずなんだ。このことは、免疫細胞の遺伝子再構成を知っている人なら、当然のことなんだ。ところが論文では長い方の存在がないんだ。


それでね、ここのところ、みんな悩んでるの。これ捏造だとしても、杜撰すぎる。なんで消しちゃったの??
しかも、同じ論文の別の figure では、免疫細胞の結果は、「半分は短く、半分は長い」になっていて、消されていないの。
一番素直に解釈すると、免疫細胞が全部短い遺伝子で、STAP 細胞に長い遺伝子が含まれていると、STAP 細胞の遺伝子の長さが元に戻ったという解釈になるから、そのように解釈できる余地を残すために消したということになるのだけれども、さすがに大変が捨てられた遺伝子が元に戻るというのは荒唐無稽だ。確かに、「半分は短く、半分は長い」免疫細胞が「半分は短く、半分は長い」STAP 細胞になっても、STAP 細胞が万能細胞になった証拠ではない。でも、そんな常識的なところを捏造してもバレるに決まってるよ。


でも、ここから、少なくとも一つのことが分かるんだ。
小保方さんだけじゃなくて、あの論文の共著者8人は全員「免疫細胞の遺伝子再構成」で対立遺伝子排除が働いていることを知らないってことだ。恐らく、問題があったのは小保方さんだけじゃない。

*1:撤回されそうな論文: Nature 505, 641–647 (30 January 2014) doi:10.1038/nature12968 Stimulus-triggered fate conversion of somatic cells into pluripotency | Nature

*2:問題の箇所はここである。「免疫で遺伝子やってるやつならわかる。TCRのDNA解析でレーン3のGLにバンドがない件は全然おかしい。……著者は意図的にGLがバンドがないように見せることによって、分化後のT細胞を用いたことを示そうと細工したようだ。しかし、TCRbetaでは対立遺伝子排除が働くので片方の相同染色体ではGL型の配列をもつはず(よってJEM論文のようにGLにバンドが出るはず)。それを知らずに馬脚を現した。」

*3:元に戻るとしたのは、推測が混じっていました。この推測は、画像の捏造のされ方や後出しのプロトコルと整合的に解釈したものですが、そこまでは書かれていませんでした。議論をしている最中に混同したようです。

*4:同上