メモ

  • こちらから
  • こちらで、パズルとデータは違う、という意見がある
  • データの読み方はパズルのようだ、とも思える。そして「パズル」が解けたら、「解き方」を伝えたい。「解き方」を一般化しておきたい。データの読み方はそういう意味で、「パズルの解き方」の一般化だと思う。
  • さて、コドン表というデータパズルを読むことについて
  • コドン表は表である
  • コドン表の情報を伝達するにはどうすればよいだろうか?
  • わかりやすく説明するためによく使う枕詞は「小学生(中学生)に説明するとしたらどうする?」だ。今日は「宇宙人」に説明することにした
  • 宇宙人には自然言語は通じない。徹底して数学(抽象)で話をすることになる
  • 登場するのは「塩基」と「コーディングアミノ酸
  • 「塩基」は4種類、「コーディングアミノ酸」は20種類で、「該当なしという『疑似アミノ酸』」を含めて、21種類あることを前提にしよう
  • 4種類と21種類は、「カテゴリ」である
  • カテゴリと来たら順序のありなしが大事
  • 塩基もアミノ酸も「簡単な順序」はない
  • 順序のないカテゴリは、全部平等に扱うことになるか
  • それでは、データに構造がないので、「分類」するとよい
  • プリン・ピリミジン、結合の強いペア(GC)とそうでないペア
  • 化学的性質でのアミノ酸分類、構造上のアミノ酸分類
  • 4塩基はコドンという3つ組にする
  • 64通りのコドン。これも「フラット」に64種類のカテゴリにしてしまうのも一つの手
  • 「3つ組」の「3=1,2,3」をどうするかを決めないと、宇宙人には話せない
  • 「1,2,3」をすべて平等に(順序のないカテゴリで)扱うか?
  • 順序を入れるか。入れるとしたら、1,2,3なのか、違う順序なのか。3x2x1=6の順列。順序の昇降を気にしないなら、その半分の3通りの順序。
  • 4種類の塩基。コドンという3という数字。64通りのコドン。プリン・ピリミジンという2種類、21種類のアミノ酸(疑似アミノ酸を含む)、いくつかの軸でのアミノ酸の分類。
  • もし、4(塩基)、3(トリオ)、21(アミノ酸)という数字だけで説明して、それで「終わり」とするとしたら、それらの対応関係は「ランダム」だとして想像してくださいね、と宇宙人に告げることと同じ
  • もっと、その「ランダム」な状態より「偏っている」ことが透けて見えている。その「偏り」のうち、「意味のあると地球人と宇宙人とで共感し合える何か」は、「伝え」るべき内容。
  • たとえば、塩基の3並びのうち、第3番は、コドン-アミノ酸対応において、重要度が低い、とか。
  • どれくらい、伝えたいことに気付くか、その気づきに、有意であることの説明ができるか
  • 宇宙人はその「偏り」の理由(分子生物学的説明、進化的説明、その他)に興味があるかもしれないし、ないかもしれないけれど、地球人はその理由に興味があることが多いように思う。
  • 理由のうち、「事実のカタログ的集積」に興味があるのは、(従来型・博物学型の)生物学。「偏り」そのものの抽象的な構造に興味があるのが、数理生物学?→「グラフ理論の遺伝学における役割のその向こうには何がある?」という質問の答えになっていると良いのですが