第1章:2つのデータベース、2つの現実:あなたの研究戦略が見逃している情報の半分#

概要#

あらゆる本格的な調査は、同じ問いから始まる。どこから探し始めればいいのか?ある生物医学的物質——今回の場合はα-リポ酸——について科学が実際に何を解明しているかを追跡するなら、答えは決して「一箇所」ではない。常に複数だ。そして、どこを選ぶかによって、見つかるものが大きく変わる。そのことに気づいている人は、驚くほど少ない。

本章では、ソースフロー・ポジショニング・システムの最初の二つの検索チャネルを紹介する。連邦研究助成データベースと、出版済み学術文献データベースだ。似たように聞こえるかもしれないが、まったく別物だ。そして、両方を併用すると、見える景色が劇的に変わる。


二つのチャネル、二つの世界#

こう考えてほしい。

連邦研究助成データベース——代表格はNIH RePORTER——は、政府資金を受けたプロジェクトを記録している。科学者たちが今、何を研究するために資金を得ているかを教えてくれる。ここに映し出されるのは「意図」だ。各機関がリソースをどこに向けるべきだと判断したかの記録である。

出版済み文献データベース——主力はPubMed/MEDLINE——は、すでに完了し、査読を受け、正式に記録として受理された研究成果を収録している。何が発見されたかを教えてくれる。ここに映し出されるのは「結果」だ。

両者には重なりがある。しかし、同じものではない。

理由はこうだ。今年資金を受けたプロジェクトが論文として出るのは、3年から5年後かもしれない。今日読んだ論文は、10年前の資金決定を反映しているかもしれない。助成データベースは前方を照らす。文献データベースはバックミラーだ。片方だけに頼れば、視界の半分を塞いだまま進むことになる。

これがデュアルチャネル検索の核心原則だ。同じテーマを異なる入口から検索すると、結果が「多くなる」のではなく、「異なるもの」が見つかる。


情報源成熟度スペクトラム#

具体的な検索手法に入る前に、この二つのチャネルがより大きな地図のどこに位置するかを確認しておこう。生物医学情報にはライフサイクルがあり、段階を経て移行する:

探索 ──────────────────────────────────────────── 確認

学位論文 → 助成プロジェクト → 臨床試験 → 学術論文 → 特許 → 書籍 → 教科書 → ニュース

スペクトラムの左端では、アイデアは新しく、不確実で、早期シグナルとして価値がある可能性がある。右端では、知識は定着し、広く受け入れられており、最前線から数年遅れていることも多い。

連邦助成データベースは「助成プロジェクト」の領域——スペクトラムの前半に位置する。出版済み文献データベースはより広い範囲をカバーし、最先端のジャーナル論文から包括的なレビュー論文までを含む。二つを合わせると、探索から検証までのコアな回廊を押さえることになる。

本書の各章はスペクトラムの異なる区間をカバーしている。読み終えれば、完全な地図が手に入る。


研究クラスターの収束#

助成データベースで最も強力な手法の一つが、クラスター分析だ。ロジックは驚くほどシンプルだ:

  • 一つの機関があるテーマに資金を出しているなら、それはその機関の関心に過ぎないかもしれない。
  • 三つの無関係な機関がそれぞれ独立に同じテーマのプロジェクトに資金を出しているなら、何かが起きている。三つの独立した意思決定者がそれぞれ証拠を検討し、独立にこの方向に資金を投じる価値があると判断したのだ。
  • 五つ以上が同じ方向に収束しているなら?それは高い信頼度を持つ研究ホットスポットだ。

原則は明快だ:ある研究方向の信頼性は、それを独立に指し示す情報源の数に比例する。

ここで注意してほしいのは、これは論文の数を数えているのではないということだ。独立した意思決定の数を数えている。一つの研究室が同じテーマで10本の論文を出しても、それは一つのデータポイントだ。五つの大学の五つの研究室が、互いに調整することなく、それぞれ同じ現象を研究することを選んだなら——それは五つの独立したデータポイントだ。この違いは極めて大きい。

研究クラスターレーダーの構築方法#

実践方法は以下の通り:

  1. プロジェクトリストを抽出する。 連邦助成データベースで対象キーワードを検索し、マッチしたすべてのプロジェクトタイトルと要旨をエクスポートする。
  2. 各プロジェクトにタグを付ける。 プロジェクトごとに1〜3個のトピックラベルを割り当てる。例えば「糖尿病性神経障害」「抗酸化メカニズム」「薬物動態」など。
  3. トピック頻度を集計する。 プロジェクト数でトピックをランキングし、上位5方向を特定する。
  4. 資金源をマッピングする。 上位の各方向について、資金を提供した機関を記録する。独立した機関の数を数える。
  5. 収束度を評価する。 プロジェクト数が多く、かつ機関の多様性も高い方向が、最も強いシグナルだ。

結果の読み方:

パターン 意味
プロジェクト多 + 機関多 高信頼度のホットスポット——複数の独立した角度から検証済み
プロジェクト多 + 機関少 一つのチームの継続的な取り組みかもしれない——独立した検証が必要
プロジェクト少 + 機関多 新興方向——活動量はまだ少ないが、関心の広がりが示唆的

この手法はα-リポ酸に限定されない。どんな化合物、技術、研究課題にも、そのまま適用できる。


データより手法が長持ちする#

本書を貫く重要な区別があり、ここで明確にしておく価値がある。手法はデータより長く生きる。

特定の年に助成されたプロジェクトは変わる。データベースに索引された論文は増え続け、変化する。しかし手法——助成データベースの検索方法、クラスターの見つけ方、出版文献との突き合わせ方——は、来年データベースの中身がどう変わろうと、10年後でも有効だ。

だからこそ、我々はプロセスに時間を割く。ある年にα-リポ酸を研究した連邦プロジェクトを暗記することには消費期限がある。あらゆる助成データベースからクラスターシグナルを抽出する方法を学ぶことには、消費期限がない。

ソースフロー・ポジショニング・システムはこの哲学の上に構築されている。本書で紹介するすべてのツールは、テーマを超え、年を超え、分野を超えて再利用できるように設計されている。


各チャネルが見落とすもの#

すべてをカバーできるチャネルは存在しない。盲点を知ることは、カバー範囲を知ることと同じくらい重要だ。

チャネル 見えるもの 見えないもの
連邦助成データベース 政府が資金を投じた研究の優先方向 民間資金の研究、企業R&D、国際的な非政府プロジェクト
出版済み文献データベース 科学界に受理された査読済みの知見 未発表の結果、陰性結果(出版バイアス)、未完了の進行中研究

一つのチャネルの検索を終えたとき、正しい問いは「十分に見つけたか?」ではない。「使ったチャネルのせいで、何を見落としている可能性があるか?」だ。

この問いが次章の基盤となる。次章では、まったく異なる学問的フレームワークの下で機能する第三のチャネルを導入する。


キーポイント#

  • 二つの独立した検索チャネル——連邦助成データベースと出版済み文献データベース——が、体系的な情報検索の出発点となる。
  • 同じテーマを異なるチャネルで検索すると、異なる量ではなく、異なる結果が得られる。
  • 研究クラスター分析は、論文数ではなく、独立した機関の収束を数えることで高信頼度の方向を特定する。
  • 手法はデータより持続する。本章の検索技術はα-リポ酸に限らず、あらゆる分野に適用できる。
  • すべてのチャネルには体系的な盲点がある。見えないものを認識することが、空白を埋める第一歩だ。

次章では、同じ物質をまったく異なるレンズで捉え直すチャネルを紹介し、「どこで検索するか」が「どのバージョンの現実を見つけるか」を決定する理由を示す。