講義科目・内容

医療イノベーション俯瞰演習:
「研究分野を俯瞰し、自らの関心事項の世界における位置づけを明らかにする」

科目番号 科目名・単位数・英訳 担当教官氏名 令和6年度
開講
学期 曜日 時間 講義室
47243-20 医療イノベーション俯瞰演習
Exercises of Comprehensive Analysis on Biomedical Innovation
加納 信吾 A2/W 6限 柏/
白金
zoomURLは前日までにシラバスに掲載する

<主題と目標>
 研究分野を俯瞰し、自らの関心事項の世界における位置づけを明らかにする:

 まず、演習参加者には、Bibliometric Analysisの標準的なサンプル論文が40本ほど提示されるので、その中から2〜3本の論文を選び、精査すると同時にどのような内容なのかを報告してもらう。この過程を通じて、Bibliometric Analysisの一連の分析手続きを学んでもらう。疾患をターゲットにしたものでは、急性膵炎、骨関節症治療における幹細胞研究、ベータサラセミアの研究動向、乳がんの機械学習による画像診断、ビッグデータアプローチによるコロナウィルス研究のメタ分析といった特定の研究トピックを抽出したものなどをサンプルセットに組み込んでいる。生命科学をターゲットにしたものでは、emerging fieldを特集したもの(例えば、Exsosome Research)、全体をマクロビューするもの(例えば、Human Genetics 2014-2018、single cell analysis)などがある。社会科学分野では、産学連携の分析、技術移転における吸収能力、ビジネスモデル研究など、比較的広範囲な文献の全体像を把握する研究などを紹介している。

 既存論文の解析を行った後、次に参加者自らが関心のあるテーマと研究上もしくは社会的な課題との関連性の俯瞰的に把握するため、
 @把握したい世界を200字から300字程度の文章で表現し、その中から主要なキーワードを抽出する。キーワード群は独立関係、階層関係から体系的に分類される。
 Aキーワードの類義語・全く異なる用語だがほぼ類似の内容を示す同義語(「オープン・イノベーション」と「共同研究」など)・派生語・省略形(品詞に派生する以前の単語の部分)を設定し、各キーワードのヒット数・複数ワード間の共通ヒット数から、キーワードの抱合関係を徹底的に調べた上で、AND/OR/-/()が複雑に組み合わされた検索式について試行錯誤しながら、キーワードの組合せにより文献データベースから何件の論文がヒットするかを実際にWeb of ScienceやPubMedを検索し、最終的に採用する検索式を決定する。同一概念に対する表記ゆれの吸収を実現することの大切さを学ぶ。例えば、産学連携、共同研究、オープン・イノベーションはお互いに概念上のオーバーラップがあるものの、表記としては全く異なっているため、このような概念の抱合関係をどう処理することによって検索漏れを防ぐのかといったことが課題となる。基本的には、表記揺れ吸収が十分に考慮された概念表現がなされた3〜4つ程度の概念の組合せ(A AND B AND C AND D)と偽ヒットの注意深い観察によるノイズフィルター(NOT X)の設定によりS/N比を向上させることができる検索式を開発することが、領域レビューの要となる。また、検索ワードは、どの記載区分(タイトル、要旨、全文、著者キーワード)を対象にセットするのかもクリティカルな選択肢となっていることには十分注意すべきである。目的にフィットした検索式はこれらの組合せを試行錯誤する中から生み出される。論文データベースを検索する際に、検索式の最適化の方法を知っているかいないかは、論文執筆時の背景論記載の質を決める。
 BAI検索を併用する。調べたいものに関連する論文を探し出すPerplexity, 特定のテーマに対して高品質な論文を探し出すElicit, 見つけた論文に関連のある論文を探し出すConnected Papersを使い、シグナルとなるコア論文を同定し、これらの論文をヒットさせるために、検索式を改善する。
 C特許情報プラットフォーム(J-PlatPat)といった特許データベースの検索については、キーワードだけでなく「Fターム」を利用した効率的な概念検索法についても習熟する。先行技術調査だけでなく、特許情報を用いた多面的な情報の抽出について検討する。例えば、特許情報の検索は、(1)オプジーボ(抗PD-1抗体)のようなモノクローナル抗体の製造技術に関する特許出願の動向はどのようになっているのか?(2)細胞関連技術分野において、人工知能の応用としては、どのようなものが考えられているのか?(3)免疫チェックポイント阻害剤の研究開発の主なプレイヤーは?(4)武田薬品工業、中外製薬それぞれが得意とする医薬品製剤の活性成分は?といった設問に対して答えを導くことができる。
 DWeb of Science, Scopus, PubMedなどをソースとして、最終的に解析対象として確定させた膨大な文献(数百件〜数万件)の関係性を自動で解析するマッピングツールやテキストマイニングツールを用いて分析する。主要な研究グループの共著関係による同定、引用関係による当該分野における主要な論文の同定、自らの研究領域や関心を持つテーマがどのように引用関係によって分類されるか、主要な論文の時系列的な流れを検討する。
 Eそうした情報空間は自然科学のジャーナルと社会科学のジャーナルによりどう異なっているか、また研究上の課題や社会的な課題とどう結びついているのかを分析する。
 F @〜Eを経て、分類された各研究クラスターの引用件数の高い論文を代表論文として抽出し、自らが把握したい世界との距離感をレイティングしてフィードバックループを回すことにより、把握したかった世界とデータベースでヒットした論文とのギャップを把握する。
 Gギャップを解消するために、より最適な検索キーワードセットと検索式を再構築し、@〜Bのプロセスを再度実施して、自らが把握したかった世界とヒットする論文群がよりマッチした状態を実現する(第二サイクル)

 文献データベースと分析ツールが発達し、修論や博論における「背景」記述には必須の作業となったが、ツールの利用体験がそのための準備となる。研究室の雑誌会で論文を紹介する際には、紹介している論文のポジショニングを可視化した上で紹介することが求められており、感覚的な相対感では世界を整理することはできず、こうしたツールを用いずに特定のテーマのポジショニングは語ることはできない。暗黙知的なポジショニングの理解ですまされた時代は終わり、視覚的理解と実質的理解は併用されるため、新たなテーマに着手する場合に必須のスキルとなっている。医療イノベーションコースの修士学生には本演習を必修としている理由もこの点にある。

図1 次世代シーケンサの論文に対する引用ネットワーク解析

図2 心臓*シミュレーターでヒットした論文の研究機関同士のネットワーク

<担当講師>
加納 信吾(メディカル情報生命専攻 バイオイノベーション政策分野 教授)
北田 祐介(メディカル情報生命専攻 バイオイノベーション政策分野 客員准教授)
伊藤 紗也佳(メディカル情報生命専攻 バイオイノベーション政策分野 非常勤講師)

<学期・講義室>
会場:白金台:医科研2号館大講義室

2025年度のスケジュール
〇11月19日(水) 18:45-20:30(6限) 第1回 マッピングツール入門(加納)
〇11月26日(水) 18:45-20:30(6限) 第2回 特許情報の検索と調査(北田)
〇12月3日(水) 18:45-20:30(6限) 第3回 既存文献の分析結果発表(伊藤)
〇12月10日(水) 18:45-20:30(6限) 第4回 データソース設定とMapping空間の作成(伊藤)
〇12月17日(水) 18:45-20:30(6限) 第5回 キーワード再設定と母集団の再構築(伊藤)
〇1月7日(水) 18:45-20:30(6限) 第6回 結果の解釈と追加検証(伊藤)
〇1月14日(水) 18:45-20:30(6限) 第7回 発表(伊藤)
※データベースを各自が検索し、データ収集・加工を行うため、学内ネットに接続可能なノートPCの持参必須。

<成績評価方法>
(1)講義への参加(30%)
Participation(30%).
(2)分野俯瞰演習と発表に対する貢献(70%) 演習と発表に参加した者には、出席点を与える。
Commitment to field mapping and presentation(70%)

<教科書・参考書等>
必須図書
講師の配布マテリアル(メールによる配布も含む。)
下記URLの分野俯瞰ツールを用います。
VOS Viewer

<受講に関する要件等>
なし