講義科目・内容

医療イノベーション俯瞰演習:
「研究分野を俯瞰し、自らの関心事項の世界における位置づけを明らかにする」

科目番号 科目名・単位数・英訳 担当教官氏名 令和3年度
開講
学期 曜日 時間 講義室
47243-20 医療イノベーション俯瞰演習
Exercises of Comprehensive Analysis on Biomedical Innovation
加納 信吾 A2/W 6限 柏/
白金
zoom

<主題と目標>
 研究分野を俯瞰し、自らの関心事項の世界における位置づけを明らかにする:

 参加者自らが関心のあるテーマと研究上もしくは社会的な課題との関連性の俯瞰的に把握するため、
 @把握したい世界を200字から300字程度の文章で表現し、その中から主要なキーワードを抽出する。
 Aキーワードの類義語・全く異なる用語だがほぼ類似の内容を示す同義語(「オープン・イノベーション」と「共同研究」など)・派生語・省略形(品詞に派生する以前の単語の部分)を設定し、各キーワードのヒット数・複数ワード間の共通ヒット数から、キーワードの抱合関係を徹底的に調べた上で、AND/OR/-/()が複雑に組み合わされた検索式について試行錯誤しながら、キーワードの組合せにより文献データベースから何件の論文がヒットするかを実際にWeb of ScienceやPubMedを検索し、最終的に採用する検索式を決定する。
 B特許情報プラットフォーム(J-PlatPat)といった特許データベースの検索については、キーワードだけでなく「Fターム」を利用した効率的な概念検索法についても習熟する。先行技術調査だけでなく、特許情報を用いた多面的な情報の抽出について検討する。例えば、特許情報の検索は、(1)オプジーボ(抗PD-1抗体)のようなモノクローナル抗体の製造技術に関する特許出願の動向はどのようになっているのか?(2)細胞関連技術分野において、人工知能の応用としては、どのようなものが考えられているのか?(3)免疫チェックポイント阻害剤の研究開発の主なプレイヤーは?(4)武田薬品工業、中外製薬それぞれが得意とする医薬品製剤の活性成分は?といった設問に対して答えを導くことができる。
 C最終的に解析対象として確定させた膨大な文献(数千件〜数万件)の関係性を自動で解析するマッピングツールやテキストマイニングツールを用いて分析する。主要な研究グループの共著関係による同定、引用関係による当該分野における主要な論文の同定、自らの研究領域や関心を持つテーマがどのように引用関係によって分類されるか、主要な論文の時系列的な流れを検討する。
 また、2020年度に導入したAMANOGAWAのConcept Encoderを用いた概念検索による論文検索も平行して実施し、キーワード検索による結果と単語ベクトル・文書ベクトルによる概念検索の結果の比較照合を行い、選択した論文集合の群分け手法と関心領域へフォーカスした場合の特徴的な論文集団について検討する。Concept Encoderは、「単語と文書のベクトル化」により、文書や単語間の類似性・関係性を各種統計学的手法により数値化し、マップ化することができる。
 Dそうした情報空間は自然科学のジャーナルと社会科学のジャーナルによりどう異なっているか、また研究上の課題や社会的な課題とどう結びついているのかを分析する。
 E @〜Dを経て、分類された各研究クラスターの引用件数の高い論文を代表論文として抽出し、自らが把握したい世界との距離感をレイティングしてフィードバックループを回すことにより、把握したかった世界とデータベースでヒットした論文とのギャップを把握する。
 Fギャップを解消するために、より最適な検索キーワードセットと検索式を再構築し、@〜Bのプロセスを再度実施して、自らが把握したかった世界とヒットする論文群がよりマッチした状態を実現する(第二サイクル)。

<2019年度実施内容>
 研究室体験活動参加者(2名)、特別参加者を含めて11名中8名が最終プレゼンを実施。参加者の把握したかった世界は以下の通り。約半数が第二サイクルまでを回して、キーワードの最適化、研究グループと代表論文の同定、代表論文の時系列引用関係分析に到達した。括弧内は最終的に絞り込んだ文献数だが、推奨しているのは1000本〜3000本程度の最終ヒット数。
・Image-based approaches to single-cell transcriptomics, in which RNA species are identified and counted in situ via imaging (1,014本)
・医療/Healthデータに機械学習がどのように応用されているか (16,051本)
・在留資格がない故に医療制度の対象から外れてしまったり、国外追放を恐れて医療機関にアクセスできなくなったりする非正規移民に関するもの。 (26本)
・規制当局のよる医薬品の承認プロセスに関わる多くの情報に対するテキストマイニングによる解析 (テキストマイニングで3,800本)
・運動含む身体活動が軽度認知障害を含む認知症の発症リスクを軽減させる、または認知症の進行を遅らせるかどうか (300本)
・How researchers are modelling pancreatic cancer in-vitro for drug screening? (1,587本)
・How these iPSC plays different role in regenerative medicine, particularly in therapies remain in interest? (289本)
・医療クラスターの活動に影響する因子・指標を定量的に評価するとともに、クラスター内のイノベーションの実態とパフォーマンスの関係を解明する (875本)

 文献データベースと分析ツールが発達し、修論や博論における「背景」記述には必須の作業となったが、ツールの利用体験がそのための準備となる。研究室の雑誌会で論文を紹介する際には、紹介している論文のポジショニングを可視化した上で紹介することが求められており、感覚的な相対感では世界を整理することはできず、こうしたツールを用いずに特定のテーマのポジショニングは語ることはできない。暗黙知的なポジショニングの理解ですまされた時代は終わり、視覚的理解と実質的理解は併用されるため、新たなテーマに着手する場合に必須のスキルとなっている。医療イノベーションコースの修士学生には本演習を必修としている理由もこの点にある。

図1 次世代シーケンサの論文に対する引用ネットワーク解析

図2 心臓*シミュレーターでヒットした論文の研究機関同士のネットワーク

図3 論文探索AIシステム「AMANOGAWA」の検索画面

<担当講師>
加納 信吾(メディカル情報生命専攻 バイオイノベーション政策分野 教授)

<学期・講義室>
2021年度は、主としてオンラインで実施する。ZoomURLはシラバス参照のこと。
A2 水曜日6限

〇2021年10月27日(水) 19:00-20:30(6限) 第1回 マッピングツール入門(加納)
〇2021年11月10日(水) 19:00-20:30(6限) 第2回 特許情報の検索と調査(TBD)
〇2021年11月17日(水) 19:00-20:30(6限) 第3回 データソース設定とMapping空間の作成(加納)
〇2021年11月24日(水) 19:00-20:30(6限) 第4回 時系列分析と社会的課題の分析(加納)
〇2021年12月1日(水) 19:00-20:30(6限) 第5回 結果の解釈と追加検証(加納)
〇2021年12月8日(水) 19:00-20:30(6限) 第6回 クラスター内分析(加納)
〇2021年12月15日(水) 19:00-20:30(6限) 第7回 発表(加納)
※データベースを各自が検索し、データ収集・加工を行うため、学内ネットに接続可能なノートPCの持参必須。

<成績評価方法>
(1)講義への参加(30%)
Participation(30%).
(2)分野俯瞰演習と発表に対する貢献(70%) 演習と発表に参加した者には、出席点を与える。
Commitment to field mapping and presentation(70%)

<教科書・参考書等>
必須図書
講師の配布マテリアル(メールによる配布も含む。)
下記URLの4つの分野俯瞰ツールを用います。
分野俯瞰ツール(技術経営戦略専攻 坂田・森研究室にご協力頂いています)
VOS Viewer
CitNetExplorer
AMANOGAWA
<受講に関する要件等>
なし