研究スポットライト:「AIに専門家の"見る目"を教える」―武蔵野大学・浦木准教授に聞く、新フレームワーク「Semantic Microscope」

#JA

データサイエンス学部 浦木麻子 博士のインタビュー

図1. 武蔵野大学データサイエンス学部准教授の浦木麻子博士(インスブルックの街にて).

 

2025年11月、タイ・プーケットで開催された国際会議AAII Symposium 2025で、武蔵野大学データサイエンス学部の浦木麻子准教授らが発表した「Semantic Microscope」が注目を集めている。これは、従来のAIとは真逆のアプローチで、専門家の「視点」そのものをAIに組み込む画期的な技術だという。一体どのような仕組みなのか。浦木准教授に話を聞いた。


「大は小を兼ねる」では解決できない問題

――今回発表された「Semantic Microscope」、直訳すると「意味の顕微鏡」ですが、どのような技術なのでしょうか。

浦木准教授(以下、浦木):一言で言えば、「専門家がデータを見るときの"視点"を、AIに教え込む技術」です。最近のAIは、とにかく大量のデータを学習させて、そこからパターンを見つけ出す「大規模モデル」が主流ですよね。でも、私たちのアプローチはまったく逆なんです。

――逆、というと?

浦木:私たちは「必要な情報だけに、鋭く焦点を当てる」というアプローチを取っています。たとえば、医師が患者のデータを見るとき、すべてのデータを均等に見るわけではありませんよね。「この症状なら、この数値に注目すべき」という"視点"があるはずです。Semantic Microscopeは、そうした専門家の視点を、定量的に表現できるようにしたフレームワークなんです。

人間の脳の「絞り込む力」をモデル化

――「専門家の視点」を定量化する、というのが今回の核心ですね。

浦木:はい。人間の脳って実はすごく賢くて、すべての情報を一度に処理しようとはしないんです。ズームインしたり、ズームアウトしたり、抽象化したり、いろいろな情報を組み合わせたり。そうやって、「今、本当に知りたい情報」に絞り込んでいく。この能力をモデル化したのがSemantic Microscopeです。

――なるほど。具体的にはどういう仕組みなのでしょう。

浦木:核心となるのは、「時系列コンテキストを5つの要素で表現する」という考え方です。私たちはこれを「5 elements」と呼んでいます。

――5つの要素、ですか。

浦木:ええ。この5つの要素の組み合わせが、専門家が「どういう視点でデータを見ているか」を表現するんです。私たちはこれを「data focusing options(データ集中のための選択肢)」と名付けました。

図1. Semantic Microscope の目指すもの.

顕微鏡を操作するように、視点を切り替える

――「data focusing options」という名前が面白いですね。

浦木:そうなんです。実はこのフレームワーク、本物の顕微鏡の操作にすごく似ているんですよ。顕微鏡を使うとき、私たちは倍率を変えたり、ピントを合わせたり、照明を調整したりしますよね。Semantic Microscopeも同じように、5つの要素を調整することで、「見たいものを見る」ことができるんです。

――なるほど。5つの要素を調整することが、顕微鏡の倍率やピントを調整することに対応しているわけですね。

浦木:まさにその通りです。しかも、この組み合わせは「ストア(保存)・シェア(共有)・スイッチ(切り替え)」できるんです。つまり、ある専門家が見つけた「良い視点」を保存して、他の人と共有したり、状況に応じて切り替えたりできる。これが非常に重要なポイントなんです。

「意味的な離散値」で専門知識を表現

――もう少し技術的な話を聞かせてください。「意味的な離散値」という言葉が出てきますが、これは何でしょうか。

浦木:「semantic discrete value」ですね。これは、分析の文脈に応じて、「どのデータを参照すべきか」を意味的に決定した値のことです。たとえば、COVID-19のデータを分析するとき、「どの変異株に注目するか」「どの時期のデータを見るか」といった選択を、意味を持った形で表現するわけです。

――つまり、単なる数値ではなく、「なぜそれを選んだか」という意味も含まれている?

浦木:その通りです。これが「semantic viewpoint(意味的な視点)」の定量化につながるんです。従来のAIは、データの統計的なパターンは見つけられますが、「なぜそこに注目すべきか」という専門家の意図まではわかりません。Semantic Microscopeは、その意図を組み込めるのが強みなんです。

公衆衛生から海水質まで、幅広い応用実験

――実際にどんな分野で使われているんですか。

浦木:これまでに主に2つの分野で応用実験を行いました。1つは公衆衛生データ、特にCOVID-19の変異株分析です。もう1つはハワイ沿岸の洪水時の海水質分析ですね。

――COVID-19の変異株分析では、具体的にどんなことが?

浦木:たとえば、「ある地域で新しい変異株が出現したとき、過去のどの変異株の推移パターンと似ているか」を見つけ出したり、「今後の感染拡大のパターンを予測する際に、どの時期のデータに注目すべきか」といった分析ですね。専門家の知見を5つの要素で表現することで、より的確な分析が可能になりました。

――海水質の分析はまた違った文脈ですね。

浦木:はい。洪水時の海水質変化は、時間帯や潮の満ち引き、降雨量など、さまざまな要因が複雑に絡み合います。Semantic Microscopeを使うことで、「この条件下ではこの要素に注目すべき」という専門家の視点を定量化し、より精緻な水質予測が可能になりました。

図2. Semantic Microscope Projectの応用1: Covid-19罹患者数の予測実験.

図3. Semantic Microscope Projectの応用1: Covid-19変異種置き換わり速度予測実験.

大規模モデルとの決定的な違い――「データを増やす」か「データをシャープにする」か

――改めて、従来の大規模AIモデルとの違いを教えてください。

浦木:ここが今回の研究の一番大事なポイントですね。大規模モデル――たとえばLLM(大規模言語モデル)のようなAIは、「データを増やすことで、目的の解に近づける可能性を高める」というアプローチなんです。

――とにかくたくさんのデータを食べさせる、ということですか。

浦木:そうです。インターネット上のあらゆるテキスト、画像、音声…膨大なデータを学習させることで、どんな質問にも答えられるようにする。いわば「量で勝負」の戦略ですね。この方法は確かに強力で、ChatGPTのような驚くべき成果を生み出しています。

――一方、Semantic Microscopeは?

浦木:私たちのアプローチは、「データをシャープにすることで、的確な分析結果を導く」というものです。

――「データをシャープにする」というのは?

浦木:データから、目的に応じて必要なポイントだけを、専門家らしく鋭く絞り込むということです。たとえるなら、大規模モデルが「百科事典をまるごと暗記して、どんな質問にもそれなりに答えられる人」だとすると、Semantic Microscopeは「必要な情報がどこにあるかを正確に知っていて、的確なページをピンポイントで開ける専門家」のようなものですね。

――なるほど。百科事典を全部読む人と、目次を熟知している専門家の違いですね。

浦木:まさにそうです。大規模モデルは「たくさんのデータの中に正解があるはずだから、とにかくたくさん学習しよう」という考え方。対して私たちは「正解にたどり着くために本当に必要なデータはどれか、専門家の視点で見極めよう」という考え方なんです。

――どちらも「正解にたどり着く」という目的は同じだけど、そのアプローチが正反対ということですね。

浦木:おっしゃる通りです。大規模モデルは「網を広げる」、Semantic Microscopeは「狙いを定める」。同じゴールを目指していても、戦略がまったく異なります。

「データを意味的にシャープにする枠組み」という貢献

――そうした違いを踏まえて、今回の研究の学術的な貢献はどこにあるのでしょうか。

浦木:私たちの貢献は、「データを意味的にシャープにする枠組みを定義した」ことにあります。

――「意味的にシャープにする」というのがキーワードですね。

浦木:はい。単にデータを減らすとか、フィルタリングするとかではないんです。「この分析の文脈では、このデータに注目すべき」という専門家の意味的な判断を、きちんと形式化・定量化できるようにした。これが私たちのフレームワークの核心であり、オリジナリティなんです。

――これまで、そういう枠組みはなかったのですか。

浦木:もちろん、特徴選択やデータの前処理といった既存の技術はあります。でも、それらは主に統計的な基準でデータを絞り込むものでした。「専門家がなぜそこに注目するのか」という意味的な側面を、体系的に扱える枠組みはなかったんです。

――つまり、「専門家の暗黙知」を形式知に変える技術とも言えますか。

浦木:その表現、とても的確ですね。ベテランの医師や研究者が、長年の経験から身につけた「どこを見るべきか」という勘。それを、5つの要素の組み合わせとして表現し、保存し、共有できるようにした。これがSemantic Microscopeの本質です。

大規模モデルとの共存、そして補完関係

――大規模モデルとSemantic Microscope、将来的にはどのような関係になっていくのでしょうか。

浦木:対立するものではなく、むしろ補完し合う関係になると思います。大規模モデルが得意な分野もあれば、私たちのアプローチが有効な分野もある。

――具体的には?

浦木:たとえば、「何を調べればいいかわからない」という探索的な段階では、大規模モデルの網羅性が役立つでしょう。でも、「この問題について、専門家として正確な分析をしたい」という段階では、Semantic Microscopeのシャープさが活きてくる。

――使い分けができる、ということですね。

浦木:はい。さらに言えば、将来的には両者を組み合わせることも考えられます。大規模モデルで候補を広く探索して、Semantic Microscopeで専門家の視点から絞り込む、というような使い方ですね。

グローバルな知性へ――国際協創研究の展望

――今後の展望を聞かせてください。

浦木:今回のシンポジウムで、タイやインドネシアの研究者の方々と交流できたことは大きな収穫でした。各地域には、その土地特有の知見(local specified knowledge)があるんです。たとえば、熱帯地域特有の感染症パターンとか、地域ごとの環境データの見方とか。

――それらを共有することで?

浦木:そうです。各地の専門知識をSemantic Microscopeの要素として共有し合うことで、「グローバルな知性(global intelligence)」へと進化させていきたいんです。一人の専門家の視点だけでなく、世界中の専門家の視点を統合していく。それが私たちのビジョンです。

――武蔵野大学でも新しい動きがあるとか。

浦木:はい。2026年4月に国際データサイエンス学部(MIDS)が開校予定です。また、アジアAI研究所(AAII)を通じて、今回のシンポジウムで知り合った海外の研究機関との協創研究を継続していくことも決まりました。国際的なネットワークを活かして、このプロジェクトをさらに発展させていきたいと思っています。

 

浦木 麻子プロフィール

データサイエンス学部 データサイエンス学科 准教授慶應義塾大学大学院政策・メディア研究科博士課程修了。博士(政策・メディア)。データサイエンス分野の研究に従事し、慶應義塾大学大学院政策・メディア研究科特任講師・特任准教授を経て、現職。元スキー日本代表選手。FIS Advertising Committee Public Relations and Mass Media委員を4年半担当し、国際スキー連盟におけるマーケティング分野の国際交渉にも尽力した。現在は、公益財団法人日本オリンピック委員会情報・科学スタッフとしてデータベース&テクノロジWGに参画している。


「専門家の目」をAIに教える――一見シンプルに聞こえるが、それは人間の知性の本質に迫る挑戦だ。「データを増やす」のではなく「データをシャープにする」。このパラダイムの転換が、AIと人間の知恵を融合させる新しい道を切り開こうとしている。Semantic Microscopeプロジェクトの成果が、公衆衛生から環境保全まで、幅広い分野で人々の生活を支える日も、そう遠くないかもしれない


MUDSとAAIIにおける研究協力や客員研究員の募集に関する詳細は、muds.ac/contact からご相談ください。

Yusuke Takahashi PhD

Entrepreneur, Computer Scientist, Cycle Road Racer, Beer Lover, A Proud Son of My Parents, Husband, Father, Trail Runner

https://medium.com/@aerodynamics
Previous
Previous

Research Spotlight: "Teaching AI the Expert's Eye" — An Interview with Associate Professor Uraki of Musashino University on the New Framework "Semantic Microscope"

Next
Next

Research Spotlight: Experiencing Data Through the Body