オントロジー

ONTOLOGY
読み: オントロジー

読み: オントロジー

オントロジーとは知識を体系化

オントロジーは、ある領域に存在する概念とそれらの関係を体系的に定義した知識表現の枠組みである。もともとは哲学用語で「存在論」を意味するが、AI・情報科学の文脈では「機械が理解できる形で世界の構造を記述する方法」として使われる。ナレッジグラフやセマンティックWebの土台となる概念である。

かんたんに言うと

辞書が単語の意味を1つずつ説明するのに対し、オントロジーは単語同士の関係まで含めて「この世界はこういう構造になっている」と定義する設計図のようなものである。

2000年以上の歴史を持つ存在論がAIの知識表現に転用された経緯

「存在とは何か」を問う哲学の一分野として、オントロジーは2,000年以上の歴史を持つ。アリストテレスが「カテゴリー論」で物事を分類したのが出発点とされる。
1990年代に入り、人工知能の研究者たちがこの概念を借用した。機械に知識を持たせるには、まず「何が存在し、それらがどう関係しているか」を形式的に定義する必要があったからである。Tom Gruberが1993年に提唱した「オントロジーとは共有された概念化の明示的な仕様」という定義が、情報科学における標準的な理解になっている。
哲学と情報科学では射程が異なるものの、「物事の構造を明らかにする」という根本の関心は同じである。

オントロジーの構成要素

情報科学でのオントロジーは、いくつかの基本的な構成要素から成り立つ。
まず「クラス」。これは概念のカテゴリにあたる。「動物」「哺乳類」「犬」のような階層構造を持つ。次に「プロパティ」。クラス間やインスタンス間の関係を定義する。「犬は哺乳類の一種」「飼い主は人間」といった関係性がこれにあたる。そして「インスタンス」。具体的な個体を指す。「ポチ」は犬クラスのインスタンスになる。
最後に「公理」と呼ばれる制約条件がある。「哺乳類は必ず脊椎動物でもある」のように、論理的に成り立つべきルールを明示する。これがあることで、機械は矛盾した情報を検出したり、明示されていない関係を推論したりできるようになる。

セマンティックWebとナレッジグラフの基盤

Web上のデータを機械が理解できるようにしようというセマンティックWebの構想は、W3Cが策定したOWLやRDFといったオントロジー記述言語の上に成り立っている。
医療分野のSNOMED CT、生命科学分野のGene Ontologyなど、特定領域で広く共有されたオントロジーは実用段階にある。Googleの検索結果に表示されるリッチスニペットの裏側でも、Schema.orgというオントロジーが動いている。
ナレッジグラフはオントロジーで定義されたスキーマに従ってデータを格納する。GoogleのKnowledge GraphもWikidataも、背後にオントロジーがある。オントロジーなしのナレッジグラフは、設計図なしに建てた建物のようなもので、増築するたびに矛盾が生まれる。

AIの推論と<a href="/ai-glossary/rag/">RAG</a>における役割

LLMは統計的なパターンマッチングで言語を扱うが、厳密な論理推論は苦手としている。オントロジーベースの推論エンジンを組み合わせることで、この弱点を補完できる。
たとえば社内の組織体系をオントロジーで定義しておけば、「営業部の上位組織は」という質問に対して、LLMが曖昧な回答をするのではなく、定義された階層関係に基づいて正確に答えられる。
RAGの検索精度を上げるためにオントロジーを活用する取り組みも進んでいる。検索クエリを概念レベルで拡張し、表記が異なるが同じ意味の情報も確実に拾えるようにする手法である。とはいえ、オントロジーの構築と維持にはドメイン専門家の深い関与が必要で、ここが最大のボトルネックになりやすい。

オントロジー設計の実務的な難しさ

理論的には美しいオントロジーも、実務に落とし込むと厄介な問題が山積する。
最大の難関は、関係者間で概念の定義を合意すること自体が難しい点にある。「顧客」の定義一つとっても、営業部門とカスタマーサポート部門では意味が違う。ここをすり合わせずにオントロジーを作ると、使われないシステムが出来上がる。
もう一つの課題は保守コストである。業務が変われば概念体系も変わる。組織再編でチーム名が変わっただけでも、オントロジーの更新が必要になる。自動化ツールは増えてきたが、最終的な判断は人間が担わざるを得ない。
大規模オントロジーの構築には数年かかることもある。費用対効果を冷静に見極めた上で、まずは限定された領域で小さく始めるのが現実的な進め方になる。

当社の見解

当社はAI長期記憶システムを自社開発・運用している。開発のきっかけは、AIと経営戦略の壁打ちで出した結論がセッション切れで消えたことで絶望を感じた。1日かけて議論してきたことを振り返り、では事業計画書に落とし込むように指示を出したところ、「そのような記録はありません」と言われたことで、強烈な危機感を覚えこれは何としても解決しなければならない問題だと感じた。記憶がないAIは毎朝記憶喪失になる新入社員と同じだ。記憶があるAIは、前提条件を理解した上で本題に入れる。短いプロンプトで済むようになり、「前に言ったように実行して」と曖昧で短いプロンプトでも業務を遂行してくれる。同じことを繰り返し伝える回数も減り、開発業務でも同じミスを繰り返しにくくなり、人間の手戻りが減り、ストレスも減る。AIで本当に業務の質を上げるならば、記憶はマストである。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する