Mistral

MISTRAL
読み: ミストラル

読み: ミストラル

Mistralとは軽量高性能な欧州AI

MistralはフランスのMistral AI社が開発したオープンソース大規模言語モデルである。少ない計算資源で高速に動作する軽量さを持ちながら、高い推論能力を発揮する。企業がオンプレミス環境で自社専用のモデルを構築する際の有力な選択肢となる。

かんたんに言うと

排気量の小さなエンジンにターボを積んで、大型車並みのパワーを叩き出すフランス製のコンパクトカー。燃費が良く小回りが利くため、狭い路地のような制約の多い環境でも機敏に走る。

Mistralが欧州から現れた軽量オープンソースLLMとして注目される背景

Mistral AIは元MetaやGoogle DeepMindの研究者らがパリで立ち上げた企業である。彼らが公開したモデルは、オープンソースLLM界隈で瞬く間に主役の座を奪った。
ただのオープンソースではない。
パラメータ数を抑えながらも、ベンチマークテストで一回り大きなモデルを凌駕するスコアを叩き出す。限られたGPUリソースしか持たない企業にとって、この軽さは魅力的である。自社のサーバーに直接デプロイできるため、外部にデータを出せない業務でもLLMを組み込める。
クラウドベンダーのAPIに依存し続けるリスクを嫌う企業が、こぞってMistralを検証し始めている。

少ない計算資源で動くアーキテクチャの裏側

なぜ軽いのに賢いのか。その秘密はSliding Window Attentionという仕組みにある。過去の文脈をすべて記憶するのではなく、直近の重要な情報に絞って処理を行う。これによりメモリ消費を劇的に抑えつつ、長文の文脈を破綻させずに読み解く。
さらにMixtral 8x7Bというモデルでは、Mixture of Expertsと呼ばれる技術を採用した。
MoEと略されるこの手法は、入力された質問のジャンルに応じて、モデル内の専門家ネットワークが切り替わる。すべてのパラメータを常に動かすわけではないため、推論スピードが落ちない。
限られたハードウェアでこの挙動を安定させるのは、現場のエンジニアにとってかなり悩ましい。だが、うまくチューニングが決まれば、驚くほど軽快に動作する。

法務と製造の現場でどう使われているか

Amazon BedrockやAzure AIといった主要なクラウド基盤でもMistralは標準で選べるようになっている。Perplexityの裏側で動く推論エンジンの一つとしても採用されており、その実力は折り紙付きである。
実際の現場ではどうか。
例えば法務部門での契約書レビュー。機密性の高いNDAやライセンス契約の文面を、外部のAPIに投げたくないという声は根強い。オンプレミス環境にMistralを構築し、Le Chatのような自社専用の対話インターフェースを被せることで、情報漏洩のリスクを絶つ。
製造業の工場ネットワークも同様である。外部インターネットから遮断された閉域網の中で、過去の不良品レポートや設備のマニュアルを検索させる用途で重宝している。

GPT-4やLlama 3との比較で見える限界

オープンソースのライバルであるLlama 3と比較すると、Mistralはより少ないリソースで動く点に分がある。ファインチューニングの敷居も低く、特定の業界用語を学習させるベースモデルとして扱いやすい。
だが、万能ではない。
日本語の処理能力に関しては、GPT-4のような巨大なプロプライエタリモデルにはまだ及ばない。複雑なニュアンスの翻訳や、長文の自然な要約を求められると、不自然な言い回しが混ざることがある。
コストを抑えて自社専用モデルを作るか、ランニングコストを払って最高精度のAPIを叩くか。このトレードオフの判断は、プロジェクトの予算と要求水準によって毎回判断が分かれる。

コンプライアンスとコストの天秤

自社のデータをどこまで外部に出せるか。これがMistralを選ぶ最大の分水嶺になる。
コンプライアンスの要件が厳しく、顧客の個人情報や未公開の財務データを扱う経理部門のシステムにAIを組み込むなら、オンプレミスで動かせるMistralは有力な候補である。
逆に、社内規定が緩く、とにかく手軽に高精度なテキスト生成を求めるなら、素直に外部APIを使ったほうが早い。
自社でGPUサーバーを調達し、モデルを保守する運用コストは決して安くない。初期投資と長期的なAPI利用料を天秤にかけ、ROIをどう弾き出すか。技術トレンドに流されず、冷徹に計算機資源の台所事情と向き合う必要がある。

当社の見解

当社は機密情報のマスキング処理を全てローカルAIで行っている。これにより機密情報を外部に送信せずにAI処理できるようになった。だが、AIが嘘をつくハルシネーションの問題は依然としてある。確認していないのに「確認しました」と言う。当社はこの前提で運用を設計している。事実と推測の強制分離、ファクトチェック機能、3つのAIと人間の同士の三重検証を行っている。どこまでいっても、AIは完璧ではない。理論上100%安全設計をしていても、AIも人間も想定しないことは起こるものだ。その万が一に備えておくことが、AIを使う上では前提になっている。だろうではなく、かもしれない運用がAIを使う上での安全基盤となっている。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する