Phi

PHI
読み: ファイ

読み: ファイ

Phiとは軽量高性能な言語モデル

Microsoftが開発したスマートフォンやPCなどの端末上でも高速かつ安全に動作する小規模かつ高性能な言語モデル。数十億のパラメータ数に抑えながら高度な推論能力を持つ。

かんたんに言うと

巨大な図書館を丸暗記した凡人ではなく、質の高い専門書だけを読み込んで育った少数精鋭の秀才。軽量なため、限られた環境でも頭の回転が速い。

巨大モデルのコスト問題を解決するために小型化に振り切ったPhiの設計思想

LLMのパラメータ数は膨張し続けている。GPT-4やClaude 3 Opusのような巨大モデルは確かに賢いが、APIレイテンシトークン単価の高さに頭を抱える現場は非常に多い。ここでMicrosoftが投入したのがPhiである。パラメータ数を数十億規模に抑えたSLMとして設計されている。なぜ今、わざわざモデルを小さくするのか。現場で求められるのは、何でも知っている巨大な脳髄ではなく、特定の業務を素早く正確にこなす手足だからである。無駄な知識を削ぎ落とし、応答速度に全振りしたこのアプローチは、実務の痛点をよく理解している。

質の低いウェブデータを見限った学習アプローチ

Transformerベースのモデルは、とにかく大量のデータを食わせれば性能が上がると思われてきた。だがPhiの開発陣はTextbooks Are All You Needという論文でその常識を覆した。Redditのノイズだらけの会話やスパムサイトのテキストを排除し、教科書品質のクリーンなデータだけを厳選して学習させている。ゴミを入れればゴミが出る。この原則に立ち返り、パラメータ数を削りながらも推論精度を維持するアプローチは、実務家から見ても非常に理にかなっている。ただ、特定のドメインに特化しすぎた結果、どこまで汎用性を担保できるかは判断が分かれるところである。

製造ラインと法務部門で活きるローカル動作の強み

例えば製造業の工場ネットワーク。外部のクラウドに接続できない閉域網で、設備のエラーログを解析させたい場合、API型のLLMは使えない。ここでOllamaLM Studioを使ってPhiをエッジコンピューティング環境にデプロイする。数年前のGPUを積んだ産業用PCでもサクサク動く。法務部門の契約書チェックも同様である。機密の塊である未発表の契約書を外部サーバーに投げるリスクは冒せない。Hugging Faceからモデルを落とし、社内のオンプレミス環境で動かす。Azure AI Studio経由でセキュアに構築する手もあるが、完全なオフライン環境で動かせる身軽さこそがPhiの真骨頂である。

GPT-4の代役にはならないという冷酷な現実

コストが下がり、データ漏洩のリスクも減る。良いことずくめに聞こえるが、現場の落とし穴はここにある。Phiに複雑な論理展開や複数ドキュメントの横断的な要約を求めると、途端に破綻する。GPT-4なら空気を読んで補完してくれる曖昧なプロンプトも、Phiには通用しない。用途を極端に絞り、プロンプトを極限までチューニングする泥臭い作業が待っている。この手間をかけてでもランニングコストを削るべきか。プロジェクトの予算と相談するしかないが、多くの場合、初期設定の難易度に心が折れる。安易に乗り換えると痛い目を見る。

クラウド依存から脱却する覚悟はあるか

結局のところ、Phiを選ぶ理由はとデータガバナンスに尽きる。コンプライアンス要件が厳しく、どうしてもオンプレミスで動かさざるを得ない経理の財務データ処理などには見事にハマる。だが、運用にはインフラの知識が問われる。APIキーを叩くだけの生活に戻りたくなる瞬間は必ず来る。自社でモデルをホスティングし、バージョン管理やリソース監視をやり切る体制が組めるのか。単なる技術的な興味で手を出すと、運用フェーズで確実に火傷する。自社のエンジニアリング能力と天秤にかける、悩ましい選択である。

当社の見解

当社は機密情報のマスキング処理を全てローカルAIで行っている。これにより機密情報を外部に送信せずにAI処理できるようになった。だが、AIが嘘をつくハルシネーションの問題は依然としてある。確認していないのに「確認しました」と言う。当社はこの前提で運用を設計している。事実と推測の強制分離、ファクトチェック機能、3つのAIと人間の同士の三重検証を行っている。どこまでいっても、AIは完璧ではない。理論上100%安全設計をしていても、AIも人間も想定しないことは起こるものだ。その万が一に備えておくことが、AIを使う上では前提になっている。だろうではなく、かもしれない運用がAIを使う上での安全基盤となっている。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する