Self-Evolving

SELF EVOLVING
読み: セルフエボルビング

読み: セルフエボルビング

Self-EvolvingとはAIの自律的な性能向上

Self-Evolvingとは、AIが人間の介入なしに自らの性能を向上させる仕組みの総称。データレベル(合成データによる自己学習)、行動レベル(Reflexionのようなプロンプトベースの自己改善)、システムレベル(コードの自己書き換え)の3階層がある。

かんたんに言うと

人間が経験を積んで成長するように、AIも使い込むほど賢くなる仕組み。ただし「賢くなる方法」にはデータを自分で作る、失敗を振り返る、自分のコードを書き換える、の3段階がある。

データレベルの自己進化

人間が手作業で作成した学習データに依存せず、AI自身が合成データを大量に生成して自らを再学習させるアプローチ。数百万件の数学の推論プロセスを生成し、正しい答えに辿り着いたプロセスだけを抽出して学習する手法や、AI同士を対戦させて勝率を上げる強化学習(Self-Play)が該当する。
AlphaGoがまさにこの方式で人間のプロ棋士を超えた。LLMの領域でも、合成データによる自己学習は性能向上の主要な手段になりつつある。

行動レベルとシステムレベルの自己改善

行動レベルでは、ReflexionMetaClawのように、モデルの重みを変えずに過去の失敗を分析し、行動ルールやプロンプトを書き換えて推論を改善する。GPUリソースが不要で、APIのやり取りだけでエージェントを賢くできる。
システムレベルでは、AIエージェントが自分自身のコードのバグを発見して修正したり、新機能を追加する。「AIがより効率的なAIのコードを書く」ループ。現時点では研究段階の要素が強いが、Code Agentの進化と合わせて実用化が近づいている。

当社の見解

当社ではClaude Code・Antigravity・Codexの3つのAIエージェントを日常業務で併用している。記憶を共有しているため、別のAIに同じ説明を繰り返す必要がない。ただし、記憶共有だけでは足りなかった。一方のAIが他方の成果物を勝手に修正して壊す事故が起きた。これを受けてファイル所有権制度を導入し、どのAIがどのファイルを所有するかを定義した。AIの自主性に頼らず、仕組みで上書きや巻き戻りを防いでいる。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する