Inference Time Computeとは
INFERENCE TIME COMPUTE
読み: Inference-Time Compute
Inference Time Computeとは、AIが回答を生成する際、その場で思考時間を追加して計算資源を投入する手法を指す
読み: Inference-Time Compute
回答を出す前に試行錯誤や推論のプロセスを挟むことで、複雑な課題に対する精度を高める技術である。
