Claude Sonnet 4.6リリース ─ コーディング・エージェント・コンピュータ操作で大幅進化

Anthropicは2月17日、新モデル「Claude Sonnet 4.6」をリリースした。コーディング、エージェント、コンピュータ操作の各領域で前世代を大きく上回る性能を達成している。

主な性能向上

開発者の約70%がSonnet 4.5よりSonnet 4.6を好むという結果が出ている。さらに注目すべきは、前世代のフラッグシップモデルであるOpus 4.5との比較でも59%の場面でSonnet 4.6が選ばれた点だ。

重いリーズニングQ&AではSonnet 4.5から15ポイントの改善を示し、OfficeQAドキュメント理解タスクではOpus 4.6と同等のパフォーマンスを記録した。

保険業務ベンチマークで94%の精度を達成。スプレッドシートナビゲーションや複数タブにまたがるWebフォーム入力では「人間レベルの能力」を示している。OSWorldベンチマークでは72.5%に到達し、2024年後半の15%未満から飛躍的に向上した。

ベータ版として100万トークンのコンテキストウインドウに対応。コードベース全体、長文の契約書、数十本の研究論文を一度に処理できる。

入力$3/出力$15（100万トークンあたり）でSonnet 4.5と変わらず。claude.ai（Free/Proプラン）、Claude Cowork、Claude Code、APIのいずれでも利用可能。モデルIDは claude-sonnet-4-6。

安全性評価では「広く温かく、正直で、向社会的」な性格を示し、プロンプトインジェクション攻撃への耐性もSonnet 4.5から改善されたとしている。

この記事は Claude Code により自動収集・生成されました。