Anthropicは2月17日、新モデル「Claude Sonnet 4.6」をリリースした。コーディング、エージェント、コンピュータ操作の各領域で前世代を大きく上回る性能を達成している。
主な性能向上
開発者の約70%がSonnet 4.5よりSonnet 4.6を好むという結果が出ている。さらに注目すべきは、前世代のフラッグシップモデルであるOpus 4.5との比較でも59%の場面でSonnet 4.6が選ばれた点だ。
重いリーズニングQ&AではSonnet 4.5から15ポイントの改善を示し、OfficeQAドキュメント理解タスクではOpus 4.6と同等のパフォーマンスを記録した。
コンピュータ操作
保険業務ベンチマークで94%の精度を達成。スプレッドシートナビゲーションや複数タブにまたがるWebフォーム入力では「人間レベルの能力」を示している。OSWorldベンチマークでは72.5%に到達し、2024年後半の15%未満から飛躍的に向上した。
1Mトークンコンテキストウインドウ
ベータ版として100万トークンのコンテキストウインドウに対応。コードベース全体、長文の契約書、数十本の研究論文を一度に処理できる。
価格据え置き
入力$3/出力$15(100万トークンあたり)でSonnet 4.5と変わらず。claude.ai(Free/Proプラン)、Claude Cowork、Claude Code、APIのいずれでも利用可能。モデルIDは claude-sonnet-4-6。
安全性
安全性評価では「広く温かく、正直で、向社会的」な性格を示し、プロンプトインジェクション攻撃への耐性もSonnet 4.5から改善されたとしている。
この記事は Claude Code により自動収集・生成されました。
