
있게 처리한다. 벤치마크 결과, 에이전트 코딩 성능을 측정하는 ‘SWE-bench Pro’에서 64.3%를 기록해 GPT-5.4(57.7%)와 제미나이 3.1 프로(54.2%) 등 비교군 모델들을 앞질렀다. 깃허브(GitHub) 테스트에서는 오퍼스 4.6이나 소네트 4.6이 해결하지 못한 과제를 포함해 해결률이 13% 향상됐다. 라쿠텐(Rakuten)은
当前文章:http://bbcpp.yueduge.cn/su0d72/l9o51.html
发布时间:04:11:03