Anthropic lansează Claude Opus 4.7: Cum să îl încerci, benchmark-uri și siguranță
În 2026, Anthropic a lansat produse și a făcut știri la un ritm alert, iar joi, compania de inteligență artificială a anunțat lansarea lui Claude Opus 4.7. Acesta este cel mai inteligent model disponibil publicului larg. Potrivit mashable.com, Anthropic a menționat că Opus 4.7 nu este la fel de puternic ca Claude Mythos, considerat prea periculos pentru a fi lansat public.
👉 Caracteristici și accesibilitate ale modelului Claude Opus 4.7
Claude Opus este o familie de modele hibride de raționament, capabile de raționamente complexe și programare avansată. Până la anunțul lui Claude Mythos pe 7 aprilie, Claude Opus era considerat cea mai avansată serie de modele AI ale Anthropic.
👉 Modalități de utilizare și optimizare pentru Claude Opus 4.7
Claude Opus 4.7 este disponibil acum prin Claude AI, API-ul Claude și partenerii Anthropic, precum Microsoft Foundry. Prețul noului model este același cu cel al lui Claude Opus 4.6. Anthropic a subliniat că, deoarece „Opus 4.7 gândește mai mult la niveluri superioare de efort”, utilizează mai multe token-uri de ieșire decât predecesorul său. Utilizatorii pot citi mai multe despre cum să optimizeze utilizarea token-urilor în ghidul de migrare pentru Opus 4.7.
Așa cum era de așteptat, Claude Opus 4.7 oferă capabilități îmbunătățite în toate domeniile. În special, Anthropic afirmă că Opus 4.7 este mai bun la sarcinile de programare avansată, inteligență vizuală și analiză de documente. De asemenea, compania susține că Opus 4.7 este „mai rafinat și creativ atunci când finalizează sarcini profesionale, producând interfețe, prezentări și documente de o calitate mai înaltă”.
"Utilizatorii raportază că pot delega cele mai dificile sarcini de programare — cele care anterior necesitau supraveghere atentă — lui Opus 4.7 cu încredere. Opus 4.7 gestionează sarcini complexe și de lungă durată cu rigoare și consistență, acordă atenție precisă instrucțiunilor și găsește modalități de a verifica propriile rezultate înainte de a raporta." se menționează într-un articol pe blogul Anthropic.
👉 Benchmark-uri comparativ cu alte modele AI de top
Anthropic a publicat un card detaliat al modelului care arată cum Claude Opus 4.7 se compară cu alte modele Anthropic și modele de vârf de la OpenAI, Google și xAI. Opus 4.7 este mai puțin capabil decât Claude Mythos, care, conform Anthropic, obține scoruri semnificativ mai mari la benchmark-uri comune precum Examenul Ultim al Umanității. "Claude Opus 4.7 este mai puțin capabil decât Claude Mythos Preview pe toate axele relevante pe care le-am măsurat și nu avansează frontiera noastră de capacitate," se afirmă în cardul modelului.
„Asta înseamnă că Claude Opus 4.7 nu este o dovadă că dezvoltarea AI a accelerat peste liniile de trend existente.” Pe Examenul Ultim al Umanității (fără instrumente), Anthropic raportează că Claude Opus 4.7 depășește toate celelalte modele de vârf, cu excepția lui Claude Mythos.
- Claude Mythos a obținut 56.8% la HLE
- Claude Opus 4.7 a obținut 46.9%
- Gemini 3.1 Pro a obținut 44.4%
- GPT-5-4 Pro a obținut 42.7%
- Claude Opus 4.6 a obținut 40.0%
Când s-au folosit instrumente, GPT-5-4-Pro a obținut 58.7% comparativ cu 54.7% pentru Opus 4.7. Mythos le-a depășit pe ambele cu 64.7%. Mashable nu a verificat independent aceste rezultate de benchmark. Rezultatele complete sunt disponibile în cardul modelului Opus 4.7.
👉 Profilul de siguranță și reducerea halucinațiilor
Anthropic raportează de asemenea că Opus 4.7 prezintă un risc scăzut de comportamente nealiniate, având un profil de risc similar cu cel al lui Opus 4.6. De exemplu, Anthropic afirmă că Opus 4.7 este mai puțin predispus la halucinații și are rate mai scăzute de hacking al recompenselor. "Claude Opus 4.7 este mai onest în mod fiabil decât Opus 4.6 sau Sonnet 4.6, cu reduceri mari în rata omisiunilor importante și îmbunătățiri moderate în factualitate și în ratele de intrări halucinate," afirmă cardul modelului.
Dorești să afli mai multe despre cum să obții cele mai bune rezultate din tehnologia ta?