Înapoi la știri

Anthropic lansează Claude Opus 4.7: Cum să îl încerci, benchmark-uri și siguranță

1 oră în urmă
6 minute min
Maria Simionescu
Anthropic lansează Claude Opus 4.7: Cum să îl încerci, benchmark-uri și siguranță

În 2026, Anthropic a lansat produse și a făcut știri la un ritm alert, iar joi, compania de inteligență artificială a anunțat lansarea lui Claude Opus 4.7. Acesta este cel mai inteligent model disponibil publicului larg. Potrivit mashable.com, Anthropic a menționat că Opus 4.7 nu este la fel de puternic ca Claude Mythos, considerat prea periculos pentru a fi lansat public.

👉 Caracteristici și accesibilitate ale modelului Claude Opus 4.7

Claude Opus este o familie de modele hibride de raționament, capabile de raționamente complexe și programare avansată. Până la anunțul lui Claude Mythos pe 7 aprilie, Claude Opus era considerat cea mai avansată serie de modele AI ale Anthropic.

👉 Modalități de utilizare și optimizare pentru Claude Opus 4.7

Claude Opus 4.7 este disponibil acum prin Claude AI, API-ul Claude și partenerii Anthropic, precum Microsoft Foundry. Prețul noului model este același cu cel al lui Claude Opus 4.6. Anthropic a subliniat că, deoarece „Opus 4.7 gândește mai mult la niveluri superioare de efort”, utilizează mai multe token-uri de ieșire decât predecesorul său. Utilizatorii pot citi mai multe despre cum să optimizeze utilizarea token-urilor în ghidul de migrare pentru Opus 4.7.

Așa cum era de așteptat, Claude Opus 4.7 oferă capabilități îmbunătățite în toate domeniile. În special, Anthropic afirmă că Opus 4.7 este mai bun la sarcinile de programare avansată, inteligență vizuală și analiză de documente. De asemenea, compania susține că Opus 4.7 este „mai rafinat și creativ atunci când finalizează sarcini profesionale, producând interfețe, prezentări și documente de o calitate mai înaltă”.

"Utilizatorii raportază că pot delega cele mai dificile sarcini de programare — cele care anterior necesitau supraveghere atentă — lui Opus 4.7 cu încredere. Opus 4.7 gestionează sarcini complexe și de lungă durată cu rigoare și consistență, acordă atenție precisă instrucțiunilor și găsește modalități de a verifica propriile rezultate înainte de a raporta." se menționează într-un articol pe blogul Anthropic.

👉 Benchmark-uri comparativ cu alte modele AI de top

Anthropic a publicat un card detaliat al modelului care arată cum Claude Opus 4.7 se compară cu alte modele Anthropic și modele de vârf de la OpenAI, Google și xAI. Opus 4.7 este mai puțin capabil decât Claude Mythos, care, conform Anthropic, obține scoruri semnificativ mai mari la benchmark-uri comune precum Examenul Ultim al Umanității. "Claude Opus 4.7 este mai puțin capabil decât Claude Mythos Preview pe toate axele relevante pe care le-am măsurat și nu avansează frontiera noastră de capacitate," se afirmă în cardul modelului.

„Asta înseamnă că Claude Opus 4.7 nu este o dovadă că dezvoltarea AI a accelerat peste liniile de trend existente.” Pe Examenul Ultim al Umanității (fără instrumente), Anthropic raportează că Claude Opus 4.7 depășește toate celelalte modele de vârf, cu excepția lui Claude Mythos.

  • Claude Mythos a obținut 56.8% la HLE
  • Claude Opus 4.7 a obținut 46.9%
  • Gemini 3.1 Pro a obținut 44.4%
  • GPT-5-4 Pro a obținut 42.7%
  • Claude Opus 4.6 a obținut 40.0%

Când s-au folosit instrumente, GPT-5-4-Pro a obținut 58.7% comparativ cu 54.7% pentru Opus 4.7. Mythos le-a depășit pe ambele cu 64.7%. Mashable nu a verificat independent aceste rezultate de benchmark. Rezultatele complete sunt disponibile în cardul modelului Opus 4.7.

👉 Profilul de siguranță și reducerea halucinațiilor

Anthropic raportează de asemenea că Opus 4.7 prezintă un risc scăzut de comportamente nealiniate, având un profil de risc similar cu cel al lui Opus 4.6. De exemplu, Anthropic afirmă că Opus 4.7 este mai puțin predispus la halucinații și are rate mai scăzute de hacking al recompenselor. "Claude Opus 4.7 este mai onest în mod fiabil decât Opus 4.6 sau Sonnet 4.6, cu reduceri mari în rata omisiunilor importante și îmbunătățiri moderate în factualitate și în ratele de intrări halucinate," afirmă cardul modelului.

Dorești să afli mai multe despre cum să obții cele mai bune rezultate din tehnologia ta?

Alte postari din Economie
Economie

Cum a realizat Anthropic că Mythos era prea periculos pentru mediul exterior

Compania de inteligență artificială a avertizat prin propriii experți că Mythos ar putea să pătrundă în sistemele de bază ale majorității computerelor moderne. Băncile și agențiile guvernamentale se grăbesc să evalueze amenințarea, potrivit bloomberg.com.

Economie

160 de locuri de muncă disponibile în Vrancea

Potrivit vrancea24.ro, Agenția Județeană pentru Ocuparea Forței de Muncă Vrancea anunță că, în prezent, sunt disponibile 160 de locuri de muncă, oferite de agenți economici și instituții publice. Această oportunitate vine într-un context în care cererea de forță de muncă este tot mai mare în diferite domenii.

Economie

ANOFM demarează proiectul „SMART SPO” pentru modernizarea serviciilor de ocupare

Agenția Națională pentru Ocuparea Forței de Muncă a lansat proiectul „SMART SPO – Servicii moderne, accesibile și pregătite pentru viitor”, cu un buget de 183 milioane euro, finanțat prin Programul Educație și Ocupare 2021–2027. Proiectul, care are ca termen de finalizare 31 decembrie 2029, vizează adaptarea serviciilor publice la necesitățile actuale ale pieței muncii, conform informațiilor prezentate de vrancea24.ro.

Acasa Recente Radio Județe