Type something to search...
Anthropic dévoile Claude Sonnet 4.5, plus avancé

Anthropic dévoile Claude Sonnet 4.5, plus avancé


Introduction

Anthropic, l’un des acteurs majeurs de l’intelligence artificielle, a annoncé la sortie de Claude Sonnet 4.5, présenté comme le meilleur modèle de codage au monde et un bond important pour la construction d’agents autonomes et l’utilisation ordinateur par l’IA. La sortie s’accompagne d’une série d’améliorations produits (Claude Code, extension VS Code, checkpoints, SDK d’agents) et d’un ensemble d’outils pour permettre aux développeurs de tirer parti des nouvelles capacités. L’entreprise met l’accent sur la performance en codage, l’endurance sur longues tâches et l’alignement / sécurité renforcée.


Ce que Sonnet 4.5 apporte
  • Performance en codage : Sonnet 4.5 domine les évaluations SWE-bench Verified et affiche des gains importants sur les tâches réelles de programmation et d’édition de code.
  • Capacité d’endurance : Anthropic rapporte que le modèle peut maintenir la concentration sur des tâches longues — plus de 30 heures sur des scénarios multi-étapes — ce qui change la donne pour les agents persistants.
  • Utilisation ordinateur : Sonnet 4.5 progresse fortement sur OSWorld (benchmark d’usage réel d’un ordinateur), atteignant désormais 61,4% contre 42,2% quelques mois plus tôt.
  • Écosystème et features produit : Checkpoints dans Claude Code, éditeur terminal rafraîchi, extension native VS Code, exécution de code et création de fichiers directement dans la conversation Claude, et la disponibilité de Claude for Chrome pour certains utilisateurs.

image


Nouvelles fonctionnalités produit

Checkpoints & expérience développeur

Claude Code reçoit des checkpoints — sauvegardes d’état qui permettent de revenir instantanément à un point antérieur — et un terminal repensé. Ces éléments facilitent l’expérimentation itérative et diminuent le risque de perte de travail lors de sessions longues d’agent-codage.


Context editing & memory tool pour agents

La nouvelle fonction d’édition de contexte et l’outil de mémoire dans l’API permettent aux agents de gérer des tâches encore plus longues et complexes, en conservant et en modifiant le contexte de façon structurée. C’est un levier clé pour l’endurance annoncée du modèle.


Claude Agent SDK

Anthropic publie le Claude Agent SDK, soit l’infrastructure utilisée pour construire Claude Code. Le SDK fournit des primitives pour la gestion mémoire, la coordination de sous-agents, et les systèmes de permission — des briques essentielles pour bâtir des agents robustes en production.


Imagine with Claude

Un aperçu de recherche, Imagine with Claude, montre le modèle générant des logiciels en temps réel (pas de code préécrit) — une démonstration de la capacité de Sonnet 4.5 à créer des outils et applications à la volée. Cette expérience a été ouverte temporairement aux abonnés Max.


Performances et benchmarks

Anthropic publie des résultats détaillés :

  • SWE-bench Verified : Sonnet 4.5 obtient des scores de premier plan (les tests rapportés indiquent 77.2% sous certaines configurations) et des procédures internes (échantillonnage parallèle, rejeu et scoring interne) permettent d’optimiser les résultats pour des configurations high compute.
  • OSWorld : Progrès majeur sur des tâches de type “utiliser un ordinateur” (61.4% actuellement), traduisant la capacité à naviguer, remplir des feuilles de calcul et exécuter des suites d’actions complexes.
  • Gains évalués aussi en raisonnement, mathématiques et performances spécialisées pour la finance, le droit, la médecine et le STEM selon les évaluations internes et retours clients.

image


image


Sécurité et alignement : ASL-3 et classificateurs

Anthropic positionne Sonnet 4.5 comme le modèle frontier le plus aligné à ce jour :

  • Réduction des comportements problématiques (sycophancy, tromperie, recherche de pouvoir, encouragements à la délires).
  • Mécanismes ASL-3 : Sonnet 4.5 est déployé sous le cadre AI Safety Level 3, avec des classificateurs destinés à détecter des entrées/sorties potentiellement dangereuses (notamment risques CBRN). Ces protections peuvent parfois générer des faux positifs ; Anthropic indique cependant avoir réduit ces faux positifs d’un facteur 10 depuis leur description initiale, et d’un facteur 2 depuis Opus 4.
  • Atténuation : Lorsqu’une conversation est interrompue par un classificateur, Anthropic propose de continuer sur Sonnet 4 (moins sensible) et offre des processus d’allowlist pour industries ayant des besoins spécifiques (cybersécurité, recherche biologique).

image


Disponibilité et tarification
  • Disponibilité : Sonnet 4.5 est disponible partout dès aujourd’hui via l’API Claude (claude-sonnet-4-5) et intégré dans les produits (Claude Code, apps Claude).
  • Plateformes partenaires : Amazon Bedrock, Google Vertex AI, GitHub Copilot (aperçu public), Vercel, … — large diffusion pour faciliter l’intégration en entreprise.
  • Tarification : Anthropic indique que le prix reste inchangé par rapport à Sonnet 4 : 3$ / 15$ par million de tokens (selon la configuration tarifaire annoncée).

Note : Prix en USD avant les taxes applicables.


Limites & points de vigilance
  • Faux positifs des classificateurs : Bien que réduits, ils peuvent interrompre des usages légitimes et nécessitent des flows opérationnels (fallback, allowlist).
  • Coût & intégration : L’utilisation intensive (1M token context, exécution d’agents en continu) nécessite une réflexion sur coûts et architecture.
  • Tests en production : Les gains en laboratoire doivent être validés dans vos propres scénarios métiers (CI/CD, pipelines, complexité de codebase).

Recommandations pratiques
  1. Pilotez d’abord des cas de codage (automatisation de tests, génération de squelettes, revue de code) pour mesurer les gains.
  2. Exploitez le Claude Agent SDK pour prototyper des agents contrôlés (gestion mémoire, permissions).
  3. Planifiez la gestion des interruptions (classificateurs) : workflows de fallback, allowlists pour secteurs sensibles.
  4. Surveillez les coûts et les configurations contexte (200K vs 1M tokens) selon le besoin en mémoire contextuelle.

Conclusion

Claude Sonnet 4.5 représente une étape importante pour Anthropic : un modèle centré sur le codage, l’agentivité et l’usage prolongé d’un ordinateur par IA, livré avec des outils produits et un SDK pour industrialiser ces capacités. Le modèle combine gains de performance, endurance prolongée et mécanismes de sécurité renforcés (ASL-3 et classificateurs). Pour les équipes d’ingénierie et les organisations cherchant à automatiser des workflows complexes ou à embarquer des agents IA en production, Sonnet 4.5 est une option sérieuse — à piloter en tenant compte des contraintes d’intégration, des coûts et des mécanismes d’atténuation des interruptions de sécurité.


Sources

Anthropic - Claude Sonnet 4.5

Parler avec Claude Sonnet 4.5


Avez-vous apprécié cet article ? Vous avez des questions, commentaires ou suggestions, n’hésitez pas à m’envoyer un message depuis le formulaire de contact.

N’oubliez pas de nous suivre et de partager cet article.

Related Posts

Près de 70% des entreprises du Fortune 500 utilisent Copilot

Près de 70% des entreprises du Fortune 500 utilisent Copilot

Introduction Lors de l'événement Microsoft Ignite 2024, Microsoft a mis en lumière les raisons pour lesquelles près de 70% des entreprises du Fortune 500 utilisent désormais Microsoft 365

Lire la suite
Comment désactiver le libre service sur les licences Copilot

Comment désactiver le libre service sur les licences Copilot

Introduction Microsoft a activé un paramètre dans les tenants (par défaut) pour autoriser n'importe quel utilisateur à s'acheter une licence Microsoft Copilot au travers du portail *Micro

Lire la suite
Mistral Large 24.11 transforme des industries avec l'IA de pointe

Mistral Large 24.11 transforme des industries avec l'IA de pointe

Introduction Microsoft a récemment annoncé le lancement de Mistral Large 24.11, un modèle de langage avancé (LLM) disponible dans le catalogue de modèles Azure AI. Cette nouvelle version

Lire la suite
Qualité vidéo Teams améliorée avec la Super Résolution

Qualité vidéo Teams améliorée avec la Super Résolution

Introduction Microsoft continue d'innover pour offrir aux utilisateurs la meilleure expérience possible en matière de communication virtuelle. L'une des dernières avancées est l'introductio

Lire la suite
Le Chat by Mistral AI, votre assistant IA personnel

Le Chat by Mistral AI, votre assistant IA personnel

Introduction Je vous parlais en Décembre dernier de l'IA française, Mistral AI, le modèle le plus populaire en Europe dans lequel Microsoft a investi 15 millions d'euros dans la startup.

Lire la suite
Nouveaux Yealink MeetingBoard 65 et 85 pour les salles Teams

Nouveaux Yealink MeetingBoard 65 et 85 pour les salles Teams

Introduction Les nouveaux Yealink MeetingBoard 65 et 85 sont une solution innovante et complète conçue pour transformer les salles de réunion en espaces de collaboration intelligents. Ces

Lire la suite
Maximisez l'utilisation de la galerie de prompts Copilot

Maximisez l'utilisation de la galerie de prompts Copilot

Introduction Microsoft 365 Copilot continue de révolutionner la manière dont les entreprises travaillent en intégrant des capacités d'intelligence artificielle avancées dans leurs outils

Lire la suite
Comment démarrer avec Copilot dans Excel

Comment démarrer avec Copilot dans Excel

Introduction Microsoft 365 Copilot est une innovation majeure qui intègre l'intelligence artificielle directement dans les applications que vous utilisez quotidiennement, comme Excel. Cop

Lire la suite
Microsoft Purview pour Azure Data Lake et Blob Storage

Microsoft Purview pour Azure Data Lake et Blob Storage

Introduction Microsoft a annoncé que les politiques de protection Microsoft Purview pour Azure Data Lake et Blob Storage sont désormais disponibles dans toutes les régions. Cette avan

Lire la suite
Facilitator, nouvel agent IA pour la prise de notes en réunion

Facilitator, nouvel agent IA pour la prise de notes en réunion

Introduction Microsoft a récemment annoncé une nouvelle fonctionnalité pour les salles Teams Rooms : Facilitator ; un agent IA qui prend des notes pendant les réunions Teams. Cette foncti

Lire la suite
Enterprise Connect 2025 : Kit Yealink SkySound CM50 Dante

Enterprise Connect 2025 : Kit Yealink SkySound CM50 Dante

Introduction L'évenement Enterprise Connect est une conférence annuelle qui réunit des professionnels des technologies de la communication, des innovateurs, ... Lors de cet événement, son

Lire la suite
Mistral OCR, nouvelle référence en reconnaissance de caractères

Mistral OCR, nouvelle référence en reconnaissance de caractères

Introduction En Mars 2025, Mistral AI a annoncé le lancement de Mistral OCR, une API de reconnaissance optique de caractères (OCR) qui établit une nouvelle norme en matière de compréhen

Lire la suite
Présentation de la Logitech Rally Board 65

Présentation de la Logitech Rally Board 65

Introduction La Logitech Rally Board 65 est une solution de visioconférence tout-en-un conçue pour simplifier les réunions et la collaboration dans les environnements professionnels. Avec

Lire la suite
Mistral Code, l’assistant de développement IA européen

Mistral Code, l’assistant de développement IA européen

Introduction La startup française Mistral AI, déjà reconnue pour ses modèles de langage open source, vient de dévoiler Mistral Code, un assistant de développement intelligent conçu pour l

Lire la suite
Anthropic dévoile Claude 4, l'IA plus puissante et plus endurante

Anthropic dévoile Claude 4, l'IA plus puissante et plus endurante

Introduction Dans un marché de l’intelligence artificielle dominé par OpenAI, Google et Microsoft, Anthropic continue de tracer sa propre voie. Avec le lancement de la famille *Clau

Lire la suite
Nouvelle Yealink MeetingBar A50 pour les salles Teams

Nouvelle Yealink MeetingBar A50 pour les salles Teams

Introduction Dans un monde du travail de plus en plus hybride, les entreprises cherchent des solutions de visioconférence à la fois puissantes, simples à déployer et parfaitement intégrées

Lire la suite
Mercedes-Benz, votre voiture devient un bureau roulant

Mercedes-Benz, votre voiture devient un bureau roulant

Introduction Dans un marché automobile de plus en plus tourné vers la mobilité intelligente et connectée, Mercedes-Benz fait un pas de géant. Avec la nouvelle génération du modèle CLA,

Lire la suite
Anthropic dévoile Claude Opus 4.1, plus rapide et fiable

Anthropic dévoile Claude Opus 4.1, plus rapide et fiable

Introduction Anthropic, l’un des acteurs majeurs de l’intelligence artificielle, a annoncé la sortie de Claude Opus 4.1, une mise à jour significative de son modèle phare (*Claude Opus

Lire la suite
OpenAI dévoile GPT-5, son dernier modèle plus intelligent

OpenAI dévoile GPT-5, son dernier modèle plus intelligent

Introduction OpenAI vient de franchir une nouvelle étape dans l’évolution de l’intelligence artificielle avec le lancement de GPT-5, son modèle de langage le plus puissant à ce jour. Co

Lire la suite
Quoi de neuf pour Copilot en Août 2025

Quoi de neuf pour Copilot en Août 2025

Introduction Microsoft publie chaque mois un récapitulatif des évolutions de Microsoft 365 Copilot pour tenir administrateurs et utilisateurs à jour des fonctions qui améliorent la produc

Lire la suite