La société Anthropic a récemment lancé Claude Opus 4.8, une version améliorée de son modèle précédent, déployée environ un mois et demi après la version 4.7. Ce nouvel assistant numérique est conçu pour être plus performant dans les tâches professionnelles complexes, avec une logique affinée et une stabilité renforcée.
Autonomie accrue et réduction des erreurs d’information
Claude Opus 4.8 se distingue par sa capacité à fonctionner de manière autonome sur des périodes prolongées sans intervention humaine. Il gère efficacement les tâches à étapes multiples et maintient un mode autonome dans des scénarios complexes.
Les premiers utilisateurs ont remarqué que le système exprime plus souvent son incertitude dans ses réponses, fournissant ainsi moins d’informations non vérifiées. Cette caractéristique diminue le risque de « hallucinations » et rend les résultats plus fiables pour une utilisation pratique.
Amélioration des performances mesurables
Anthropic rapporte une amélioration significative des performances par rapport à la version précédente :
- Programmation autonome : augmentation de 64,3% à 69,2%
- Raisonnement multi-profils : progression de 54,7% à 57,9%
- Tâches intelligentes : passage de 1753 à 1890 points
- Analyse financière : amélioration de 51,5% à 53,9%
- Utilisation autonome de l’ordinateur : légère hausse de 82,8% à 83,4%
A noter également que le « mode rapide » est désormais environ 2,5 fois plus rapide tout en étant trois fois moins coûteux pour les développeurs.
Nouveaux outils pour une intégration optimisée
Avec cette mise à jour, Anthropic a introduit plusieurs innovations dans son écosystème :
- Dynamic workflows : fonctionnalité expérimentale permettant au modèle de gérer des processus encore plus complexes et longs dans Claude Code.
- Effort control : nouvel outil sur la version web qui régule l’utilisation des ressources informatiques pour équilibrer vitesse et qualité.
- Mise à jour du Messages API : permet désormais de modifier les instructions système directement dans le flux de messages pour une intégration plus flexible sans perturber le cache des requêtes.
