La course aux agents IA s'intensifie : Claude Sonnet 5, Gemini Spark, Acti et l'agentique au cœur de l'été 2026

La course aux agents IA s’intensifie : Claude Sonnet 5, Gemini Spark, Acti et l’agentique au cœur de l’été 2026

💡 En résumé

L’actualité IA du début juillet 2026 est massivement dominée par l’agentique. En quelques jours, trois annonces majeures redessinent le paysage : Anthropic lance Claude Sonnet 5, un modèle milieu de gamme aux capacités agentiques proches de l’Opus 4.8 pour une fraction du coût ; Google déploie Gemini Spark sur Mac, étendant son assistant agentique 24/7 au desktop ; et Acti, une start-up portée par d’anciens de Baidu, transforme le clavier du smartphone en interface agentique. Parallèlement, X lance un serveur MCP hébergé pour que les IA puissent interagir avec la plateforme, et arXiv publie une vague de papers sur la sécurité, la vérification et l’évolution des agents. Le message est clair : les agents IA ne sont plus une promesse — ils sont le champ de bataille concurrentiel de l’été 2026.

🔥 Tendances : l’agentique devient le nouveau standard

Claude Sonnet 5 : l’agentique à portée de budget

Le 30 juin, Anthropic a dévoilé Claude Sonnet 5, son nouveau modèle milieu de gamme. La performance clé : 63,2% en agentic coding contre 69,2% pour Opus 4.8, et des résultats légèrement supérieurs sur les tâches de connaissance. Mais le vrai changement est le prix : 2 $/M tokens input, 10 $/M output (tarif d’introduction jusqu’au 31 août, puis 3 $/15 $). C’est moins cher que GPT-5.5 et Gemini 3.1 Pro.

« Il peut faire des plans, utiliser des outils comme les navigateurs et les terminaux, et fonctionner de manière autonome à un niveau qui, il y a quelques mois encore, nécessitait des modèles plus grands et plus chers » — Anthropic.

Zapier confirme : « Nous avons donné à Claude Sonnet 5 un travail en deux parties — mettre à jour les niveaux de comptes Salesforce, envoyer une annonce de lancement aux contacts enterprise — et il l’a terminé de bout en bout. Avant, ça calait à mi-chemin. »

Anthropic Claude Sonnet 5

Notre analyse : Anthropic positionne Sonnet 5 comme le modèle agentique par défaut. Opus reste pour la haute précision, mais Sonnet 5 démocratise l’automatisation agentique — le marché des développeurs et des PME qui n’avaient pas le budget pour Opus.

Gemini Spark arrive sur Mac

Google a rendu Gemini Spark disponible sur macOS via l’application desktop existante. L’assistant agentique 24/7 de Google peut désormais :

  • Trier et organiser des fichiers sur le Mac
  • Utiliser les fichiers comme source pour des documents Google Workspace
  • S’intégrer à Google Tasks et Google Keep (enfin !)
  • Se connecter à des applications tierces : Canva, Dropbox, Instacart, OpenTable, Zillow
  • Suivre des événements en temps réel (sports, actions, breaking news)
  • Utiliser un Custom MCP pour connecter ses propres applications

Disponible en beta US pour les abonnés Google AI Ultra. La fonction multi-appareils (tâche depuis le téléphone → agent desktop) arrive « bientôt ».

« Gemini Spark 24/7 AI agent. Now on Mac. » — Google

Acti : le clavier devient agentique

La start-up Acti (contraction de « action ») a lancé son clavier agentique sur iOS et Android. Le concept est radical : au lieu d’ouvrir un chatbot, l’agent vit dans le clavier et peut agir dans n’importe quelle application. Les utilisateurs créent des « Skills » (raccourcis) en langage naturel — pas de code nécessaire.

  • Seed funding : 5,3 M$ mené par BITKRAFT Ventures
  • Équipe : Young Wang (CEO, 10 ans chez Baidu, 300M+ utilisateurs pour Facemoji), Mike Sun (CTO)
  • Modèle : Google Gemini (choisi pour équilibre intelligence/vitesse/coût)
  • Privacy : contexte local par défaut, chiffrement de bout en bout
  • Skill Hub : plus de 1 000 Skills créés par la communauté en deux semaines
  • Modèle économique : abonnement pour usages avancés

« Les agents IA d’aujourd’hui sont fondamentalement limités car le contexte utilisateur reste fragmenté entre les applications. Acti se place au-dessus de toutes, ce qui nous permet de construire une couche de contexte qui appartient vraiment à l’utilisateur. » — Young Wang, CEO

Acti Agentic Keyboard

X (Twitter) lance un serveur MCP hébergé

Le 30 juin, X a dévoilé un serveur Model Context Protocol (MCP) hébergé, permettant aux agents IA (Claude, Cursor, Grok Build) de se connecter directement à la plateforme pour :

  • Rechercher et lire des posts
  • Analyser des conversations et tendances
  • Interagir via les permissions du compte utilisateur

Restriction clé : pas d’accès en écriture — X ne permet pas le posting autonome, après une année 2026 marquée par la lutte contre le spam IA. Le coût par post publié est désormais de 0,015 $ (0,20 $ avec lien).

X rejoint GitHub, Slack, Notion, Stripe et Salesforce dans la liste des plateformes proposant un serveur MCP. L’interopérabilité agentique devient un standard.

La vague arXiv : la recherche agentique explose

Le batch du 2 juillet 2026 d’arXiv apporte 50 papiers cs.AI et 44 papiers cs.LG — avec une concentration remarquable sur la thématique agentique :

PapierFocusContribution
Self-Evolving Agents (SEA)Évolution autonomeArchitecture avec base model gelé + adaptateur + anytime-valid gate pour certificats auditable. +4 à +5 points sur SWE-bench sans régression.
Making Failure SafeSécurité agentiqueFramework contraint et vérifiable pour la collecte de données web par agents.
MnemosyneWorkflows agentiquesTraitement transactionnel pour valider et réparer les workflows générés par IA.
Self-GCContexte longAuto-gouvernance du contexte pour agents longue durée.
Can Agents Generalize?RobustesseLa fragilité de l’entraînement statique dans l’utilisation d’outils.
BaRACollecte webAgent BFS + réflexion pour collecte de données web.
Agri-SAGEAgents spécialisésMulti-agents LLM pour conseil agricole contextualisé.
EPCÉvaluationProtocole standardisé pour mesurer les dynamiques de préférence des évaluateurs dans les systèmes multi-agents.

Cette concentration de recherche sur la vérification, la sécurité et l’évolution des agents confirme que la phase d’exploration est derrière nous : on entre dans la phase d’industrialisation.

📊 Analyse : trois forces convergent

1. Disponibilité agentique = nouveau champ de bataille

Claude Sonnet 5, Gemini Spark, GPT-5.6 Sol (OpenAI) : tous les grands modèles sont désormais agent-ready. Le critère de différenciation n’est plus la capacité (tout le monde fait des plans et utilise des outils) mais le coût et la fiabilité sans supervision humaine. Anthropic frappe fort avec Sonnet 5 à 2$/10$ par million de tokens — un prix qui rend l’automatisation agentique viable pour la première fois à grande échelle.

2. L’interface agentique se diversifie

Trois paradigmes émergent simultanément :

  1. Desktop agent (Gemini Spark, Claude Desktop) — l’agent dans l’OS
  2. Keyboard agent (Acti) — l’agent dans le geste le plus universel
  3. Platform agent (X MCP) — l’agent comme couche d’interopérabilité

Cette diversité suggère qu’il n’y aura pas un point d’entrée unique pour les agents, mais une multiplicité d’interfaces selon le contexte d’usage.

3. La vérification devient le sujet critique

Les papers arXiv de cette semaine sont un signal fort : la recherche ne porte plus sur « comment construire un agent » mais sur « comment s’assurer qu’il fait ce qu’on attend ». SEA avec ses certificats anytime-valid, Making Failure Safe avec son framework vérifiable, Can Agents Generalize? questionnant la robustesse — tous convergent vers le même constat : le déploiement d’agents en production nécessite des garanties formelles.

🎯 À retenir

  1. Claude Sonnet 5 démocratise l’agentique : performances proches d’Opus 4.8 pour 3× moins cher. Le modèle agentique par défaut est né.
  2. Gemini Spark sur Mac et Acti keyboard étendent l’agentique à tous les écrans — desktop et mobile.
  3. X MCP Server montre que l’interopérabilité agentique (MCP) devient un standard de plateforme.
  4. La recherche arXiv confirme que la priorité académique est passée de la construction à la vérification des agents.
  5. Le coût est désormais le facteur différenciant — les agents IA passent du statut de prouesse technique à celui d’outil économique.

Source d'origine : veille-ia

A lire aussi