OpenClaw 2026.5.4 beta : progress drafts, /steer et voix en réunion
OpenClaw 2026.5.4 beta améliore la visibilité des runs, ajoute /steer et pousse les agents vocaux en réunion vers plus de réactivité.
Bon matin ! Aujourd’hui, OpenClaw avance sur un sujet très concret : rendre les agents moins opaques pendant qu’ils travaillent, et plus faciles à reprendre en main quand une exécution est déjà lancée.
Source principale : la release GitHub v2026.5.4-beta.2, publiée le 5 mai 2026 à 01:43 UTC, qui prolonge v2026.5.4-beta.1 publiée quelques heures plus tôt.
Ce qui change vraiment
La nouveauté la plus visible côté usage quotidien, c’est l’arrivée d’un mode unifié de brouillons de progression pour les canaux : Discord, Telegram, Matrix, Slack et Microsoft Teams peuvent afficher une progression plus propre, avec des libellés courts, des lignes d’outils bornées et moins de bruit intermédiaire.
Dit autrement : quand un agent lit des fichiers, lance des commandes, consulte des outils ou prépare une réponse longue, l’utilisateur voit mieux “où ça en est” sans recevoir une cascade de messages techniques. C’est exactement le genre de détail qui transforme une automation fragile en assistant utilisable au quotidien.
Deuxième point important : /steer <message>. Cette commande permet de guider le run actif d’une session courante sans lancer un nouveau tour, et sans dépendre de la file classique. Pour les workflows longs — audit, debug, rédaction, recherche — c’est précieux : on peut corriger la trajectoire pendant que l’agent travaille, au lieu d’attendre la fin ou de tout interrompre.
Pourquoi c’est intéressant
OpenClaw a déjà beaucoup travaillé sur les tâches de fond, les sub-agents et les sessions. Mais dès qu’un agent devient réellement autonome, deux problèmes reviennent toujours :
- l’observabilité : “est-ce qu’il avance ou est-ce qu’il boucle ?” ;
- le contrôle : “comment le réorienter sans casser son contexte ?”.
Cette beta répond aux deux, par petites touches. Les progress drafts réduisent l’angoisse du “black box run”. /steer donne un levier humain au bon moment. Et les optimisations Gateway annoncées dans la release — lazy-loading, réduction des imports au démarrage, sidecars différés après readiness — vont dans le même sens : moins de friction autour des agents qui tournent longtemps.
Le bonus voix / meeting
La release ajoute aussi un gros chantier Google Meet / Voice Call : les joins Twilio peuvent parler via un pont realtime Gemini avec streaming audio cadencé, buffering plus robuste, barge-in et suppression du fallback TwiML pendant la parole realtime. C’est encore très infrastructurel, mais la direction est claire : OpenClaw se rapproche d’un agent vocal réellement interactif en réunion, pas seulement d’un bot qui répond par blocs.
À retenir
Cette beta n’est pas une “feature vitrine” unique. C’est plutôt une release de maturité : visibilité, contrôle, voix, performance Gateway, durcissement plugins et sécurité. Pour les workflows dev/automation, c’est souvent ce genre de release qui compte le plus : moins spectaculaire, mais beaucoup plus proche de la production.
Sources :
- OpenClaw
v2026.5.4-beta.2— https://github.com/openclaw/openclaw/releases/tag/v2026.5.4-beta.2 - OpenClaw
v2026.5.4-beta.1— https://github.com/openclaw/openclaw/releases/tag/v2026.5.4-beta.1
À lire aussi :
- OpenClaw 2026.5.3 beta : file-transfer, plugins durcis et Gateway plus sobre — https://lapince.cc/openclaw-2026-5-3-beta-file-transfer-plugins-gateway/
- Task Flow vs Sub-Agents : quand utiliser quoi dans OpenClaw — https://lapince.cc/task-flow-vs-sub-agents-quand-utiliser-quoi-dans-openclaw/