Passer au contenu principal
Le Rédacteur vocal (VocalRedactionAgent) transforme une directive de réflexion en courtes phrases oralisables, chacune destinée à devenir un message vocal (voice note) via la synthèse vocale. Là où le RedactionAgent écrit comme on tape au clavier, le Rédacteur vocal écrit comme on parle.

Fonctionnement

  1. L’agent reçoit la directive (du ThinkingAgent en V1, de l’outil send_vocal du ReplyAgent en V2) et la conversation récente.
  2. Il produit de 1 à MaxVocalsPerReply phrases courtes et naturelles (défaut 3), sans emojis ni éléments imprononçables (un nettoyage automatique sert de filet de sécurité). Ce plafond est distinct de MaxMessagesPerReply, qui régit les bulles texte.
  3. Chaque phrase est synthétisée par le service vocal configuré, convertie au format voice note, puis devient un message candidat audio. La durée réelle de l’audio sert ensuite à simuler le temps d’enregistrement lors de l’envoi humanisé.
Cet agent n’a pas de chaîne de validation : les quotas et contrôles du Validateur de rédaction sont pensés pour l’écrit et ne s’appliquent pas à l’oral.

En cas d’échec de synthèse

  • Moteur V1 (intention vocale) : tout échec de synthèse ou de conversion annule l’ensemble de la réponse vocale (aucun vocal partiel) et active l’indicateur d’attention.
  • Moteur V2 : seule la bulle vocale concernée est abandonnée ; le reste de la réponse (textes, médias) est envoyé normalement.
La synthèse vocale exige une configuration valide (fournisseur de voix, clé API, voix attribuée au personnage). Une configuration incomplète est détectée avant toute génération et l’échec est signalé avec la cause exacte.

Configuration

Rendez-vous dans Admin > Chatting Auto > Agents > carte VocalRedactionAgent :
ParamètreDéfautEffet
EnableActivéSi désactivé : en V1, l’intention vocale échoue avec l’indicateur d’attention ; en V2, les bulles vocales sont abandonnées.
MaxVocalsPerReply3Nombre maximal de phrases vocales (notes) par réponse. Distinct de MaxMessagesPerReply, qui plafonne les bulles texte.
MinWordsPerVocal2Longueur minimale d’une phrase vocale (en mots).
MaxWordsPerVocal6Longueur maximale d’une phrase vocale. Des phrases courtes donnent des voice notes plus crédibles.
ExtraStyleGuidanceConsignes de style libres injectées dans le prompt (ex. tics de langage, accent à retranscrire).
La voix elle-même (fournisseur, identifiant de voix) se configure sur le personnage ou dans les paramètres des services vocaux.

Voir aussi