Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
WorkSpaces Serveur MCP pour applications
Le serveur WorkSpaces Applications MCP est un service entièrement géré qui fournit aux agents d'intelligence artificielle des outils MCP (Model Context Protocol) pour interagir avec les applications de bureau pendant les sessions de streaming. Les agents peuvent cliquer sur des boutons, saisir du texte, faire défiler l'écran et prendre des captures d'écran du bureau.
Présentation de
Lorsque vous activez l'accès des agents sur une pile, les agents peuvent se connecter au serveur MCP géré pour interagir avec les applications de bureau. Le serveur MCP gère la communication entre votre agent et la session de streaming. Votre agent envoie des demandes d'outil MCP et le serveur les exécute sur le poste de travail.
Le serveur MCP est hébergé dans le AWS cloud. Il n'est pas nécessaire d'installer ou de gérer les composants du serveur. Le serveur utilise Streamable HTTP comme protocole de transport.
Connexion au serveur MCP
Les agents se connectent au serveur MCP au point de terminaison suivant :
https://agentaccess-mcp.region.api.aws/mcp
Chaque demande doit inclure les éléments suivants :
-
Signature SigV4 — Toutes les demandes doivent être signées à l'aide des informations d'identification IAM associées au nom du service.
agentaccess-mcp -
En-tête de l'URL de diffusion : l'URL de diffusion de l'
CreateStreamingURLAPI doit être transmise commeX-Amzn-AgentAccess-Streaming-Session-Urlen-tête de chaque demande.
L'exemple Python suivant montre comment se connecter en utilisant mcp-proxy-for-aws :
aws_iam_streamablehttp_client( endpoint="https://agentaccess-mcp.region.api.aws/mcp", aws_service="agentaccess-mcp", aws_region="region", headers={ "X-Amzn-AgentAccess-Streaming-Session-Url": streaming_url, }, )
Pour les autres langages, vous devez écrire votre propre logique de signature pour les requêtes MCP sortantes ou rechercher une bibliothèque disponible qui prend en charge la signature SigV4.
Pour plus d'informations surmcp-proxy-for-aws, consultez mcp-proxy-for-aws
Outils disponibles
Le serveur MCP fournit les outils suivants permettant aux agents d'interagir avec le bureau pendant une session de streaming. Tous les noms d'outils utilisent le agentaccess___ préfixe.
Outils pour souris
left_click-
Effectuez un clic gauche sur les coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire),modifiers(facultatif, par exemplectrlouctrl+shift). double_click-
Effectuez un double clic sur les coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire),modifiers(facultatif). triple_click-
Effectuez un triple clic sur les coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire),modifiers(facultatif). right_click-
Effectuez un clic droit sur les coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire),modifiers(facultatif). middle_click-
Effectuez un clic central sur les coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire),modifiers(facultatif). left_click_drag-
Effectuez un clic gauche pour faire glisser les coordonnées de départ vers les coordonnées de fin.
Paramètres :
start_x(obligatoire),start_y(obligatoire),end_x(obligatoire),end_y(obligatoire). left_mouse_down-
Appuyez sur le bouton gauche de la souris et maintenez-le enfoncé aux coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire),modifiers(facultatif). left_mouse_up-
Relâchez le bouton gauche de la souris aux coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire),modifiers(facultatif). move_pointer-
Déplacez le pointeur sur les coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire). scroll-
Faites défiler la molette de la souris aux coordonnées indiquées.
Paramètres :
x(obligatoire),y(obligatoire),scroll_direction(obligatoire —Up,Down, ouRight)Left,scroll_amount(obligatoire — en ticks, où 120 ticks équivalent à un cran de roue),modifiers(facultatif).
Outils de clavier
type_text-
Tapez du texte en simulant les événements du clavier pour chaque caractère.
Paramètres :
text(obligatoire — jusqu'à 10 000 caractères). key-
Appuyez sur une touche ou une combinaison de touches.
Paramètres :
keys(obligatoire : une seule touche ou combinaison jointe par+, par exempleactrl+c, ouctrl+shift+s). hold_key-
Maintenez une touche ou une combinaison de touches enfoncée pendant une durée spécifiée.
Paramètres :
keys(obligatoire),duration(obligatoire — 1 à 30 secondes).
Outils d'écran
screenshot-
Prenez une capture d'écran du bureau. Les dimensions de l'image renvoyée définissent l'espace de coordonnées de tous les outils de la souris.
Paramètres :
include_cursor(facultatif, la valeur par défaut estfalse).
Frameworks compatibles
Vous pouvez vous connecter au serveur WorkSpaces Applications MCP à partir de n'importe quel framework d' MCP-compatible agents prenant en charge la signature HTTP et SigV4 streamable. Les frameworks suivants ont été testés :
-
SDK Strands Agents
— Fournit un support client MCP natif. -
mcp-proxy-for-aws
— Transport léger qui gère la signature SigV4 pour les requêtes MCP en Python.
Contrôle
Vous pouvez surveiller l'activité des agents par le biais des services suivants :
-
AWS CloudTrail— Les événements de session de l'agent sont enregistrés CloudTrail. Vous pouvez voir quand les agents se connectent, quels outils ils utilisent et quand les sessions se terminent. Les appels d'outils sont des événements liés aux données et nécessitent que vous établissiez un suivi pour enregistrer les événements liés aux données. Pour plus d’informations, consultez Journalisation des événements de données dans le Guide de l’utilisateur CloudTrail .
-
CloudWatch— Les métriques opérationnelles pour les sessions des agents sont disponibles dans CloudWatch.
-
Amazon S3 — Si vous configurez le stockage des captures d'écran, les captures d'écran capturées pendant les sessions de l'agent sont disponibles dans le compartiment Amazon S3 que vous spécifiez. Les captures d'écran sont enregistrées avec le format de clé suivant :
agentaccess/screenshots/year=YYYY/month=MM/day=DD/session-id/timestamp.pngL'UUID indiqué dans le chemin est l'ID de session de streaming WorkSpaces des applications.
Mise en route
Pour commencer à utiliser le serveur WorkSpaces Applications MCP, consultezCommencez à fournir aux agents un accès aux WorkSpaces applications.