Comprensión de las herramientas ¿Cuándo usar el MCP

¿Qué es el MCP?

LLMs predice la respuesta a una pregunta en función de sus datos de entrenamiento. Esto significa que el LLM solo puede proporcionar respuestas sobre datos y eventos que ya haya visto. Métodos como la generación aumentada de recuperación (RAG) y las bases de conocimiento permiten incluir datos contextuales. Sin embargo, si le preguntara a un LLM cuál será la previsión meteorológica de mañana o cuántos clientes hay en su base de datos, lo más probable es que tenga alucinaciones o no sea capaz de dar una respuesta, ya que estos datos están fuera del alcance de los conocimientos previamente entrenados por el LLM. Para poder responder a este tipo de preguntas, un agente necesita tener acceso a capacidades y datos externos APIs fuera del contexto nativo del LLM.

Comprensión de las herramientas

Podemos dar al LLM acceso a sistemas y contextos adicionales a través de herramientas.Las herramientas son funciones que se le asignan al LLM para lograr un objetivo claro. Una herramienta podría llamar a una API, consultar una base de datos, realizar operaciones de calculadora, operar un entorno limitado de códigos, realizar una búsqueda en la web e incluso invocar otro sistema de IA o. agent-as-a-tool Cada herramienta debe incluir una descripción que indique al LLM qué hace la herramienta, cuándo usarla y qué parámetros acepta. Esto permite al LLM tomar decisiones matizadas sobre qué herramienta o combinación de herramientas utilizar en función de las aportaciones del usuario. Al LLM se le indica qué herramientas están disponibles para el agente, lo que le permite generar respuestas que le indiquen al agente que invoque la herramienta. Por ejemplo, cuando le pregunte al LLM cuántos clientes hay en su base de datos, el LLM enviará una respuesta al agente solicitando que ejecute la query_database herramienta con parámetros de entrada específicos. El LLM determina qué herramienta invocar y las entradas para la llamada a la herramienta. A continuación, el agente ejecuta la herramienta, que convierte la entrada en lenguaje natural en una llamada a una función sintácticamente correcta y ejecuta la consulta. El agente invoca la herramienta o las herramientas según las instrucciones del LLM y esos resultados se devuelven al LLM. Esto aprovecha la capacidad del LLM para razonar en lugar de introducir texto y seleccionar las herramientas adecuadas para el trabajo.

La siguiente imagen muestra cómo cada agente gestiona su propio conjunto de herramientas para cada objetivo.

Cada agente administra su propio conjunto de herramientas para cada objetivo.

Ampliar el acceso a las herramientas puede plantear desafíos para las soluciones de IA de los agentes:

Si cada desarrollador crea su propia herramienta para las mismas capacidades externas, hay una gran cantidad de esfuerzos duplicados y formas no estandarizadas de interactuar con estas capacidades externas. Esto produce implementaciones incoherentes entre sus agentes. Si bien podría resolver ese problema desarrollando herramientas estándar en las bibliotecas y distribuyéndolas, esto carece de una gobernanza centralizada. Esto dificulta la aplicación de las políticas de seguridad, el seguimiento del uso de las herramientas, la gestión del control de versiones en todos los equipos o la garantía del cumplimiento de las normas organizativas. Además, al integrar las herramientas directamente en el agente, debe volver a desplegarlo cada vez que se cree una nueva herramienta o se actualice una existente.
Proporcionar herramientas a un LLM consume su ventana de contexto. La ventana de contexto es el número de símbolos (unidades de texto que se LLMs procesan, que normalmente representan palabras, partes de palabras o signos de puntuación) que un modelo puede considerar en cualquier momento dado. LLMs tienen límites de ventana de contexto. Las herramientas y su documentación ocupan esa ventana de contexto finita junto con las indicaciones del sistema y las del usuario. A medida que se va llenando la ventana de contexto, LLMs pueden experimentar una degradación del rendimiento debido a varios factores: dificultad para identificar la información relevante, aumento de la complejidad del procesamiento y reducción de la capacidad de razonamiento. El desafío se agrava cuando las definiciones de las herramientas, las instrucciones del sistema y el historial de conversaciones compiten por un espacio limitado en la ventana contextual, ya que se proporcionan en cada invocación al LLM.

Por lo tanto, la cantidad de herramientas y la forma en que se documentan tienen un impacto directo en el rendimiento del LLM, como el tiempo de respuesta y la precisión.

El MCP establece un estándar universal para conectar los agentes con capacidades externas. Se lo conoce comúnmente como el «USB-C para aplicaciones de IA». En lugar de registrar las herramientas directamente con los agentes, los servidores MCP actúan como intermediarios para alojar las herramientas que se descubren e invocan mediante JSON-RPC 2.0. En lugar de añadir decenas o cientos de herramientas diferentes a su agente y mantenerlas a lo largo del tiempo, el MCP le permite registrar los servidores MCP que encapsulan las herramientas a las que puede acceder el agente. Este enfoque estandariza la forma en que se empaquetan, presentan e invocan las herramientas. Esto puede ayudar a abordar los desafíos de escala y gobernanza que implica el uso de las herramientas por parte de sus agentes. También separa el desarrollo y las operaciones de los agentes de las herramientas que utiliza para las capacidades externas.

La siguiente figura muestra a los agentes que utilizan el MCP para acceder a recursos externos.

Uso del protocolo Model Context para acceder a recursos externos.

Sin embargo, el estándar MCP no resuelve todos los desafíos de escalamiento y gobernanza. La implementación de los servidores MCP debe combinarse con estrategias eficaces de diseño de herramientas, alojamiento y gobierno empresarial. Esta guía proporciona las mejores prácticas para cada estrategia a fin de ayudarle a crear y utilizar el MCP como parte de las soluciones de IA de su agencia.

¿Cuándo usar el MCP

MCP proporciona una infraestructura estratégica para ampliar las iniciativas de IA de sus agencias. Al centralizar la administración y el gobierno de las herramientas, los servidores MCP reducen el costo acumulado de crear y mantener integraciones personalizadas entre varios agentes. Esto ofrece una rentabilidad cada vez mayor a medida que su ecosistema de agentes se expande.

Es probable que el MCP pase a formar parte de su estrategia cuando:

Necesita una gobernanza centralizada sobre la forma en que los agentes acceden a los sistemas y servicios empresariales, como las bases de datos APIs, las herramientas internas y las integraciones de terceros.
Los desarrolladores dedican demasiado tiempo a crear integraciones personalizadas que no son coherentes en todas las implementaciones.
Tiene herramientas duplicadas que podrían ofrecer capacidades comunes.
Desea ofrecer sus herramientas o datos patentados a consumidores externos o sistemas de agencias de terceros a través de interfaces MCP estandarizadas y gobernadas, lo que le permitirá obtener nuevas fuentes de ingresos y, al mismo tiempo, mantener la seguridad y el control.

Una vez que decida si los servidores MCP van a formar parte de su estrategia, evalúe si las implementaciones de servidores MCP de código abierto existentes satisfacen sus necesidades, si requieren mejoras o si necesita crear servidores personalizados. Muchas implementaciones de servidores MCP prediseñadas están disponibles en repositorios públicos y abarcan capacidades comunes, como el acceso a los sistemas de archivos, la navegación web, los entornos limitados de código, el acceso a bases de datos y las integraciones de API.

En muchos casos, los servidores MCP preexistentes son suficientes. Por ejemplo, AWS proporciona un servidor MCP remoto gestionado que proporciona a los asistentes y agentes de IA un acceso seguro y autenticado Servicios de AWS mediante interacciones en lenguaje natural. Servidor de AWS MCP Puede usarlo Servidor de AWS MCP para realizar AWS tareas complejas de varios pasos, combinando el acceso en tiempo real a la AWS documentación, las llamadas a la API correctas desde el punto de vista sintáctico y los flujos de trabajo prediseñados denominados agentes que siguen las mejores prácticas. SOPs AWS AWS las prueba continuamente Servidor de AWS MCP para asegurarse de que los agentes de atención al cliente puedan utilizarlas correctamente.

Debe probar estos servidores MCP existentes con sus agentes para determinar si se adaptan a sus casos de uso. Si un agente no completa los flujos de trabajo, genera respuestas incorrectas o subóptimas, no logra gestionar procesos complejos de varios pasos o pasa por alto importantes prácticas recomendadas o consideraciones de seguridad específicas de un dominio, debería considerar la posibilidad de realizar mejoras en varias dimensiones.

Cuando los servidores MCP existentes no satisfagan plenamente sus necesidades y tengan dificultades para utilizar las herramientas existentes correctamente o producir respuestas precisas, considere estos enfoques de mejora antes de crear servidores personalizados:

Enriquezca el contexto de los agentes: si su agente tiene dificultades para utilizar de manera correcta o eficiente las herramientas de un servidor MCP existente, considere la posibilidad de complementar esas definiciones de herramientas con documentación o ejemplos adicionales. Esto ayuda a proporcionar un contexto adicional al LLM.
Agregue herramientas complementarias: amplíe los servidores MCP existentes con herramientas que accedan a los datos organizativos adicionales o al contexto que los agentes necesitan para completar los flujos de trabajo correctamente.
Mejore las funciones subyacentes APIs: simplifique su servicio APIs para que sea más adecuado para la gestión de problemas de aprendizaje automático reduciendo la complejidad de los parámetros, proporcionando mensajes de error más claros y ofreciendo valores predeterminados razonables que los agentes puedan utilizar.

Si bien el uso de las implementaciones de servidores MCP existentes acelera el desarrollo de capacidades comunes, la creación de servidores MCP personalizados es una necesidad cuando su caso de uso requiere una funcionalidad especializada. Los servidores MCP personalizados le ayudan a encapsular la experiencia en el campo, a aplicar los estándares organizacionales, a mejorar la confiabilidad de los agentes para flujos de trabajo complejos y a respaldar el cumplimiento de los requisitos de seguridad. Considere la posibilidad de crear un servidor MCP personalizado en las siguientes situaciones:

Flujos de trabajo específicos del dominio: los flujos de trabajo de varios pasos que requieren experiencia en el dominio deben encapsularse en herramientas MCP personalizadas cuando la documentación de la API no incluye los conocimientos necesarios. Por ejemplo, en lugar de permitir que los agentes organicen complejos flujos de datos de atención médica que deben validar el cumplimiento de la Ley de Portabilidad y Responsabilidad de los Seguros de Salud (HIPAA), anonimizar la PII y transformarla al formato HL7 FHIR, proporcione una herramienta que incorpore directamente la experiencia en el campo. process_patient_data Esto elimina la dependencia del LLM para organizar y ejecutar correctamente los pasos del flujo de trabajo, lo que mejora la coherencia y el cumplimiento.
Abstracciones de la vía dorada: los agentes pueden tener dificultades para implementar enfoques óptimos porque carecen de un contexto organizacional y utilizan patrones básicos por defecto en lugar de las mejores prácticas organizacionales. En estos escenarios, puede aplicar normas prescriptivas en materia de costes, rendimiento o seguridad encapsulando estas vías de oro en herramientas MCP personalizadas. Por ejemplo, en lugar de permitir que los agentes desplieguen una infraestructura con una configuración predeterminada que podría resultar insegura o ineficiente, proporcione una deploy_secure_infrastructure herramienta que incorpore directamente los estándares de su organización.
Organización compleja de varios servicios: en lugar de hacer que el agente organice flujos de trabajo complejos intentando deducir la secuencia y el conjunto de servicios correctos que debe utilizar en cada paso, puede crear esa lógica de forma determinista dentro de una herramienta de MCP. Es posible que también desee proporcionar conocimientos sobre los patrones óptimos de integración de servicios que el agente tal vez desconozca. Esto también puede mejorar la precisión y la eficiencia de sus agentes.
Mejores prácticas específicas para cada servicio: esto es común en el caso de las herramientas centradas en la seguridad que ayudan a los agentes a implementar políticas de cifrado, controles de acceso y patrones de cumplimiento específicos del servicio al que se accede a través de la herramienta de agente. Además, si existen prácticas recomendadas operativas específicas para un servicio que no son obvias, el uso de un servidor MCP puede ayudarle a asegurarse de que se implementan y no dejan que sea un agente quien razone al respecto.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Introducción

Estrategia de diseño de herramientas MCP