Visão geral da arquitetura - Criador de aplicações de IA generativa na AWS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visão geral da arquitetura

Esta seção fornece diagramas de arquitetura de implementação de referência para os componentes implantados com essa solução.

Diagramas de arquitetura

Para oferecer suporte a vários casos de uso e necessidades comerciais, essa solução fornece seis CloudFormation modelos da AWS:

  1. Painel de implantação - O painel de implantação é uma interface web que serve como um console de gerenciamento para usuários administradores visualizarem, gerenciarem e criarem seus casos de uso. Esse painel permite que os clientes experimentem, iterem e produzam rapidamente várias AI/ML cargas de trabalho aproveitando. LLMs

  2. Caso de uso de texto - O caso de uso de texto permite que os usuários experimentem uma interface de linguagem natural usando IA generativa. Esse caso de uso pode ser integrado a aplicativos novos ou existentes e pode ser implantado por meio do painel de implantação ou de forma independente por meio de uma URL fornecida.

  3. Caso de uso do Bedrock Agent - O caso de uso do Bedrock Agent permite o uso dos Bedrock Agents existentes para concluir tarefas ou automatizar fluxos de trabalho repetidos.

  4. Servidor MCP - O caso de uso do MCP Server permite a implantação e o gerenciamento de servidores do Model Context Protocol que fornecem ferramentas padronizadas e acesso a recursos para aplicativos de IA. Suporta métodos de gateway para agrupar funções APIs Lambda existentes e servidores MCP externos e métodos de tempo de execução para implantar servidores MCP em contêineres personalizados.

  5. Agent Builder — O Agent Builder permite a criação e a implantação de agentes de IA prontos para produção no Amazon Bedrock AgentCore com controle total de configuração, integração de servidores MCP e recursos de gerenciamento de memória.

  6. Construtor de fluxo de trabalho - O criador de fluxo de trabalho permite a criação de agentes supervisores que orquestram vários agentes do Agent Builder usando o padrão de delegação de Agentes como Ferramentas para fluxos de trabalho complexos com vários agentes.

Painel de implantação

Descreve a arquitetura do painel de implantação (quando implantado com a opção VPC desativada)

diagrama do painel de implantação

Descreve a arquitetura do painel de implantação (quando implantado com a opção VPC ativada)

diagrama de arco vpc do painel de implantação
nota

Os CloudFormation recursos da AWS são criados a partir de construções do AWS Cloud Development Kit (AWS CDK).

O fluxo de processo de alto nível para os componentes da solução implantados com o CloudFormation modelo da AWS é o seguinte:

  1. Os usuários administradores fazem login na interface de usuário (UI) do Deployment Dashboard.

  2. A Amazon CloudFront fornece a interface web, que é hospedada em um bucket do Amazon Simple Storage Service (Amazon S3).

  3. O AWS WAF os APIs protege contra ataques. Essa solução configura um conjunto de regras chamado lista de controle de acesso à web (Web ACL) que permite, bloqueia ou conta solicitações da web com base em regras e condições de segurança da web configuráveis e definidas pelo usuário.

  4. A interface web utiliza um conjunto de REST APIs que são expostos usando o Amazon API Gateway.

  5. O Amazon Cognito autentica usuários e faz backup tanto CloudFront da interface de usuário da web quanto do API Gateway.

  6. O AWS Lambda fornece a lógica de negócios para os endpoints REST. Essa função de apoio do Lambda gerencia e cria os recursos necessários para realizar implantações de casos de uso usando a AWS. CloudFormation

  7. O Amazon DynamoDB armazena a lista de implantações.

  8. Quando um novo caso de uso é criado pelo usuário administrador, a função Lambda de apoio inicia CloudFormation um evento de criação de pilha para o caso de uso solicitado.

  9. Todas as opções de configuração do LLM fornecidas pelo usuário administrador no assistente de implantação são salvas no DynamoDB. A implantação usa essa tabela do DynamoDB para configurar o LLM em tempo de execução.

  10. Usando a Amazon CloudWatch, essa solução coleta métricas operacionais de vários serviços para gerar painéis personalizados que permitem monitorar o desempenho e a integridade operacional da solução.

nota
  • Se você optar por implantar essa solução em uma Amazon VPC, os dados serão roteados dentro da sua rede privada.

  • Embora o painel de implantação possa ser lançado na maioria das regiões da AWS, os casos de uso implantados têm certas restrições com base na disponibilidade do serviço. Consulte Regiões compatíveis da AWS para obter mais detalhes.

Caso de uso de texto

Representa a arquitetura do caso de uso do Text (quando implantada com a opção VPC desativada)

diagrama de caso de uso de texto

Representa a arquitetura do caso de uso do Text (quando implantada com a opção VPC ativada)

caso de uso de texto: diagrama de arco vpc

O fluxo de processo de alto nível para os componentes da solução implantados com o CloudFormation modelo da AWS é o seguinte:

  1. Os usuários administradores implantam o caso de uso usando o Painel de Implantação. Os usuários corporativos fazem login na interface do usuário do caso de uso.

  2. CloudFront fornece a interface do usuário da web que está hospedada em um bucket S3.

  3. A interface de usuário da web aproveita uma WebSocket integração criada usando o API Gateway. O API Gateway é apoiado por uma função autorizadora personalizada do Lambda, que retorna a política apropriada do AWS Identity and Access Management (IAM) com base no grupo Amazon Cognito ao qual o usuário autenticador pertence. A política é armazenada no DynamoDB.

  4. O Amazon Cognito autentica usuários e faz backup tanto CloudFront da interface de usuário da web quanto do API Gateway.

  5. As solicitações recebidas do usuário corporativo são passadas do API Gateway para uma fila do Amazon SQS e, em seguida, para o orquestrador. LangChain O LangChain orquestrador é uma coleção de funções e camadas do Lambda que fornecem a lógica de negócios para atender às solicitações provenientes do usuário corporativo. A fila permite a operação assíncrona da integração do API Gateway com o Lambda. A fila passa as informações de conexão para as funções do Lambda, que então publicam os resultados diretamente na conexão websocket do API Gateway para suportar chamadas de inferência de longa duração.

  6. O LangChain orquestrador usa o Amazon DynamoDB para obter as opções configuradas do LLM e as informações necessárias da sessão (como o histórico do bate-papo).

  7. Se a implantação tiver uma base de conhecimento habilitada, o LangChain orquestrador aproveita o Amazon Kendra ou as bases de conhecimento do Amazon Bedrock para executar uma consulta de pesquisa para recuperar trechos de documentos.

  8. Usando o histórico de bate-papo, a consulta e o contexto da base de conhecimento, o LangChain orquestrador cria a solicitação final e envia a solicitação para o LLM hospedado no Amazon Bedrock ou no Amazon AI. SageMaker

  9. Quando a resposta volta do LLM, o LangChain orquestrador transmite a resposta de volta pelo API Gateway WebSocket para ser consumida pelo aplicativo cliente.

  10. Usando a Amazon CloudWatch, essa solução coleta métricas operacionais de vários serviços para gerar painéis personalizados que permitem monitorar o desempenho e a integridade operacional da implantação.

  11. Se a coleta de feedback estiver ativada, um endpoint da API REST, utilizando o Amazon API Gateway, será disponibilizado para a coleta de feedback do usuário.

  12. O feedback de apoio lambda aumenta o feedback enviado com metadados adicionais específicos do caso de uso (por exemplo, modelo usado) e armazena os dados no Amazon S3 para análise e geração de relatórios posteriores pelos usuários. DevOps

nota

Se você optar por implantar essa solução em uma Amazon VPC, os dados serão roteados para sua rede privada.

Caso de uso do Bedrock Agent

Descreve a arquitetura do caso de uso do Bedrock Agent (quando implantado com a opção VPC desativada)

diagrama de caso de uso do agente

Descreve a arquitetura do caso de uso do Bedrock Agent (quando implantado com a opção VPC ativada)

caso de uso do agente: diagrama de arco vpc

O fluxo de processo de alto nível para os componentes da solução implantados com o CloudFormation modelo da AWS é o seguinte:

  1. Os usuários administradores implantam o caso de uso usando o Painel de Implantação. Os usuários corporativos fazem login na interface do usuário do caso de uso.

  2. CloudFront fornece a interface do usuário da web que está hospedada em um bucket S3.

  3. A interface de usuário da web aproveita uma WebSocket integração criada usando o API Gateway. O API Gateway é apoiado por uma função autorizadora personalizada do Lambda, que retorna a política apropriada do AWS Identity and Access Management (IAM) com base no grupo Amazon Cognito ao qual o usuário autenticador pertence. A política é armazenada no DynamoDB.

  4. O Amazon Cognito autentica usuários e faz backup tanto CloudFront da interface de usuário da web quanto do API Gateway.

  5. As solicitações recebidas do usuário corporativo são passadas do API Gateway para uma fila do Amazon SQS e, em seguida, para a função AWS Lambda. A fila permite a operação assíncrona da integração do API Gateway com o Lambda. A fila passa as informações de conexão para a função Lambda, que então publicará os resultados diretamente na conexão websocket do API Gateway para suportar chamadas de inferência de longa duração.

  6. A função AWS Lambda usa o Amazon DynamoDB para obter as configurações do caso de uso conforme necessário.

  7. Usando a entrada do usuário e qualquer configuração de caso de uso relevante, a função AWS Lambda cria e envia uma carga de solicitação para o Amazon Bedrock Agent configurado para cumprir a intenção do usuário.

  8. Quando a resposta volta do Amazon Bedrock Agent, a função Lambda transmite a resposta de volta por meio do API WebSocket Gateway para ser consumida pelo aplicativo cliente.

  9. Usando a Amazon CloudWatch, essa solução coleta métricas operacionais de vários serviços para gerar painéis personalizados que permitem monitorar o desempenho e a integridade operacional da implantação.

  10. Se a coleta de feedback estiver ativada, um endpoint da API REST, utilizando o Amazon API Gateway, será disponibilizado para a coleta de feedback do usuário.

  11. O feedback de apoio lambda aumenta o feedback enviado com metadados adicionais específicos do caso de uso e armazena os dados no Amazon S3 para análise e geração de relatórios posteriores pelos usuários. DevOps

nota

Se você optar por implantar essa solução em uma Amazon VPC, os dados serão roteados dentro da sua rede privada.

Caso de uso do MCP Server

Descreve a arquitetura do caso de uso do MCP Server

diagrama de caso de uso do servidor mcp

O caso de uso do MCP Server permite a implantação e o gerenciamento de servidores do Model Context Protocol no Amazon Bedrock AgentCore. Os servidores MCP fornecem uma interface padronizada para aplicativos de IA acessarem ferramentas, recursos e fontes de dados corporativos.

A solução oferece suporte a dois métodos de implantação:

  • Método de gateway: agrupa funções Lambda existentes, APIs REST ou servidores MCP externos como ferramentas MCP, manipulando a tradução de protocolos automaticamente

  • Método de tempo de execução: implanta servidores MCP personalizados em contêineres a partir de imagens do Amazon ECR

O fluxo de processo de alto nível para a implantação do MCP Server é o seguinte:

  1. Os usuários administradores implantam o caso de uso do MCP Server usando o Deployment Dashboard, selecionando o método de implantação Gateway ou Runtime.

  2. Essa ação é autenticada com o Amazon Cognito.

  3. Para a implantação do Gateway, a solução cria um Amazon Bedrock AgentCore Gateway que transforma funções Lambda existentes ou servidores MCP externos em APIs ferramentas compatíveis com MCP. Para a implantação do Runtime, a solução implanta servidores MCP em contêineres no Amazon Bedrock AgentCore Runtime usando imagens ECR fornecidas.

  4. As implantações de gateway recuperam os API/Lambda/Smithy esquemas necessários de seu local de upload no Amazon S3 ou se conectam diretamente aos endpoints de URL do servidor MCP.

  5. As implantações em tempo de execução recuperam o servidor MCP em contêineres fornecido pelo usuário do Amazon Elastic Container Registry (ECR)

  6. O MCP Server é instrumentado com um cliente Amazon Bedrock Identity AgentCore OAuth

  7. O MCP Server disponibiliza as ferramentas associadas no endpoint /mcp para que os agentes as descubram.

  8. A Amazon CloudWatch coleta métricas e registros operacionais de implantações de servidores MCP para monitoramento e solução de problemas.

Caso de uso do Agent Builder

Representa a arquitetura do Agent Builder

diagrama de implantação do agent builder

O fluxo de processo de alto nível para os componentes do Agent Builder implantados com o CloudFormation modelo da AWS é o seguinte:

  1. Os usuários administradores implantam o caso de uso usando o Painel de Implantação. Os usuários corporativos fazem login na interface do usuário do caso de uso.

  2. CloudFront fornece a interface do usuário da web que está hospedada em um bucket S3.

  3. A interface de usuário da web aproveita uma WebSocket integração criada usando o API Gateway. O API Gateway é apoiado por uma função autorizadora personalizada do Lambda, que retorna a política apropriada do AWS Identity and Access Management (IAM) com base no grupo Amazon Cognito ao qual o usuário autenticador pertence. A política é armazenada no DynamoDB.

  4. O Amazon Cognito autentica usuários e faz backup tanto CloudFront da interface de usuário da web quanto do API Gateway.

  5. As solicitações recebidas do usuário corporativo são passadas do API Gateway para uma fila do Amazon SQS e, em seguida, para a função AWS Lambda. A fila permite a operação assíncrona da integração do API Gateway com o Lambda. A fila passa as informações de conexão para a função Lambda, que então publicará os resultados diretamente na conexão websocket do API Gateway para suportar chamadas de inferência de longa duração.

  6. A função AWS Lambda recupera a configuração do agente do DynamoDB.

  7. Usando a entrada do usuário e qualquer configuração de caso de uso relevante, a função AWS Lambda cria e envia uma carga de solicitação ao agente, executada no Amazon Bedrock Runtime. AgentCore

  8. O agente se conecta aos servidores MCP associados e registra as ferramentas na instância do agente de strings. O agente então seleciona e executa ações de forma autônoma com base nas descrições das ferramentas e nos requisitos da tarefa.

  9. Quando a resposta volta do tempo de AgentCore execução do Amazon Bedrock, a função Lambda transmite a resposta de volta por meio do API WebSocket Gateway para ser consumida pelo aplicativo cliente.

nota
  • O processamento do agente é limitado ao tempo limite de execução do Lambda (15 minutos).

Caso de uso do Workflow Builder

Descreve a arquitetura do Workflow Builder

diagrama de implantação do fluxo de

O fluxo de processo de alto nível para os componentes do Workflow Builder implantados com o CloudFormation modelo da AWS é o seguinte:

  1. Os usuários administradores implantam o fluxo de trabalho usando o Painel de Implantação, selecionando agentes do Agent Builder para incluir como agentes especializados.

  2. CloudFront fornece a interface do usuário da web que está hospedada em um bucket S3.

  3. A interface de usuário da web aproveita uma WebSocket integração criada usando o API Gateway. O API Gateway é apoiado por uma função autorizadora personalizada do Lambda, que retorna a política apropriada do AWS Identity and Access Management (IAM) com base no grupo Amazon Cognito ao qual o usuário autenticador pertence. A política é armazenada no DynamoDB.

  4. O Amazon Cognito autentica usuários e faz backup tanto CloudFront da interface de usuário da web quanto do API Gateway.

  5. As solicitações recebidas do usuário corporativo são passadas do API Gateway para uma fila do Amazon SQS e, em seguida, para a função AWS Lambda. A fila permite a operação assíncrona da integração do API Gateway com o Lambda.

  6. A função AWS Lambda recupera a configuração do fluxo de trabalho do DynamoDB, incluindo a lista de agentes especializados do Agent Builder.

  7. Usando a entrada do usuário e a configuração do fluxo de trabalho, o Lambda envia solicitações para o Amazon Bedrock AgentCore Runtime que hospeda o agente supervisor.

  8. O agente supervisor cria instâncias locais de todos os agentes especializados do Agent Builder no ambiente AgentCore Runtime. Esses agentes especializados são registrados como ferramentas usando o padrão Agents as Tools. O supervisor então seleciona e delega de forma autônoma o trabalho a agentes especializados com base nas descrições dos agentes e nos requisitos da tarefa.

  9. O agente supervisor agrega resultados de agentes especializados e formula a resposta final, devolvendo-a ao Lambda para ser transmitida de volta ao aplicativo cliente por meio do Websocket do API Gateway.

nota
  • O processamento do fluxo de trabalho é limitado ao tempo limite de execução do Lambda (15 minutos).