Skip to main content

Textract

Reconhece texto em imagens e documentos PDF utilizando o serviço AWS Textract. Permite extrair palavras, linhas, formulários, tabelas e respostas a perguntas de arquivos de imagem ou PDF.


Opções

Caminho do arquivo

Informe o caminho completo do arquivo (imagem ou PDF) a ser analisado pelo Textract.

Analisar formulários

Ative esta opção para extrair pares de chave-valor (formulários) do documento.

Analisar tabelas

Ative esta opção para extrair tabelas estruturadas do documento.

Analisar perguntas

Ative esta opção para enviar perguntas ao Textract e obter respostas extraídas do documento.

Perguntas a serem respondidas

Informe as perguntas que o Textract deve responder com base no conteúdo do documento. Disponível apenas quando Analisar perguntas estiver ativado.

Chave de Acesso

Informe a chave de acesso da conta AWS.

Chave de Acesso Secreta

Informe a chave de acesso secreta da conta AWS.

Região

Informe a região AWS onde o serviço Textract está configurado.

Nome do bucket

Informe o nome do bucket S3 utilizado para o processamento. O bucket deve estar na mesma região do serviço Textract.

Tempo de espera

Informe o tempo máximo (em segundos) aguardado para a conclusão da análise.

Páginas para processar

Informe quais páginas do documento devem ser processadas (para PDFs com múltiplas páginas).

Retornos

  • Conteúdo do documento — Retorna o conteúdo completo do documento analisado pelo OCR.
  • Palavras encontradas — Retorna uma lista com as palavras identificadas pelo OCR.
  • Linhas encontradas — Retorna uma lista com as linhas de palavras identificadas pelo OCR.
  • Formulários encontrados — Retorna uma lista com os pares chave-valor de formulários identificados.
  • Tabelas encontradas — Retorna uma lista com as tabelas identificadas no documento.
  • Respostas às perguntas — Retorna as respostas encontradas pelo OCR para as perguntas informadas.

Regras e Condições

  • O campo Caminho do arquivo é obrigatório.
  • As credenciais AWS (Chave de Acesso, Chave Secreta, Região e bucket) são obrigatórias.
  • O bucket S3 deve estar na mesma região do serviço Textract.
  • Para análise de perguntas, as perguntas devem ser informadas previamente.