Textract
Reconhece texto em imagens e documentos PDF utilizando o serviço AWS Textract. Permite extrair palavras, linhas, formulários, tabelas e respostas a perguntas de arquivos de imagem ou PDF.
Opções
Caminho do arquivo
Informe o caminho completo do arquivo (imagem ou PDF) a ser analisado pelo Textract.
Analisar formulários
Ative esta opção para extrair pares de chave-valor (formulários) do documento.
Analisar tabelas
Ative esta opção para extrair tabelas estruturadas do documento.
Analisar perguntas
Ative esta opção para enviar perguntas ao Textract e obter respostas extraídas do documento.
Perguntas a serem respondidas
Informe as perguntas que o Textract deve responder com base no conteúdo do documento. Disponível apenas quando Analisar perguntas estiver ativado.
Chave de Acesso
Informe a chave de acesso da conta AWS.
Chave de Acesso Secreta
Informe a chave de acesso secreta da conta AWS.
Região
Informe a região AWS onde o serviço Textract está configurado.
Nome do bucket
Informe o nome do bucket S3 utilizado para o processamento. O bucket deve estar na mesma região do serviço Textract.
Tempo de espera
Informe o tempo máximo (em segundos) aguardado para a conclusão da análise.
Páginas para processar
Informe quais páginas do documento devem ser processadas (para PDFs com múltiplas páginas).
Retornos
- Conteúdo do documento — Retorna o conteúdo completo do documento analisado pelo OCR.
- Palavras encontradas — Retorna uma lista com as palavras identificadas pelo OCR.
- Linhas encontradas — Retorna uma lista com as linhas de palavras identificadas pelo OCR.
- Formulários encontrados — Retorna uma lista com os pares chave-valor de formulários identificados.
- Tabelas encontradas — Retorna uma lista com as tabelas identificadas no documento.
- Respostas às perguntas — Retorna as respostas encontradas pelo OCR para as perguntas informadas.
Regras e Condições
- O campo Caminho do arquivo é obrigatório.
- As credenciais AWS (Chave de Acesso, Chave Secreta, Região e bucket) são obrigatórias.
- O bucket S3 deve estar na mesma região do serviço Textract.
- Para análise de perguntas, as perguntas devem ser informadas previamente.