Como funciona o Reconhecimento Óptico de Caracteres (OCR)

O reconhecimento óptico de caracteres (OCR) refere-se a um software que cria uma versão digital de um documento impresso, digitado ou manuscrito, que os computadores podem ler sem a necessidade de digitar ou introduzir manualmente o texto. OCR é geralmente utilizado em documentos digitalizados em formato PDF, mas também pode criar uma versão legível por computador do texto dentro de um ficheiro de imagem.

O que é o OCR

OCR, também conhecido como reconhecimento de texto , é um software tecnologia que transforma caracteres como números, letras e sinais de pontuação ( também chamado glifos ) de documentos impressos ou escritos numa forma electrónica que é mais fácil de reconhecer e ler por computadores e outros programas de software. Alguns programas de OCR fazem isto enquanto um documento é digitalizado ou fotografado com uma câmara digital e outros podem aplicar este processo a documentos que foram previamente digitalizados ou fotografados sem OCR. OCR permite aos utilizadores pesquisar dentro de documentos PDF, editar textos e reformatar documentos.

Para que é utilizado o OCR?

Para necessidades de digitalização rápida e diária, o OCR pode não ser um grande problema. Se fizer uma grande quantidade de digitalização, ser capaz de pesquisar através de PDFs para encontrar exactamente o que precisa pode poupar muito tempo e torna a funcionalidade de OCR no seu programa de digitalização mais importante. Aqui estão algumas outras coisas em que o OCR ajuda:

  • Processamento e entrada automatizada de dados (Exemplo: sistemas de rastreio de candidatos para CVs).
  • Tornar os livros digitalizados pesquisáveis.
  • Converter digitalizações manuscritas em texto legível por computador.
  • Tornar os documentos mais utilizáveis através da leitura de programas que ajudam os utilizadores deficientes visuais.
  • Preservação de documentos históricos e periódicos, tornando-os ao mesmo tempo pesquisáveis.
  • Extracção e transferência de dados para programas de contabilidade (Exemplo: recibos e facturas).
  • Indexação de documentos para utilização por motores de busca.
  • Reconhecimento das chapas de matrícula dos condutores por radar de velocidade e software de câmara de luz vermelha.
  • Sínteses de fala para pessoas que não podem falar – o físico teórico Stephen Hawking é talvez o utilizador mais conhecido de um programa de síntese de fala.

Porquê usar OCR?

Porque não simplesmente tirar uma fotografia, certo? Porque não seria possível editar nada ou procurar texto porque seria apenas uma imagem . A digitalização do documento e a execução de software de OCR pode transformar esse ficheiro em algo que pode editar e ser capaz de pesquisar.

História do OCR

Embora os primeiros usos do reconhecimento de texto remontem a 1914, o desenvolvimento e uso generalizado das tecnologias relacionadas com o OCR começou seriamente nos anos 50, especificamente com a criação de fontes muito simplificadas que eram mais fáceis de converter em texto digitalmente legível . A primeira destas tipografias simplificadas foi criada por David Shepard e é geralmente conhecida como OCR-7B. OCR-7B é ainda hoje utilizado na indústria financeira para o tipo de letra padrão utilizado nos cartões de crédito e débito. Na década de 1960, os serviços postais em vários países começaram a utilizar a tecnologia OCR para acelerar grandemente a separação do correio, incluindo os Estados Unidos, Gra?-Bretanha, Canadá e Alemanha. OCR continua a ser a principal tecnologia utilizada para separar o correio nos serviços postais em todo o mundo. Em 2000, o conhecimento chave dos limites e capacidades da tecnologia OCR foi utilizado para desenvolver os programas CAPTCHA utilizados para parar os bots e os spammers. Ao longo das décadas, OCR tornou-se mais preciso e mais sofisticado devido aos avanços em áreas tecnológicas relacionadas, tais como inteligência artificial, aprendizagem de máquinas e visão por computador . Actualmente, o software de OCR utiliza o reconhecimento de padrões , o detecção de características e mineração de texto para transformar documentos mais rapidamente e com mais precisão do que nunca.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ir arriba