jajajajaj que no es tan difícil...pero es tedioso porque precisa de un calibrado, para uqe te quede más o menos---
El algoritmo se tiene que hacer por partes...
La primera parte ajusta el documento, lo limpia, y lo convierte en blanco y negro... para mi es más fácil trabajar así que directamente con un documento en color...
Después otra parte es la que captura caracter por caracter del documento gráfico, y la otra parte del programa realiza la comparación del caracter con una fuente bitmap... por cada pixel que coincida lo das cómo válido, yo uso una suma... si la suma supera el 60% valido el caracter... cómo habrá algunos caracteres que sumen más de un 60% de parecido, coges el resultado mayor... eso te puede ocurrir con la C el O , 0 o Q o caracteres similares...
Las fuentes en bitmap las puedes crear tu, o puedes encontrarlas por la red...
Para no desanimarte te diré que las aplicaciones OCR nunca funcionan al 100%, incluso puedes bajarte librerías de pago para que lo compruebes, muchas de ellas te dan un periodo Trial o de prueba.
Ánimo e inténtalo tu mismo...  |