Bueno, ya pude hacer dicha herramienta y convertir correctamente los PDF a CVS y de ahí a cualquier base de datos.
Solo me falta corregir algunos errores como el presente:
Código:
"AGUILAR VELIZ DAVID ALEJANDRO","16.614.105-2","VAR","PJE PUERTO AYSEN 2045","ARICA","117 M"
"AGUILAR VELIZ NICOL CAROLINA 16.672.108-3 MUJ PSJE ALFREDO WORMALD 295 SAN MIGUEL DE AZAPA 13"
"AGUILAR VILCA SONIA","22.467.972-6","MUJ","PSJE. ZAPIGA 4087","ARICA","157 V"
Si se fijan en lo anterior, AGUILAR VELIZ NICOL CAROLINA, no tiene separación por coma ni esta correctamente encerrado por comillas dobles acompañado por una larga extensión de espacios. esto ocurre al azar y son pocos, pero deben de corregirse antes de pasarse a la BD definitiva.
Lo otro es definir la longitud de los campos, detectar cuando el nombre es compuesto o cuando solo tiene un solo nombre. La idea es que a posterior se pueda filtrar por apellido paterno, materno y primer nombre junto con cualquier otra combinación.
Gracias por el interés, y les digo que la cosa no esta estancada pero necesito tiempo libre. Creo que la semana del 18 podre trabajar más a fondo en el asunto
¿Como le ponemos al programa? "Antronimus 2.0"