OCR tradizionalaren mugak
OCR (Karaktere Optikoen Ezagupena) tradizionalak testua irakurtzen du irudi batetik — baina hor amaitzen da. Dokumentu errealak konplexuagoak dira: taulak, inprimakiak, goiburuak, oin-oharrak, sinadurak, zigiluak. OCR tradizionalak ez du egitura hau ulertzen — testu laua ematen du, testuingururik gabe.
AArekin hobetutako OCR-ak funtsean desberdina da: dokumentuaren egitura ulertzen du, elementu-motak identifikatzen ditu eta datu egituratuak erauzten ditu.
Dokumentuaren egitura ulertzea
AAk dokumentu bat prozesatzen duenean, hainbat maila identifikatzen ditu:
- Dokumentu-mota — faktura, kontratua, inprimakia, gutuna, txostena
- Taulak — errenkadak, zutabeak, goiburuak, guztirako kopuruak
- Inprimaki-eremuak — etiketa-balio bikoteak (adib., "Izena: Juan Garcia")
- Testuko blokeak — paragrafoak, zerrendak, ohar-oharrak
- Metadatuak — datak, zenbatekoak, erreferentziak
Datu egiuratuen erauzketa
OCR adimenduak ez du testu gordina ematen soilik — datu egituratuak erauzten ditu zuzenean ERP, CRM edo datu-basean inportatzeko prest. Faktura batetik: hornitzailea, data, faktura-zenbakia, lerro-elementuak, BEZa, guztizko kopurua. Kontratu batetik: alderdiak, iraupen-data, baldintzak, zenbatekoak.
Auto-ikaskuntza eta hobekuntza jarraitua
AArekin hobetutako OCR-aren abantaila nagusietako bat auto-ikaskuntza da. Erabiltzaileak zuzenketak egiten dituenean (adib., gaizki ezagututako eremu bat zuzentzea), sistemak zuzenketa horretatik ikasten du eta antzeko dokumentuetan hobetzen du. Denborarekin, zehaztasuna %95tik %99ra iritsi daiteke.
Hizkuntza anitzeko laguntza
Gure OCR sistemak EBko 24 hizkuntza ofizialak onartzen ditu, karaktere diakritiko guztiekin. Hizkuntza bat baino gehiagotan idatzitako dokumentu bat ere zuzen prozesatzen da — hizkuntza-aldaketa automatikoki detektatuz.
Erabilera-kasuak
OCR adimentsuaren erabilera praktikoak: fakturen prozesatze automatikoa, kontratuen analisia eta datuen erauzketa, formulario eta inkesten digitalizazioa, gutuneria ofizialaren kudeaketa automatizatua, eta artxibo historikoen digitalizazioa.