Wat is OCR?
In het kort: met OCR worden tekst en cijfers uit een gescande afbeelding omgezet in een bewerkbare tekst.
OCR staat voor Optical Character Recognition. In het Nederlands hanteren we de term optische tekenherkenning. OCR herkent patronen in tekst, zowel getypt als geschreven, en snapt dat bepaalde combinaties bij elkaar horen.
Papieren documenten, plastic pasjes (bv. ID, rijbewijs, paspoort, IBAN) en boekwerken kunnen met behulp van OCR getransformeerd worden tot digitale, bewerkbare stukken. Het enige wat je hoeft te doen is het document te scannen, bijvoorbeeld met je smartphone. Handmatige en repetitieve input van data wordt daarmee overbodig.
OCR versnelt processen
De tekst in een afbeelding wordt eerst gescand. Op dat moment is de tekst nog 'gewoon een afbeelding'. Na herkenning van letters en cijfers wordt de tekst in de afbeelding omgezet naar een bewerkbare tekst en kan deze in andere processen gebruikt worden. Zonder OCR is er geen herkenning en is het resultaat een afbeelding die niet te bewerken valt.
Met optische tekenherkenning kun je dus razendsnel allerlei soorten documenten scannen en bewerkbaar maken, onafhankelijk van sector of branche. Partijen als Adobe en Dropbox maken er al tijden gebruik van. Bij Dropbox kun je bijvoorbeeld snel je afbeeldingen en gescande documenten vinden door naar tekst te zoeken die erin staat. OCR is overigens niet nieuw: voor het allereerste gebruik kunnen we zo'n 100 jaar terug in de tijd.
OCR in de praktijk
Slimme OCR-software begrijpt dat bepaalde combinaties bij elkaar horen. In de praktijk is dat bijvoorbeeld een BTW-nummer, projectnummer, factuurdatum, of persoonsnummer van een rijbewijs. Door deze tijdens het scannen te herkennen en in te vullen of verifiëren waar nodig, wordt handmatige input overbodig. Het gevolg is een forse versnelling van administratieve werkzaamheden.
Lagere foutmarges zijn hier ook een logisch gevolg - zoals gezegd, door OCR slim toe te passen is minder handmatige verwerking nodig. Dat leidt weer tot minder menselijke fouten, wat vooral merkbaar wordt bij een groter volume aan documenten. Voorwaarde is wel dat jouw OCR-oplossing dan foutloos of zo goed als foutloos werkt.
Een goed voorbeeld van hoe OCR toegepast wordt is Google Translate. Je kan met je camera tekst inscannen en in Google Translate gebruiken. Dat is OCR ten voeten uit. Jouw camera kan waarschijnlijk sneller een Italiaanse zin van een bord invullen dan jij hem intikt. Dit maakt het veel makkelijker om overal ter wereld snel gebruik te maken van vertalingen.
Gebruik van OCR in het verkeer
OCR wordt ook gebruikt om snel nummerborden in te lezen en herkennen door camera's. De term die hiervoor gebruikt wordt is automatische kentekenplaatherkenning. Het gelezen kenteken wordt bv. gekoppeld aan een lijst met kentekens waarmee iets aan de hand is, zoals openstaande boetes of verdachten in een onderzoek. Bij een match volgt een melding. Andere toepassingen omvatten o.a. het meten van verkeersactiviteit- en overtredingen en het in- en uitrijden bij parkeerlocaties.
Over een andere boeg: bij het inplannen van een proefrit moet je gegevens van je rijbewijs invullen. Met OCR kun je je rijbewijs in een app scannen en worden je gegevens automatisch in de app ingevuld. Dat gaat een stuk sneller.
Is OCR waardevol voor jouw bedrijf?
Bottom line: met OCR kun je tekst uit afbeeldingen halen en vervolgens bewerken of gebruiken in andere processen. Het maakt dan niet uit in welke branche er gewerkt wordt: waar tekst of letters gescand kunnen worden, kan OCR bijdragen aan een verbetering van processen. In dit artikel op Medium kan je meer lezen over enkele toepassingen.
Verwerkt jouw bedrijf data? Dan kan OCR misschien helpen bij het versnellen van processen. Bijvoorbeeld door een app te laten maken die van OCR gebruik maakt. Correct en slim gebruik van OCR zorgt voor snelheid, efficiëntie en bruikbaarheid. Benieuwd of OCR waarde kan toevoegen in jouw organisatie? Als app ontwikkelaar met ruim 13 jaar ervaring denken we graag met je mee.
Tot slot een tip. Bij het omzetten van afbeeldingen naar bewerkbare documenten middels OCR kunnen fouten ontstaan, vooral bij complexere documenten. Voor een zo goed mogelijk resultaat: denk aan een goede belichting, de juiste afstand tot het document en een foto die zo recht mogelijk is. Zo heb je de meeste garanties dat OCR het resultaat oplevert wat je zoekt.
Inhoud
Gepubliceerd op 21 december 2020