iMAGE S presenta il nuovo algoritmo di Optical Character Recognition basato su reti neurali profonde incluso nella libreria HALCON
iMAGE S spa, distributore di prodotti per la visione artificiale in ambito industriale dal 1994, è lieta di presentare il nuovo algoritmo di Optical Character Recognition basato su reti neurali profonde incluso nella libreria HALCON.
Una possibile applicazione dell’algoritmo DeepOCR è la lettura delle date di scadenza e dei lotti di produzione dei prodotti beverage. Questo è importante per verificare che i codici stampati siano leggibili e per il tracciamento dei prodotti nella catena logistica.
I materiali utilizzati in questo settore sono solitamente lucidi, variamente colorati e le geometrie sono spesso non planari. La combinazione di questi fattori genera una grande variabilità nei caratteri da leggere con la presenza di potenziali disturbi quali riflessi, distorsioni geometriche o cambi di colorazione limitando le performance degli algoritmi OCR classici. Inoltre, i testi vengono stampati molto rapidamente con una risoluzione ridotta.
Il nuovo algoritmo DeepOCR legge i caratteri indipendentemente dal font, dall’orientazione e dalla scala ed è tollerante rispetto alla distorsione geometrica e al rumore nello sfondo.
Il primo passo dell’algoritmo opera su immagini con una risoluzione fino a oltre 1 Mpixel o più grandi, previa tassellatura automatica in porzioni di dimensioni supportate, e ricerca tutti i caratteri e le parole presenti. Il secondo passo consiste nel leggere le porzioni di immagini precedentemente identificate come parole per convertirle in testo in formato digitale. L’algoritmo, totalmente preaddestrato, è pronto all’uso ma lascia la possibilità all’utente di regolare alcuni parametri per ottimizzare le prestazioni nei casi più complessi. Tra questi la risoluzione dell’immagine intera, la risoluzione del ritaglio con la parola da leggere e le soglie di rilevazione.
Con l’accelerazione di una buona scheda grafica, la ricerca di parole e caratteri in una immagine da 1 MPixel richiede un centinaio di ms. Nel caso si conosca già la localizzazione della scritta è possibile usufruire solamente della lettura che è molto più rapida: 10 ms con un buon processore e meno di 5 ms con scheda grafica.
L’algoritmo è compatibile con piattaforme embedded at the edge, tuttavia la limitata potenza di calcolo di questi sistemi determina un incremento dei tempi di elaborazione.
La libreria HALCON viene costantemente aggiornata e ampliata per mettere a disposizione degli sviluppatori gli algoritmi più aggiornati. Non solo una libreria all’avanguardia ma anche un contatto diretto con il cliente: in caso di richieste specifiche i professionisti del supporto tecnico di iMAGE S sono a disposizione.
iMAGE S presents the new algorithm HALCON DeepOCR
iMAGE S introduces Optical Character Recognition, the new algorithm based on deep neural network that is included in HALCON library
iMAGE S spa, distributor of artificial vision products for industrial environments since 1994, introduces Optical Character Recognition, the new algorithm based on deep neural network that is included in HALCON library.
DeepOCR algorithm can read expiry dates and batch numbers in beverage packages. This is important to check the readability of printed codes and product traceability along the logistic chain.
Material used in this sector are usually reflective, in colour background, and often in slanted surfaces;
The combination of all those factors generates great variability in the characters to be read, due to reflex, distortion or colour change, thus limiting the performances of classic OCR algorithms; In addition to this, texts are also fast printed and in low resolution.
The new DeepOCR algorithm can read characters regardless of their font type, orientation, and scale, and it is tolerant to geometric distortion and background noise.
The first step of an DeepOCR is operating on images of resolution of up to or higher 1 Mpixel, previously automatically pixelated in supported size, and outlines characters and words present. Second step: to read parts of images previously identified as words to convert them into digital text. Fully learnt algorithm is ready to be used and let the user adjust some parameters to optimize performances in the most complex events, such as full image resolution, image cut resolution with word to read and detection thresholds.
With a good graphic card, searching worlds and characters in an image of 1 MPixel requires a thousand ms. Yet, if lettering position is known, we can use only the reading operation, which is faster: 10 ms with a good processor and less than 5 ms with a graphic card.
The algorithm is compatible with platforms embedded at the edge, but their limited calculation capacity translates into longer processing time.
HALCON library is constantly updated and expanded to offer developers the most updated algorithms. Not only a state-of-the-art library but also a close cooperation with the customer: in case of specific requirements, iMAGE S technical support are available for help.