Negli ultimi anni il settore della visione industriale è in costante evoluzione, grazie allo sviluppo di tecnologie sempre più efficaci che permettono la creazione di prodotti di precisione e di conseguenza la risoluzione di casistiche e variabili sempre più complesse
iMAGE S ha studiato nel tempo ed è riuscita a integrare due tra le tecnologie che ultimamente svolgono un ruolo protagonista nello sviluppo dell’automazione industriale: Iperspettrale e Deep Learning. La prima è una tecnologia nota da tempo, ma utilizzata molto poco in passato a causa dei costi elevati che il progresso ha permesso di appianare; la seconda, invece, è una delle più innovative degli ultimi decenni.
Iperspettrale e Deep Learning offrono soluzioni su diversi livelli e campi di applicazione: proprio per la loro versatilità iMAGE S si pone come punto di riferimento per chi sviluppa sistemi di visione non limitandosi soltanto a fornire i prodotti necessari, ma mettendo a disposizione il proprio know-how tramite analisi, consulenza mirata e studi di fattibilità volti ad ottenere il massimo dalle tecnologie del mercato.
Un interessante caso applicativo legato al settore alimentare riguarda la necessità di dover misurare, in maniera precisa e costante, la quantità di grasso presente nel processo di produzione di insaccati.
Oltre a questa prima problematica, il cliente aveva l’ulteriore esigenza di poter leggere in ogni circostanza la data di scadenza e le informazioni riportate sulle etichette.
Dopo un’attenta analisi, per il rilevamento del grasso si è deciso di sviluppare un sistema di visione che combinasse la camera iperspettrale SPECIM FX10 e il software Teledyne Dalsa Astrocyte. Per la lettura delle etichette il problema è stato risolto utilizzando il tool Deep OCR presente nella libreria MVTec HALCON: esso consente il riconoscimento ottico dei caratteri anche deformati oppure stampati in maniera non perfetta.
SPECIM FX10 opera nelle bande del visibile e vicino infrarosso consentendo analisi colorimetriche con una precisione non raggiungibile con le telecamere a colori di utilizzo comune basate su filtri rossi, verdi e blu. Algoritmi dedicati sviluppati internamente consentono poi di elaborare la rilevante mole di dati prodotti dai sensori per generare un’immagine in falsi colori che metta in evidenza le caratteristiche richieste dal cliente.
Teledyne DALSA Astrocyte consente agli utenti di sfruttare le proprie immagini di prodotti, campioni e difetti per addestrare le reti neurali a svolgere una varietà di attività come il rilevamento di anomalie, la classificazione, il rilevamento di oggetti, la segmentazione e la riduzione del rumore.
Con la sua interfaccia utente grafica altamente flessibile, Astrocyte consente di visualizzare e interpretare i modelli per prestazioni/accuratezza, nonché di esportare questi modelli in file pronti per il runtime nelle piattaforme software di visione Teledyne DALSA Sapera e Sherlock.
Con Deep OCR, MVTec introduce un approccio olistico basato sul deep learning per il riconoscimento ottico dei caratteri. Deep OCR può localizzare numeri e lettere in modo molto più robusto, indipendentemente dal loro orientamento, tipo di carattere e polarità. La possibilità di raggruppare i caratteri consente automaticamente l’identificazione di intere parole. Ciò migliora notevolmente le prestazioni di riconoscimento ed evita l’errata interpretazione di caratteri con aspetti simili.
Deep Learning and hyperspectral in the food sector: A case study
In recent years, industrial vision sector has been constantly evolving thanks to the development of increasingly efficacious technologies that enable creating precision products, and therefore solving complex cases and variables
Over time, iMAGE S has studied and succeeded in integrating two technologies that have recently been protagonists in the development of industrial automation: Hyperspectral and Deep Learning. The first is well-known but very little used in the past due to high costs that however progress has helped to decrease; The second is one of the most innovative technologies of the latest decades.
Hyperspectal and Deep Learning offer solutions for different levels and fields of application; it is just for their versatility that iMAGE S has become a reference name for whomever develops vision systems by offering its own know-how through analysis, tailored advise, and feasibility studies that aim at getting the best from market’s technologies.
An interesting case history linked to the food sector is about the requirement of measuring – precisely and constantly – the quantity of fat in the production process of cured meats. In addition, the customer also required to read the best-before date and information on labels on any circumstance.
After accurate analysis, a vision system combining hyperspectral camera SPECIM FX10 and software Teledyne DALSA Astrocyte was developed. For label reading the solution proposed was Deep OCR tool of the MVTec HALCON library: it enables Optical Character Recognition, even when they are deformed or incorrectly printed.
SPECIM FX10 operated in visible and near-infrared bands allowing colorimetric analysis of accuracy impossible with colour cameras based on red, green and blue filters. In-house developed dedicated algorithms enable processing relevant amounts of sensor-produced data to generate a false-colour image that highlights the features requested by the customer.
Teledyne DALSA Astrocyte empowers users to harness their own product images of products, samples, and defects to train neural networks to perform a variety of tasks, such as anomaly detection, classification, object detection, segmentation, and noise reduction.
With its highly flexible graphical user interface, Astrocyte allows to visualize and interpret models for performance/accuracy as well as exporting those models to files that are ready for runtime in Teledyne DALSA Sapera and Sherlock vision software platforms.
With Deep OCR, MVTec introduces a holistic deep-learning-based approach for optical character recognition. Deep OCR can localize numbers and letters much more robustly, regardless of their orientation, font type, and polarity. The ability to group characters automatically allows the identification of whole words. This improves the recognition performance significantly and avoids the misinterpretation of characters with similar appearances.