Matrox Imaging OCR-software leest tekstveldgegevens van Surveyor-missies

12 januari 2018
DVC component news
Matrox Imaging OCR-software leest tekstveldgegevens van Surveyor-missies

NASA en de Universiteit van Arizona bundelden hun krachten in een initiatief om de filmbeelden en gegevens van de Surveyor-missies die sinds de jaren zestig in opslag waren, te digitaliseren. Het team van het Lunar and Planetary Laboratory (LPL) ontdekte al snel dat de personages in de filmbeelden een dotmatrixindeling waren vergelijkbaar met teletype, waardoor het een uitdaging is om een OCR-software te vinden die de tekstvelden kan lezen.
Ontdek hoe de OCR-softwareoplossing van Matrox Imaging het probleem van het nauwkeurig lezen van meer dan 92.000 afbeeldingen prachtig aanpakt, waarmee het arbeidsintensieve proces voor operators wordt gestroomlijnd en de totale digitalisatietijd tot slechts enkele minuten per rol wordt teruggebracht.

Het Lunar and Planetary Laboratory (LPL) van de Universiteit van Arizona herbergt het Space Imagery Center, een NASA Regional Planetary Image Facility. LPL, opgericht in 1960, was een van de weinige plaatsen die zich bezighielden met studies van het zonnestelsel in die tijd.
In 2015 werkte de NASA samen met de Universiteit van Arizona aan de financiering van de digitalisering van de filmbeelden en gegevens van de Surveyor-maanlanders die sinds de jaren zestig in opslag waren. Het doel is om een archief te maken voor opname in het Planet Planet Data System (PDS) van de NASA, een verzameling gegevensproducten van NASA-planetaire missies. Zoals John Anderson, senior mediatechnicus bij LPL, het beschrijft, zijn "focus en primaire verantwoordelijkheidsgebied is de digitale opname van de beelden, het extraheren en decoderen van de gecodeerde beeldgegevens optisch vastgelegd op elk filmframe, en het verwerken van de beelden om te bekijken in een digitaal formaat."

GRONDSTOFFEN

Tussen 1966 en 1968 keerden de vijf succesvolle Surveyor-missies meer dan 92.000 individuele beelden van het oppervlak van de maan terug. Filmbeelden werden gecreëerd door een filmcamera van 70 mm scherp te stellen op een nauwkeurige CRT-beeldscherm en gefotografeerd te worden op een speciale opnamefilm.
In de 50 jaar daarna zijn de computerbestanden en videobandrecords lang verdwenen of verouderd - de enige bestaande kopieën van de afbeeldingen zijn de filmrollen.

Veel frames van de Surveyor-missies hadden een duidelijk leesbare tekst, waarvan de operators aanvankelijk dachten dat ze gemakkelijk konden worden gelezen door conventionele OCR-software (Optical Character Recognition). Ze ontdekten al snel dat de personages in de tekst een puntmatrix waren die leek op oude printers met een 7x9 teletypestijl, waardoor het een uitdaging is om een OCR-software te vinden die de tekstvelden nauwkeurig kan lezen. Een uitgebreide OCR-oplossing was nodig.

EEN STELLAR    OPLOSSING

Hier komt Matrox om de hoek kijken. Anderson merkt op: "Lorne Trottier, mede-eigenaar van Matrox, zag een artikel in Planetary Report over het NASA PDS-project." Hij benaderde de universiteit via Arnaud Lina, directeur onderzoek en innovatie bij Matrox Imaging , het aanbieden van assistentie met behulp van de OCR-software van Matrox om de tekstinformatie van LPL te lezen. [LPL] selecteerde enkele bijgesneden afbeeldingen om te uploaden voor een test en de resultaten waren geweldig.Het was zeer bemoedigend, vooral omdat andere OCR-producten de leesbare tekst niet konden lezen (HRT)."

MISSION CONTROL

Het totale project omvat het creëren van een doorzoekbaar archief dat de conventionele opslagplaatsen voor fysieke media zal overleven. Gezien het mogelijke referentiepotentieel op lange termijn van de afbeeldingen en gegevens, is er behoefte aan een zorgvuldige en nauwkeurige behandeling van de bronnen.
De workflow bestond uit een beeldscansysteem van Stokes Imaging. Het Stokes Imaging System legde tussen de vier en acht frames per minuut vast als hoge resolutie TIFF-afbeeldingen. Aan het einde van de scanfase bevonden LPL zich met meer dan 92.000 individuele afbeeldingen.
Operatorinteractie was intensief tijdens het oorspronkelijke scanproces. Terwijl het Stokes Imaging System geautomatiseerd was, was de film zelf niet uniform in afstand, indexering, belichting of verwerking. Na het scannen werden de Adobe® Photoshop®- en MATLAB-software gebruikt om de details te selecteren en grote samengestelde mozaïeken te maken uit de afbeeldingsbestanden. Het proces vereiste ook een handmatige foutcontrole, omdat het decoderen van de puntveldgegevens was gebaseerd op kalibratie-onderzoektabellen die waren gemaakt op basis van de oorspronkelijke testgegevens uit 1966 voorafgaand aan de lancering

 LIFTOFF

Het project begon in februari 2015 met de montage van het Stokes-systeem en blijft de informatie in de afbeeldingen verwerken, catalogiseren en data-mining.

Hoewel er tandwielperforaties op de filmvoorraad aanwezig zijn, was het oorspronkelijke opneemtransport tandwielloos, hetgeen resulteerde in inconsistente frameafstand evenals frames die ten opzichte van de randperforaties afdrijven. Het team van LPL was niet in staat om een ​​consistent filmverloop te bepalen en bij elke nieuwe filmrol verschoof de afstand tussen de frames en de laterale positionering van het beeld. Dit resulteerde in algemene afbeeldingen met tekst op verschillende plaatsen, evenals enkele afbeeldingen die bedorven waren met artefacten. Bovendien hebben de gegevensvelden HRT met variërend aantal tekens.

De oplossing van Matrox - gebaseerd op een van zijn efficiënte en nauwkeurige OCR-softwaretools - gaf een prachtig antwoord op het probleem van het lezen van matrix-tekens en reduceerde de tijdsbesteding tot enkele minuten per rol.
De eerste beoordeling van de OCR-oplossing van Matrox vertoonde een bijna perfecte lezing van bijna 4.500 verschillende beeldbestanden. Voor rol 1 van missie 5 heeft de Matrox OCR-oplossing bijvoorbeeld 846 bestanden gescand en 15.191 afzonderlijke velden gelezen voor een verbluffende nauwkeurigheid van 99,77%. Rollen 2 en 9 van Mission 5 waren zelfs beter, met respectieve nauwkeurigheidsniveaus van 99,92% en 100%.

DVC Machinevision bv hoofdkantoor

Minervum 7069
4817 ZK Breda
Nederland

T. +31 (0)76 544 05 88
F. +31 (0)76 541 78 93
E. sales@machinevision.nl

KvK Breda # 14057165
BTW nr NL.80.66.47.772.B01
Bank IBAN NL50RABO0156555603
BIC code RABONL2U

FoodTechPark business development office

Scheepsboulevard 3
5705 KZ Helmond
Nederland