|
Archiv:
Schmetterlinge aus dem Scheck-Scanner
Von Banken eingesetzte Scheck-Scanner
helfen britischen Wissenschaftlern, ein Archiv mit Daten zu mehr
als 130.000 Schmetterlings-Arten via Internet für die Öffentlichkeit
verfügbar zu machen.
(jkm) - Schmetterlinge machen
schätzungsweise zehn Prozent aller bekannten Spezies aus.
Bislang existiert jedoch kein umfassender Katalog dieser Tiergruppe.
Britische Zoologen und Informatiker haben diese Mammutaufgabe
nun in Angriff genommen. Mit Hilfe von Scannern erfassten sie
rund 290.000 teils handgeschriebene Zettel aus dem Londoner National
Museum of Natural History und stellen die Daten nun frei verfügbar
ins World Wide Web.
Die Kartensammlung des Museums
enthält Informationen über knapp 138.000 Arten von Schmetterlingen
(Lepidoptera). Wollten Insektenkundler Zugriff diesen Datenfundus
nutzen, mussten sie sich bislang nach London bemühen und
dann zum Teil über einhundert Jahre alte handschriftliche
Notizen entziffern. Im Rahmen des Projekts VIADOCS (Versatile,
Interactive, Archive Document Conversion System) griffen die Zoologen
und Informatiker nun auf eine Technik zurück, die sich beim
automatischen Erkennen handgeschriebener Buchstaben und Ziffern
bewährt hat: Von Banken eingesetzte Scheck-Scanner.
"Vor einigen Jahren schätzten
wir, die Archivdaten per Hand in eine Datenbank einzugeben würde
einen Aufwand von 430 Personen-Jahren bedeuten", erläutert
Malcolm Scoble, Leiter des Projekts an dem Museum. Dank der neuen
Erfassungs- und Auswertemethoden könne die Arbeit binnen
drei Jahren bewerkstelligt werden, Korrekturen seien kaum nötig.
"Letztlich wird diese bedeutende Quelle nicht nur bewahrt,
sondern auch für Experten und Amateuren in der ganzen Welt
zugänglich."
Mit Hilfe der Scanner wurden Vorder-
und Rückseite der Karten digitalisiert und die Daten mit
Hilfe einer speziell angepassten Optical Character Recognition
(OCR)-Software in die Datenbank überführt. Mit den Informationen
über eine Art werden jedoch gleichzeitig die eingescannten
Bilder angezeigt, um auf Nummer Sicher zu gehen.
Derzeit sind die Daten von knapp
28.000 Spezies aus sieben Überfamilien abrufbar. Bis zum
Herbst diesen Jahres sollen auch die Daten der restlichen 110.000
verfügbar sein.
|