Erschließung und Digitalisierung forschungsrelevanter Objekte / Standardbildung als Ziel
Das Projekt entwickelt und dokumentiert ein softwareunterstütztes Standardverfahren zur Extraktion von Metadaten aus Bildern von „Herbarbelegen“, d.h. getrockneten gepressten und auf Papierbögen montierten Pflanzen(teilen). Das Verfahren adressiert einen großen Bereich naturwissenschaftlicher Sammlungen, allein in Deutschland liegen ca. 22 Millionen Herbarbelege vor, weltweit über 500 Mio. Metadaten wie Artname, Fundort und -datum, Sammler, Katalognummern etc. werden mit Etiketten, Barcodes usw. flächig sichtbar auf den Bogen gebracht und damit im Foto oder Scan abgebildet. Bisher werden die Metadaten manuell in Sammlungsdatenbanken eingegeben, aber zunehmend werden Bilderfassungsverfahren eingesetzt, die auch die Nachprüfbarkeit der online verfügbaren Metainformation sichern. Das Standardverfahren soll nun so weit wie möglich die manuelle Metadatenerfassung ersetzen oder ergänzen. Bildverarbeitungssoftware erkennt Objekte auf dem digitalisierten Herbarbeleg und klassifiziert sie. Die Textobjekte werden mit Hilfe von Text-Mining Algorithmen in strukturierte Information überführt. Bei Handschriften wird versucht, den Autor zu erkennen. Im Projekt wird vorhandene Software evaluiert, unter Bildung von standardisierten Interfaces weiterentwickelt und in eine übergreifende offene Softwarearchitektur auf Grundlage etablierter IT-Standards integriert. Abschließend wird das Verfahren hinsichtlich seiner Anforderungen als Standard formuliert und hinsichtlich seiner Anwendung dokumentiert.