Womit beschäftigen sich Erfinder?

Montag, 13. Oktober 2014 um 18:00 Uhr

Wie kann man früh technologische Trends erkennen? Professorin Christa Womser-Hacker und Professor Thomas Mandl wenden Methoden des „Text Mining“ an. Sie „graben" nach Informationen, um zu erfassen, welche Erfindungen im Trend liegen, etwa in Deutschland, der EU und Asien. Verlässliche Hinweise, was sich in der Forschung etwa in der Energie-, Medizin- und Computertechnik tut und wo sie hingeht, stecken in Patentdatenbanken.

Patentrecherche ist aufwendig – früher ging ein Fachmann an einen Schrank mit Patent- und Offenlegungsschriften im Patentamt, um zu prüfen ob eine Erfindung schon gemacht wurde. Ein Patent schützt das geistige Eigentum der Tüftler.

Mittlerweile liegt eine Fülle an digitalem Wissen vor – und das in vielen verschiedenen Sprachen. Informationswissenschaftlerinnen und Informationswissenschaftler der Universität Hildesheim entwickeln Methoden und (halb-)automatische Verfahren, um in Patentdatenbanken Trends bei technologischen Entwicklungen zu erkennen: Womit beschäftigen sich Erfinder? Woran forscht die Konkurrenz? Dafür arbeitet die Arbeitsgruppe um Professorin Christa Womser-Hacker und Professor Thomas Mandl mit dem FIZ Karlsruhe zusammen. Verlässliche Hinweise, was sich in der Forschung etwa in der Energie-, Medizin- und Computertechnik tut und wo sie hingeht, stecken in Patentdatenbanken. So bietet das Leibniz-Institut für Informationsinfrastruktur mit dem Online-Dienst STN weltweit Zugang zu etwa 150 Datenbanken mit Forschungs- und Patentinformationen mit derzeit mehr als 1,5 Milliarden Dokumenten.

Die Forscherinnen und Forscher wenden nun Methoden des „Text Mining“ auf Patenttexte an – sie „graben“ nach Informationen wie auf einer Schatzsuche. „Wir reichern Patentdaten mit Bedeutung an, verknüpfen sie und können erfassen, welche Erfindungen im Trend liegen“, beschreibt Julia-Maria Struß das Ziel, zu einem möglichst frühen Zeitpunkt, Entwicklungen zu erkennen. Die Informationswissenschaftlerin arbeitet im Forschungsprojekt „Trend Mining für die Wissenschaft“ mit.

Die Suche nach Patenten ist ein komplexer Prozess. Da ist die unübersichtliche Datenmenge – allein in Niedersachsen wurden nach Angaben des Deutschen Patent- und Markenamts 2013 knapp 3000 Patente angemeldet, beispielsweise ein intelligenter Stromzähler. Die meisten Anmeldungen kommen aus Bayern und Baden Württemberg (jeweils knapp 15.000 Patentanmeldungen). Die Anzahl der Anmeldungen nehmen jährlich zu, 2013 zählte das Europäische Patentamt 265.690 Anmeldungen (2,8% mehr als 2012).

Von der Alltagssprache abweichende linguistische Eigenheiten erschweren die Suche, so enthalten die Texte neben technischen und juristischen Teilen auch vage Formulierungen. Ein Befestigungs- und Verbindungselement aus Metall ist eine einfache Schraube. Ergebnisse technischer und naturwissenschaftlicher Forschung werden häufig nur in Form von Patenten publiziert. Fachleute schätzen, dass 70 bis 90% des gesamten veröffentlichten technischen Wissens ausschließlich in Patentpublikationen dokumentiert ist (The Thomson Corporation, 2007: Global Patent Sources). Eine wertvolle Informationsressource.

Wer verschläft, was die Konkurrenz macht und die Entwicklungen, die später zu marktreifen Produkten führen, nicht beobachtet, hat Nachteile im Wettbewerb. Will ein Unternehmen aus einer vermeintlichen Erfindung ein Produkt erstellen, muss es prüfen, ob jemand schneller war oder ob es parallele Forschungs- und Entwicklungsarbeiten gibt. Neue Tendenzen rechtzeitig aufzuspüren, wird für die Industrie und Wissenschaft zunehmend zu einer wichtigen Frage. Die Hildesheimer Forschergruppe identifiziert Begriffsnetze, um deren Vorkommen in den Datenbanken zu beobachten. Ein Hinweis kann sein, wenn eine Formulierung mit der Zeit häufiger auftaucht – etwa aktuell der Trend zum 3D-Druck. Die Informationswissenschaftler befassen sich auch mit der Frage, wie man aus Texten Zeitangaben filtern kann, die trotz zeitlicher Verschiebung Vergleichbarkeit schaffen. „Es gibt noch keine vollständig automatischen Systeme, die alle Zeitangaben aus mehrsprachigen Texten herausholen können. Die Angaben sind aber wichtig, denn zwischen Einreichung und Veröffentlichung des Patents liegen etwa 18 Monate. Wir beziehen auch geografische Daten in die Analyse ein, ein Trend kann in Deutschland anders verlaufen als in der EU und in Asien“, sagt Christa Womser-Hacker.

Das Forschungsprojekt „Trend Mining für die Wissenschaft“ umfasst zunächst englische Patenttexte und wird bis 2016 mit 500.000 Euro von der Leibniz-Gemeinschaft gefördert.

Um Informationen aus großen Dokumentmengen zu ziehen, kooperieren die Forscherinnnen und Forscher des Instituts für Informationswissenschaft und Sprachtechnologie auch mit dem führenden informationswissenschaftlichen Institut in Südkorea „KISTI“ (Korean Institute of Science and Technology Information). Es verfügt über einen der zehn schnellsten und leistungsfähigsten Computer der Welt. In mehrmonatigen Forschungsaufenthalten besuchen sich Wissenschaftler aus Hildesheim und Daejeon gegenseitig und forschen gemeinsam an den Patenttrends – vor allem an den maschinellen Verfahren zu deren Aufdeckung. Die Koreaner gehen noch einen Schritt weiter und entwickeln präskriptive Verfahren, die Ratschläge geben, in welchen Bereichen es sich zu patentieren lohnt.

Auch die Studierenden profitieren von der südkoreanisch-deutschen Kooperation. Mit der Paichai University in Daejeon und der Chungbuk National University sowie der Universität Graz besteht ein gemeinsamer Joint Degree Studiengang „Global Studies on Management and Information Science“ (GLOMIS), der Studierende und Wissenschaftler aus Europa nach Asien sowie von Asien nach Graz und Hildesheim führt. Federführend hierbei sind Professor Thomas Mandl und Dr. Folker Caroli. Die Europäische Kommission fördert diesen Austausch über ein besonderes Programm vorerst bis 2017 (Tempus & Bilateral Cooperation with Industrialised Countries).

Info: Konferenz in Hildesheim

Die 12. KONVENS-Tagung der Gesellschaft für Sprachtechnologie und Computerlinguistik findet vom 8. bis 10. Oktober 2014 an der Universität Hildesheim statt. Ein Workshop vor der Konferenz widmet sich dem Patent Retrieval und Mining.

Info: Was sind Patentinformationen?

„Mit der Erteilung eines Patents liegt ein Vertrag zwischen Anmelder und Staat vor. Der Erfinder erhält vom Staat als ‚Belohnung‘ für seine Innovation eine Monopolstellung eingeräumt (zeitlich und räumlich begrenztes alleiniges Verfügungsrecht über seine Erfindung). Im Gegenzug muss der Patentanmelder seine Erfindung der Öffentlichkeit vollständig offenbaren. Diese Offenbarung übernimmt das Patentamt für ihn durch Publikation der Patentdokumente. Der Weg von der Idee zum Patent mag international unterschiedlich sein. Alle Patentgesetze weltweit sehen jedoch die Publikation einer Patentschrift mit der Erteilung des Patents vor“, erläutert das Deutsche Patent- und Markenamt. Eine Patentinformation enthält technische, bibliographische und rechtliche Informationen. So sind in den Patent- und Offenlegungsschriften das technische Wissen sowie Angaben zum Anmelder, Erfinder, Anmeldetag und Anmeldeland enthalten. Die Schriften informieren über den Rechts- und Verfahrensstand und den Verlauf des Patentverfahrens, etwa ob das Patent noch in Kraft ist.

Fakten und Zahlen

Wie viele Patente werden angemeldet, welche Länder führen? Wie erfinderisch sind Volkswirtschaften in Europa? Die Schweiz und einige nordische Länder lagen 2013 an der Spitze. Das größte Anmeldevolumen liegt in der Medizintechnik, gefolgt von elektr. Maschinen, Energie und digitaler Kommunikation. Asiatische und amerikanische Anmelder dominieren in der Computertechnik. Mehr in: Fakten und Zahlen 2014. Europäisches Patentamt (PDF)


Ein Forscherteam der Universität Hildesheim arbeitet an Wegen, um aus mehrsprachigen Texten Zeitangaben zu filtern. Es gibt bisher keine automatischen Systeme, die trotz zeitlicher Verschiebung Vergleichbarkeit schaffen. Die Angaben sind aber wichtig, denn zwischen Einreichung und Veröffentlichung eines Patents liegen nur etwa 18 Monate. Foto: Isa Lange/Uni Hildesheim (Abb. Wahrig Wörterbuch der deutsche Sprache)

Ein Forscherteam der Universität Hildesheim arbeitet an Wegen, um aus mehrsprachigen Texten Zeitangaben zu filtern. Es gibt bisher keine automatischen Systeme, die trotz zeitlicher Verschiebung Vergleichbarkeit schaffen. Die Angaben sind aber wichtig, denn zwischen Einreichung und Veröffentlichung eines Patents liegen nur etwa 18 Monate. Foto: Isa Lange/Uni Hildesheim (Abb. Wahrig Wörterbuch der deutsche Sprache)

Ein Forscherteam der Universität Hildesheim arbeitet an Wegen, um aus mehrsprachigen Texten Zeitangaben zu filtern. Es gibt bisher keine automatischen Systeme, die trotz zeitlicher Verschiebung Vergleichbarkeit schaffen. Die Angaben sind aber wichtig, denn zwischen Einreichung und Veröffentlichung eines Patents liegen nur etwa 18 Monate. Foto: Isa Lange/Uni Hildesheim (Abb. Wahrig Wörterbuch der deutsche Sprache)