Trend Mining für die Wissenschaft

Laufzeit

2013 - 2016

 

Förderung

Leibniz-Gemeinschaft (Leibniz-Wettbewerb vormals SAW-Verfahren)

Projektleitung

Dr. Michael Schwantner (FIZ Karlsruhe)

Mitarbeiter

Mustafa Sofean (FIZ Karlsruhe), Julia Maria Struß (IWiSt), Noushin Fadaei (IWiSt)

Projektbeschreibung

Der zunehmende, durch die Globalisierung weiter vorangetriebene Konkurrenzdruck macht das rechtzeitige Erkennen neuer Trends bzw. Entwicklungen durch das Forschungsmanagement an Universitäten, in der Industrie wie auch in der Politik immer wichtiger. Ziel des Projektes Trend Mining ist es daher, einen einfach zu verwendenden Prototyp zu entwickeln und zu testen, der Wissenschaftler und Information Professionals in allen Bereichen bei dieser Aufgabe mit Fokus auf Patentdokumente unterstützt.

Ergebnisse technischer und naturwissenschaftlicher Forschung werden häufig nur in Form von Patenten publiziert. Laut einer Studie von Thomson Reuters sind 70-90% des gesamten veröffentlichten technischen Wissens ausschließlich in Patentpublikationen dokumentiert ([1]). Zusätzlich nimmt die Anzahl der Patentanmeldungen seit Jahren immer weiter zu: So verzeichnet das Europäische Patentamt 2012 das dritte Jahr in Folge neue Rekorde bezüglich der Anzahl der Patentanmeldungen (vgl. [2]). Patente stellen daher eine wichtige Informationsquelle auch für die Wissenschaft dar.

In dem Projekt sollen die für das Trend Mining in Patentinformationen benötigten Methoden und Verfahren entwickelt und erprobt werden. Diese kommen in erster Linie aus dem Bereich des Text-Mining und müssen auf die schwierige Textsorte „Patent“ sowie die Erkennung von Trends adaptiert werden. Die Schwierigkeit resultiert in erster Linie aus der Patentterminologie und den von der Alltagssprache abweichenden linguistischen Strukturen. Im Zentrum der Entwicklung stehen der Nutzer / Patentexperte und sein Informationsbedarf, der zu Beginn des Projektes in einer qualitativen Untersuchung erhoben wird, und der eine Einbeziehung der Nutzer in jeder Entwicklungsstufe fordert.

Das von FIZ Karlsruhe und dem Institut IWIST der Universität Hildesheim gemeinsam durchgeführte Projekt wird von der Leibniz-Gemeinschaft im Rahmen des Leibniz-Wettbewerbs gefördert.

Referenzen
[1] The Thomson Corporation (2007): Global Patent Sources. An Overview of International Patents. 6th ed. London: Thomson Scientific. Available online at ip-science.thomsonreuters.com/m/pdfs/mgr/global_patent_sources.pdf, checked on 16/09/2013.
[2] European Patent Office (2013): Annual Report 2012. Statistics and trends. Total European patent filings. Available online at www.epo.org/about-us/annual-reports-statistics/annual-report/2012/statistics-trends/patent-filings.html, updated on 6/03/2013, checked on 16/09/2013.

Aktuelle Arbeitspakete

AP3: Text Mining und Trendanalyse

Auf mittels Überblicksrecherchen gebildeten Teilmengen werden verschiedene TDT-Verfahren erprobt, die eine Abfolge mehrerer linguistischer und statistischer Verarbeitungsschritte darstellen. Am Beginn steht die Textsegmentierung und das Identifizieren von zulässigen Teilstrukturen wie Nominal- bzw. Verbalphrasen (Chunking). Anschließend wird der Synonymieproblematik Rechnung getragen. Darauf setzen Clusterverfahren und die damit verbundenen Ähnlichkeits- und Diskriminanzanalysen auf, wobei bei der Clusterbildung primär partitionierende und probabilistische Verfahren zum Einsatz kommen, welche bisher in der Literatur die besten Ergebnisse geliefert haben.

>>mehr

 

AP4: Erstellung des Prototypen

Das Vorgehen bei der Entwicklung verfolgt die Methode des User-centered Design. In mehreren Iterationen wird dabei ein Prototyp erstellt, der es ermöglicht, Benutzer zu einem sehr frühen Zeitpunkt direkt zu beteiligen und aus der unmittelbaren Auseinandersetzung mit dem System Verbesserungsansätze zu erkennen. Die aus der Analyse der Mensch-Maschine-Interaktion gewonnenen Erkenntnisse fließen in die Optimierung des Prototyps und in die nächste Iteration ein.

>>mehr

 

 

Publikationen

Aras, Hidir; Hackl-Sommer, René; Schwantner, Michael; Sofea.n, Mustafa (2014): Applications and Challenges of Text Mining with Patents.  In : Proceedings of the First International Workshop on Patent Mining and Its Applications. At KONVENS'14. IPaMin. Hildesheim, Oct. 7th. 2014. (online)

Struß, Julia Maria; Mandl, Thomas; Schwantner, Michael; Womser-Hacker, Christa (2014): Understanding Trends in the Patent Domain. User Perceptions on Trends and Trend Related Concepts. In : Proceedings of the First International Workshop on Patent Mining and Its Applications. At KONVENS'14. IPaMin. Hildesheim, Oct. 7th. 2014. (online)

Struß, Julia Maria; Becks, Daniela; Mandl, Thomas; Schwantner; Michael; Womser-Hacker, Christa (2014): Patent Retrieval und Patent Mining: Sind die Anforderungen eingelöst? In: Ockenfeld, Marlies (Hrsg.): Informationsqualität und Wissensgenerierung. 3. DGI-Konferenz, 66. Jahrestagung der DGI. Proceedings. Frankfurt am Main, 8. bis 9. Mai 2014, S. 25–36.