Terminologieerkennung und Extraktion

UNIHIL - CONNEX - MAGIC WORKS Prof. Dr. H.-J. Bentz
Forschungsforum '97 Stand 12.08.1997

WEITERE FORSCHUNGSTHEMEN: Translation Memories/Terminologieextraktion/Taginformationen/Satzalignment
Beispiele: Translation Memories

INPUTBEST HIT from SpaCAM- Translation Memory:

Any cableshould not be connected or disconnected during an electrical storm

(gut)

Cables should not be connected or disconnected during an electrical storm

Bei Gewitter dürfen keine Kabel angeschlossen oder gelöst werden

If any are missing, call your marketingrepresentativ

(gut)

If any are missing, contact your marketingrepresentative

Wenn Teile fehlen, den Vertriebsbeauftragten benachrichtigen

This section helps you when you have a problemduring display station operation

(ausreichend)

describes what to doduring display stationoperations

beschreibt Maßnahmen zur Fehlerbehebung

etc.

Overall statistics of automatic processing ( batch mode ):

86 Segments 3837 Bytes total

76 Segments with 2796 Bytes, similarity: good, ca. 73%.

9 Segments with 859 Bytes, similarity: weak, ca. 22%,

1 Segment with 182 Bytes, no similarity:, ca. 5%


Beispiele: TERMERKENNUNG

Anwendung: Terminologiedatenbanken, Satzanalyse, Übersetzungen
Beispiel Kompositum-Erkennung

ANFRAGE: BESTER TREFFER DER TERM-SpaCAM:

"Intelligente" Leitsysteme sollen die Entzerrung des enormen Straßen-
verkehrs bewältigen.
STRASSENVERKEHRSLEITSYSTEM

Diese Term-Information erlaubt nun die automatische Erkennung zusammenhänger Einheiten im Eingabesatz:

"Intelligente" Leitsysteme sollen die Entzerrung des enormen
Straßenverkehrs bewältigen.

Gestufte Liste, falls mehrere Kandidaten gefunden werden:

ANFRAGE: BESTE TREFFER DER TERM-SpaCAM:


Der Urheber hat das ausschließliche Recht, sein Werk in körperlicher Form zu verwerten. (§ 15 UrhG 2)

VERWERTUNGSRECHTE
URHEBERRECHT
URHEBER

Der Hersteller eines Tonträgers hat das ausschließliche Recht, den Tonträger zu vervielfältigen und zu verbreiten. (§ 85 UrhG 2)

VERVIELFÄLTIGUNGS- UND VERBREITUNGSRECHTE
VERVIELFÄLTIGUNGSRECHT
VERBREITUNGSRECHT

TERMERKENNUNG: Beispiele Verschachtelungen

Beachte Tippfehler !

ANFRAGE: BESTE TREFFER DER TERM-SpaCAM:

Durch das neue Verfahren hat sich die Maximatzeit zum Umspulen der Magnetbänder halbiert.MAXIMALE UMSPULZEIT

TEMPS MAXIMAL DE BOBINAGE RAPIDE

Der maximale Strom für die Aufzeichnung der Tonfrequenzen wird durch ein integriertes Bauteil geregelt.TONFREQUENZAUFZEICHNUNGSSTROM

COURANT D'ENREGISTREMENT AUDIOFREQUENCE

Das System zur Absicherung der Einlagen ist wieder in den Blickpunkt der Diskussion gerückt.EINLAGENSICHERUNGSSYSTEM

SYSTEME DE GARANTIE DES DEPOTS

TERMERKENNUNG: Beispiele

ANFRAGE: BESTE TREFFER DER TERM-SpaCAM:

Der Urheber kann vom Besitzer des Originals oder eines Verviel-fältigungsstückes seines Werkes verlangen, daß er ihm das Origi-nal oder das Vervielfältigungs-stück zugänglich macht, ...
(§ 25 UrhG 2)
ZUGANG ZU WERKSTÜCKEN
Im übrigen tritt dieses Gesetz am 1.Januar 1966 in Kraft.INKRAFTTRETEN
Laut Anwenderumfrage durch die X/Open, ein internationales Gremium zur Standardisierung herstellerunabhänger Anwendungen,...STANDARDISIERUNGSGREMIUM
Als Routineaufgabe sollen verteilte EDI-Nachrichten in einem offenen Logbuch gesammelt werden.NACHRICHTENSAMMLUNG
Das Bundesforschungsministerium unterstützt gemeinwohl-orientierte Pilotvorhaben bei grundlegenden Themen.BUNDESMINISTERIUM FÜR FORSCHUNG UND TECHNOLOGIE
Das künftige System zur Navigation für Schiffahrt, Flug- und Straßen-verkehr über Satelliten verbindet Techniken des amerikanischen GPS und des russischen GLONASS.SATELLITENNAVIGATIONSSYSTEM

Kontakt

Institut für Mathematik und Angewandte Informatik
Samelsonplatz 1
31141 Hildesheim

Sekretariat:
Telefon: +49 (0) 5121 - 883 40100
Telefax: +49 (0) 5121 - 883 40101
E-Mail: institut(at)imai.uni-hildesheim.de

Öffnungszeiten:
Mo. - Do. 8:00 - 12:00 Uhr
Fr. 8:00 - 10:00 Uhr (Vorlesungszeit)


Zudem telefonisch erreichbar:
Mo. - Do. 8:00 - 16.00 Uhr
Fr. 8:00 - 13.00 Uhr

 

Mediothek:

Öffnungszeiten:
Di. und Do. 10:00 - 15:00 Uhr