Logo HU Berlin
Logo FU Berlin Logo Xinnovations

Impulse

zur Übersicht

Dr. Georg Rehm

Deutsches Forschungszentrum für Künstliche Intelligenz GmbH

Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergründe, Beispiele, Prototypen

Vortrag zur Fachtagung vom 11. Oktober 2016

Das DFKI hat in den ersten 12 Monaten des zweijährigen Projekts “Digitale Kuratierungstechnologien” insbesondere in drei verschiedenen Bereichen Forschungs- und Entwicklungsarbeit geleistet: semantische Analyse von Dokumenten, semantische Generierung und Mehrsprachigkeit. Der Vortrag beschreibt zunächst die Motivation für Kuratierungstechnologien in diesen Bereichen sowie spezielle Anforderungen der vier Industriepartner und deren individuelle Anwendungsfälle. Der Fokus der Präsentation liegt auf verschiedenen Funktionalitäten, für die bereits erste prototypische Implementierungen vorliegen:

  • Generierung semantischer Netze zur Annotation und Exploration von Dokumentsammlungen
  • Analyse generischer Zeitausdrücke als Basis von Timelining-Funktionen
  • Integration domänenspezifischer Wissensquellen in die semantische Analyse sowie in die semantische Generierung
  • Automatische Übersetzung als Teil von Kuratierungsworkflows
  • Standardisierte Schnittstellen und Formate für die Nutzung in industriellen Kuratierungsszenarien
  • Zusammenführung der Prototypen in einem Kuratierungs-Dashboard


Der Vortrag schließt mit einem Ausblick auf die für das zweite Jahr geplanten Arbeiten in DKT und geht auf potentielle zukünftige Forschungsthemen ein.

Präsentation ansehen (PDF)

 

Demo Session

Im Rahmen der Demo Sessions zeigt das DFKI erste prototypische Implementierung digitaler Kuratierungswerkzeuge, die nachfolgender Screencast exemplarisch darstellt.

 

--

Keynote: Digitale Kuratierung – Semantische Technologien halten Einzug in unterschiedliche Branchen

Vortrag zum Statusmeeting vom 6. Oktober 2015

[Gemeinsam mit Dr. Felix Sasaki]

In zahlreichen Branchen wird der Arbeitsalltag von Referenten, Redakteuren, Produzenten, Autoren, Journalisten und sonstige Wissensarbeitern maßgeblich bestimmt durch das Auswählen, Sichten, Evaluieren, Einordnen, Verarbeiten, Verdichten, Visualisieren, Zusammenfassen, Übersetzen, Sortieren und Schreiben von Dokumenten und Informationen aller Art. Ziel ist dabei die Erstellung neuer Dokumente und Informationen – abhängig von der Wertschöpfungskette und den Gegebenheiten der jeweiligen Branche. Dieses Kuratieren digitaler Informationen, Daten, Meldungen und Medieninhalte hat sich in den vergangenen Jahren als eine grundlegende Tätigkeit mit neuen Anforderungen herauskristallisiert, die von handelsüblicher Software schon längst nicht mehr abgedeckt wird, zumal die Anforderungen hinsichtlich Geschwindigkeit, Volumen und Anzahl der zu verarbeitenden Informationen stetig steigen. Das am 1. September 2015 gestartete, vom BMBF geförderte Verbundprojekt Digitale Kuratierungstechnologien (DKT) untersucht, inwieweit semantische Technologien zur Unterstützung derartiger Kuratierungsprozesse eingesetzt werden können. Speziell geht es um eine bessere Unterstützung menschlicher Wissensarbeiter in branchenspezifischen Kuratierungs-Workflows. Dazu kooperiert das Deutsche Forschungszentrum für Künstliche Intelligenz GmbH (DFKI), Forschungsbereich Sprachtechnologie, mit den vier Berliner Unternehmen ART+COM AG, Condat AG, 3pc Neue Kommunikation GmbH und kreuzwerker GmbH. Der Vortrag gibt einen Überblick über die Ziele des Verbundprojekts.

---

Digitale Kuratierungstechnologien - Intelligente Software für den Arbeitsplatz von morgen

Keynote zum Statusmeeting vom 6. Oktober 2014

[Gemeinsam mit Dr. Felix Sasaki]

Das Kuratieren digitaler Informationen und Medieninhalte hat sich in den vergangenen Jahren als eine grundlegende Tätigkeit herauskristallisiert, die an zahlreichen Arbeitsplätzen, in den verschiedensten Branchen und unterschiedlichsten Unternehmen eine entscheidende Rolle einnimmt. Dabei werden Unternehmen mit immer höheren Anforderungen konfrontiert, da in allen Kuratierungsphasen wie Akquirieren, Prozessieren und Distribuieren eine immer höhere Qualität für stetig steigende Datenmengen mit verschiedenen Materialien in möglichst kurzer Zeit erwartet wird, die von regulären Content-Management- oder Redaktionssystemen schon längst nicht mehr abgedeckt werden. Eine (semi-)automatisierte Unterstützung dieser Prozesse durch semantische Technologien hätte für die Unternehmen eine starke kostenmindernde Wirkung. Derzeit planen wir ein Vorhaben, um aktuelle semantische Technologien in die Wirtschaft zu transferieren, um Unternehmen in die Lage zu versetzen, multimediale Inhalte in unterschiedlicher Weise für zahlreiche Märkte und in unterschiedlichen Schritten der Datenwertschöpfungskette digital anreichern und kuratieren zu können.

Der Vortrag erläutert zunächst, was wir unter “digitaler Kuratierung” verstehen und gibt anschließend verschiedene Beispiele für digitale Kuratierungstechnologien.

Präsentation ansehen (PDF)

---

Mehrsprachigkeit und semantische Technologien

Vortrag zum Statusmeeting vom 6. Oktober 2014

[Gemeinsam mit Dr. Felix Sasaki]

Linked Data und Mehrsprachigkeit haben ein fruchtbares Verhältnis. Linked Data kann zum einen helfen mehrsprachige Anwendungen zu verbessern, zum Beispiel im Bereich automatische Übersetzung oder sprachübergreifende Suche. Zum anderen können sprachverarbeitende Methoden helfen semantische und verlinkte Ressourcen zu generieren. Der Vortrag stellt aktuelle Forschungsergebnisse zur Thematik vor und praxisnahe Anwendungsszenarien aus den Bereichen: automatisierte Übersetzungsworkflows, Aggregation sprachübergreifender Informationen, Übersetzerunterstützung sowie lokalisierungsspezifische Inhaltsgenerierung. Im letzten Fall sind auch nicht sprachlich Aspekte wie adäquates Layout im jeweiligen Ausgabemedium relevant.

---

Lösungen für linguistische Ressourcen im Web – META-NET und META-SHARE

Vortrag zur Fachtagung vom 26. September 2013

[in Zusammenarbeit mit John H. Weitzmann]

Die Präsentation gibt zunächst einen Überblick über die EU-geförderte Initiative META-NET, die es sich zum Ziel gesetzt hat, die technologischen Grundlagen der mehrsprachigen europäischen Informationsgesellschaft zu legen. Ein Teilprojekt von META-NET beschäftigt sich mit der Entwicklung einer verteilten Infrastruktur für linguistische, computerlinguistische und sprachtechnologische Datensammlungen. Aktuelle Verfahren zur Be- und Verarbeitung natürlicher Sprache benötigen derartige sehr große Datenmengen u.a. für maschinelle Lernverfahren. Ziel dieser Infrastruktur namens META-SHARE ist es, eine zentrale Plattform für derartige Datensammlungen aufzubauen, so dass Doktoranden, Forschungseinrichtungen und spezialisierte Unternehmen diese finden und einsetzen können. Die Präsentation erläutert META-SHARE und geht insbesondere auf die zahlreichen rechtlichen Schwierigkeiten, Herausforderungen und die von uns erarbeiteten Lösungen ein.

Präsentation ansehen (PDF)

Kurzbiografie

Dr. Georg Rehm ist Wissenschaftler am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Berlin. Projektmanager des EU-geförderten Exzellenznetzwerks META-NET, das aus 60 Forschungszentren in 34 Ländern besteht. Das Ziel von META-NET sind innovative Forschungsergebnisse im Bereich Sprachtechnologie (insbesondere: Maschinelle Übersetzung) und ihr Transfer in die Industrie, sowie die Einwerbung zusätzlicher Fördermittel auf europäischer und nationaler/regionaler Ebene (in enger Kooperation mit der Europäischen Kommission, Luxemburg). Wissenschaftlicher Hintergrund: Abschluss in Computerlinguistik und künstlicher Intelligenz, Informatik und Sprachwissenschaft; Promotion in Computerlinguistik.