Interview mit Katariina Kari

@katsi111

Katariina Kari ist Ontologin am Zalando Tech-Hub in Helsinki. Sie ist Semantic-web-Spezialistin und berät die Kunstbranche auf dem Weg ins digitale Zeitalter. Als Gründerin von ExCLaM! Digital verbindet sie Klassische Musik und digitale Technologien. Bei Zalando modelliert sie den Fashion Knowledge Graph, mit dem Zalando die Nutzererfahrung verbessert.

Katariina-Kari-Bild

Knowledge Graphs sind ein grosses Thema an der diesjährigen DINAcon. Du baust einen solchen „Wissensgraphen“ bei Zalando. Wie könnte man das Konzept einfach erklären?

Der «Fashion Knowledge Graph» ist eine Sammlung von Konzepten aus der Mode, wie Bikini oder Strand, welches auch das Wissen über die Beziehung zwischen den Konzepten beinhaltet. Konzepte können hauptsächlich zwei Arten von Beziehungen haben, entweder assoziative oder strukturelle. So beziehen sich beispielsweise Bademode und Bikini strukturell aufeinander: Bademode ist ein allgemeineres Konzept und Bikini ist detaillierter. Bikini und Strand sind assoziativ miteinander verbunden, obwohl sie strukturell sehr unterschiedlich sind. Die Konzepte und ihre Beziehungen spiegeln wider, wie wir Menschen die Welt der Mode sehen, und so gibt der Wissensgraph dem Computer die Möglichkeit, diese Konzepte zu erkennen und durch sie besser mit uns zu kommunizieren. Viele verschiedene Anwendungen nutzen dieses Wissen um eine Benutzererfahrung zu schaffen, die die menschliche Denkweise zu verstehen scheint, so z.B. Suchleisten, Sprachbefehle und Navigationen.

 

Welche Rolle spielt Open Data in diesem Knowledge Graph?

Offene Daten und offene Ontologie haben das Potenzial, den Graphen wachsen zu lassen, indem sie Lücken im Wissen des Graphen schließen. Wikidata verfügt beispielsweise über eine umfassende Sammlung von Konzepten für Stoffe, die in den Wissensgraphen integriert werden können. Wir machen das vorerst manuell, aber ich habe bereits einige Ideenpapiere geschrieben, wie dies auch automatisch in Echtzeit geschehen könnte. Das macht Sinn in Situationen, in denen der Wissensgraph Lücken aufweist.

 

Zalando ist ein privates Unternehmen. Teilt es Daten auch mit der Open Data Community?

Zalando erkennt die Stärke einer Open-Source-Community, es ist der beste Weg zur Zusammenarbeit. Wir haben sogar unsere eigene Open-Source-Website https://opensource.zalando.com auf der wir unsere Projekte teilen. Dies sind Snippets von eigenständiger Software, die unsere Ingenieure entwickelt haben, um unsere Arbeit zu verbessern und die unsere Open-Source-Gilde zur Veröffentlichung genehmigt. Wir veröffentlichen auch Tutorials für bestimmte Technologien und teilen sie in öffentlichen Meet-ups, die wir teilweise selber organisieren.

 

Es gibt mehrere Diagrammdatenbanken da draußen, warum haben Sie sich für den W3C RDF-Stack entschieden?

Momentan kommen zwei Ansätze Graphen zu beschreiben in Frage (und mehrere Datenbankformate, die sich an das eine oder andere halten): einen Triple Store nach dem W3C RDF-Stack und Property Graphs. Die Stärke des RDF-Stacks besteht darin, dass man ein für die Maschine verständliches Schema beschreibt und dies für Reasoning verwenden kann, wodurch mehr Wissen entsteht, als ursprünglich in den Graphen geschrieben wurde. Ich sehe die Stärke des Property Graphs darin, dass es das Traversing (Durchlaufen) des Diagramms ermöglicht und bestimmte Berechnungen damit effektiver durchführt. Grob könnte man sagen, dass RDF gut für Fakten und Property Graphs gut für große Datensätze ist. Ich möchte gerne mehr Zeit damit verbringen, die Stärken beider zu vergleichen, um das besser zu verstehen. Unser Team verwendet hauptsächlich den RDF-Stack, aber wir haben Property Graphs auch schon getestet. Ich hoffe, dass wir in Zukunft mehr über die Stärken und Unterschiede der beiden erfahren können!