Projektteam Kategorisierung : Konstantin Schekotihin (links), Wolfgang Schmid (mitte) und Patrick Rodler (rechts) | Foto: Philip Gasteiger

Das Wissen der Welt organisieren

Das National Cancer Institute in New York hat über 160.000 logische Sätze zu Krebserkrankungen gesammelt. Mit der Wissensbasis will man Zusammenhänge zwischen  Symptomen, Genen und potenziellen Ursachen analysieren. Konstantin Schekotihin arbeitet gemeinsam mit Forschern der Stanford University an deren Verbesserung.

„Das Volumen von Wissen, das die Welt angehäuft hat, ist sehr groß. Wir brauchen Werkzeuge, die dabei helfen, dieses Wissen zu verarbeiten“, erklärt Konstantin Schekotihin (Institut für Angewandte Informatik). Er arbeitet nun in einem vom Kärntner Wirtschaftsförderungsfonds finanzierten Projekt an einer verbesserten Fehlersuche in großen Wissensbasen. Am Beispiel des US-National Cancer Institute erläutert er: „Solche Wissensbasen sind sehr heterogen. Sie werden von vielen Forschungsstätten befüllt. Daraus ergeben sich Fehler durch die Zusammenführung von Datensätzen. Fehlerhafte Verknüpfungen führen dann auch zu fehlerhaften Konsequenzen, die insbesondere in medizinischen Anwendungen schwerwiegende Folgen haben können.“

Widersprüchliche Darstellungen eines Sachgebiets, so Schekotihin, ergeben sich häufig erst durch Integration des formulierten Wissens unterschiedlicher ExpertInnen. Aussagen wie „Diabetes ist eine Krankheit des Bauches.“, „Der Fuß ist im Becken platziert.“ oder „Bluthochdruck ist eine Art Weichteilstörung.“ sind nur wenige Beispiele von logischen Ableitungen, die aus Fehlern in der Wissensbasis resultieren. Sie wurden von Alan Rector, Professor an der University of Manchester, gemeinsam mit Kollegen in der SNOMED-CT-Ontologie aufgespürt. Selbst für sie hat es viel Zeit in Anspruch genommen, die Ursachen solcher Fehler zu lokalisieren. Daher ist es nicht überraschend, dass MedizinexpertInnen, die diese Wissensbasen entwickeln und anwenden, vor eine kaum zu lösende Aufgabe gestellt werden.

Schekotihin und seine Kollegen arbeiten daher mit einem Algorithmus, der für die gesamte Wissensbasis Annahmen macht und diese überprüft. Das Verhalten dieses Programms erinnert an den Menschen: Wenn ein Auto beim Drehen des Zündschlüssels nicht startet, machen auch wir eine Annahme. Wir gehen zum Beispiel davon aus, dass die Batterie leer ist und überprüfen sie. Stimmt diese Annahme nicht, prüfen wir eine andere. „So geht auch der Computer vor. Er kann im Gegensatz zum Menschen Millionen Annahmen effizient vergleichen und die plausibelste auswählen“, so Schekotihin.

Ein automatisches Schlussfolgerungssystem meldet also einen Fehler in der Wissensbasis. Dann kommt der Debugger von Schekotihins Team zum Einsatz, der die Sätze aufspürt, die zu den Fehlern führen. In dem vorhin genannten Beispiel bedeutet dies, dass der Debugger die fehlerhaften Sätze findet, die zur Schlussfolgerung führen, dass die Füße ein Teil des Beckens sind. Danach können diese korrigiert werden. Die Projektpartner der Stanford University entwickeln Protégé, das am häufigsten verwendete Open-Source-Ontologie Entwicklungstool der Welt. Das Klagenfurter Team kümmert sich um das entsprechende Debugging Plug-In für Protégé.

Schekotihin möchte im Frühjahr den Prototyp dafür präsentieren. Ende 2016 soll das Programm für das National Cancer Institute umgesetzt werden. Daneben ist die Fehlersuche in Wissensbasen auch für viele andere Anwender interessant: Besonders in der Industrie 4.0, in der Entwickler und Produzenten oft an verschiedenen Orten sitzen und sich effizient miteinander austauschen können sollen, läge ein wichtiges Anwendungsfeld. „Dafür suchen wir noch Partner, die die Anwendung erproben wollen“, führt Schekotihin aus.

für ad astra:  Romy Müller