Verborgene Daten nutzen: Erstellung einer Ontologie in SAP HANA Cloud
Verborgene Daten nutzen: Erstellung einer Ontologie in SAP HANA Cloud
News

Verborgene Daten nutzen: Erstellung einer Ontologie in SAP HANA Cloud

Erforschen Sie die Realisierbarkeit der Ontologie- und Wissensgraph-Entwicklung in SAP HANA Cloud auf Basis einfacher Produktdaten, um verborgene Informationen zu extrahieren und Ihre Datenstruktur zu optimieren.

Der hier beschriebene Proof of Concept (PoC) soll die Realisierbarkeit der Entwicklung einer Ontologie und eines Wissensgraphen auf der Grundlage einfacher Produktdaten und deren Implementierung in SAP HANA Cloud demonstrieren. Obwohl die Datenstruktur bewusst einfach gehalten wurde, umfassten die Spalten mit dem Produktnamen und der Produktbeschreibung umfangreiche, unstrukturierte Informationen, darunter zusätzliche Funktionen und Entitäten. Ziel war es, diese „verborgenen“ Informationen zu extrahieren und abfragbar zu machen, um die klassische, relationale Datenstruktur zu erweitern.

 

 

Technologien und Frameworks

 

Das Projekt nutzte die Graph Engine von SAP HANA Cloud zur Visualisierung von Entitäten und Beziehungen, OpenCypher für Abfragen, LangChain mit OpenAI zur Extraktion von Entitäten aus unstrukturierten Daten und hana-ml zur Verknüpfung von Python mit SAP HANA. Zusammen bildeten diese Technologien ein flexibles Framework, das strukturierte und unstrukturierte Daten in einer dynamischen Ontologie vereint.

 

 

Arbeitsablauf und Methodik

 

Der Arbeitsablauf wurde in drei Hauptphasen unterteilt:

 

  1. Erstellung der Ontologie:

    Zunächst wurde eine Ontologie erstellt, die aus vordefinierten Entitäten und neuen Entitäten besteht, die aus den Produktbeschreibungen extrahiert wurden. Die unstrukturierten Beschreibungen wurden mit NLP-Techniken verarbeitet, um relevante Merkmale und Beziehungen zu identifizieren.

 

  1. Überprüfung mit einer Teilmenge von Daten:

    Eine Teilmenge von Daten wurde verwendet, um die Qualität der Ontologie zu überprüfen. Entitäten und Beziehungen, die nicht durch die Ontologie bestätigt werden konnten, wurden verworfen, um sicherzustellen, dass nur validierte Informationen in den Wissensgraphen aufgenommen wurden.

 

  1. Dynamische Anpassung:

    Langfristig wurde eine dynamische Erweiterung der Ontologie anvisiert, um neue Informationen aus zukünftigen Datensätzen automatisch zu integrieren und das Diagramm kontinuierlich zu erweitern.

 

 

Herausforderungen und Lösungen

 

Zu den Herausforderungen gehörten die Extraktion von Entitäten aus unstrukturierten Daten, die Validierung der Ontologie und die automatische Weiterentwicklung der Ontologie mit neuen Daten. Ein entscheidendes Element war die Versionierung von Eingabeaufforderungsvorlagen, um eine insgesamt konsistente semantische Extraktionslogik zu erhalten.

 

 

Ergebnisse

 

Der PoC führte erfolgreich zur Erstellung einer Ontologie, die auf strukturierten und unstrukturierten Produktinformationen basiert. Die Graph Engine und der Graph Viewer von SAP HANA ermöglichten eine visuelle Erkundung und Analyse des Graphen. Dies zeigte das Potenzial dynamischer Ontologien, die automatisch erweitert werden können, um neue Erkenntnisse aus den Daten zu gewinnen.

 

 

Zukünftige Entwicklungen

 

Während der SAP TechEd 2024 wurde die Einführung einer neuen SAP HANA Knowledge Graph Engine angekündigt. Das Release ist für Q1/2025 geplant. Diese neue Engine soll erweiterte Abfrage- und Darstellungsstandards (Turtle, RDF) unterstützen und damit zusätzliche Flexibilität und offene Standards für ontologie- und graphbasierte Anwendungen bieten.

 

 

Autor: Philipp Nell, Solution Architect Data Management und AI, Sulzer España

Sie wollen mehr wissen?

Nehmen Sie jetzt Kontakt auf mit unseren Experten.

Anni Hoja, Head of Delivery Unit Product Intelligence
Anni Hoja
Head of Delivery Unit Product Intelligence