Hallo!
Ich möchte im Rahmen der Bakkarbeit ein Tool entwickeln, das Informationen aus Dokumenten auslesen kann und diese in ein Format bringt, das mit einer Software wie PersonalBrain gelesen wird. Also aus einem Prosatext einen Graphen machen (ähnlich wie Mindmap aber polyhierarchisch).
Im Prinzip bietet sich ja sowas wie OWL dafür an. Die einzelnen Informationsklassen müssen dabei im Text ja gekennzeichnet werden.
Jetzt könnte ich es mir ja leicht machen und sagen, der Ausgangstext ist schon ein XML-Dokument indem die Tags bereits so definiert sind.
Aber interessieren würde mich, wie ich zu so etwas komme?
Dazu müsste ich ja ein Tool haben, das in allen Sprachen einen Text in syntaktische Einheiten zerlegen kann (anders kann ich's auch nicht ausdrücken) und diese dabei am besten noch in Verbindung setzen kann.
Also Ziel soll sein:
Alan Mathison Turing war ein britischer Logiker, Mathematiker und Kryptoanalytiker.
wird zu:
Subjekt: Alan Mathison Turing
Prädikat: war
Attribut: britisch
Objekt: Logiker
Objekt: Mathematiker
Objekt: Kryptoanalytiker
Gibt es ein Tool, eine API, ein Framework, das ich in Java verwenden kann, welches mir das ermöglicht?
Wonach suche ich da genau?
Würd mich freuen, wenn jemand versteht worauf ich hinauswill (ich weiß das glaube ich selbst noch nicht so genau) und mir einen Tipp geben kann.
Robert