Folgende Schritt halte ich für wichtig, damit wir den Datenbestand in eine saubere Struktur überführen:

  1. XSD erstellen, mit der wir unsere an TEI orientierte XML-Struktur festziehen. Aus dem XSD können wir uns dann mit JAXB die Java-Klassen generieren lassen.
  2. Text zu XML Transformation: Wir müssen den Mechanismus optimieren, wie aus der vereinfachten Text-Syntax der Einträge valides XML generiert werden kann. (Da gibt es auch schon einen Algorithmus, der prinzipiell funktioniert)
    1. Einen Mechanismus, der für die alte Auszeichnungssprache gilt
    2. Einen Mechanismus, der für die neue Auszeichnungssprache gilt
  3. GUI für Eintrag-Pflege: Wir müssen eine GUI bauen, mit dem man die Einträge besser online pflegen und syntaktisch überprüfen kann (auch sowas wie ein Online-XML Editor der gegen ein XSD validiert) So dass auch komplexe Einträge von Laien ohne viele Vorkenntnisse syntaktisch fehlerfrei editiert werden können.
  4. Datenstruktur: Mit der XML-Struktur in der Hinterhand, können wir uns die neue Tabellenstruktur überlegen.
  5. Zusätzliche Suchfeatures und bessere Indexe können erstellt werden