Home RECHTaktuell MANZ Digital RDB Ähnlichkeitssuche KI-unterstützter Recherche
Home RECHTaktuell MANZ Digital RDB Ähnlichkeitssuche KI-unterstützter Recherche
© metamorworks – istockphoto.com
MANZ Digital

RDB Ähnlichkeitssuche mit KI-unterstützter Recherche

Die RDB Rechtsdatenbank wurde um das Feature der RDB Ähnlichkeitssuche erweitert. Dafür nimmt MANZ Künstliche Intelligenz und Machine Learning in Anspruch. Das System im Hintergrund versteht sich auf die menschliche Sprache.
Artikel teilen
Redaktion
Reinhard Ebner
Datum
05. Dezember 2022
RDB-Rechtsdatenbank Dokumente
© MANZ
Seid umschlungen, Millionen!
Wie verteilen sich die 3,4 Millionen Dokumente in der RDB Rechtsdatenbank?

In der RDB Rechtsdatenbank finden sich Millionen Dokumente, und täglich werden es mehr. Die Frage für die Rechtsanwender:innen ist daher nicht, ob das Passende dabei ist, sondern wie es zu finden ist. Eine brandneue Funktion trägt zu einer wesentlich verbesserten Nutzererfahrung bei: die RDB-Ähnlichkeitssuche. Die Datenbank findet damit zu einem Dokument vollautomatisch passende weitere Dokumente ähnlichen Inhalts.

Wer ein RDB-Dokument öffnet, findet einen Reiter auf der Seite, der mit „Ähnliche Inhalte“ bezeichnet ist. Ein Klick darauf genügt, und die Empfehlungen werden geladen. Geordnet sind diese nach folgenden Kategorien: RDB Keywords, Klauseln, SteuerExpress, Zeitschriften, Sammlungen, RECHTaktuell-News sowie Entscheidungen. Die ähnlichen Inhalte können aus sämtlichen Kategorien kommen, ausgenommen sind gegenwärtig nur Indexdokumente und Bundesgesetzblätter.

„Wir sind einer der ersten deutschsprachigen Verlage mit einem derartigen Machine-Learning-Modell – das ist ein Quantensprung"

ALEXANDER FELDINGER, MANZ VERLAG

NLP für die RDB Rechtsdatenbank

„Die neue Funktion ist völlig anonym, arbeitet also ohne jeden Bezug zum Suchverhalten der Nutzer:innen“, betont RDB-Produktmanager Alexander Feldinger. Wie aber funktioniert sie dann? Mit sehr viel Hirnschmalz – aufgebracht wird dieses nicht nur vom RDB-Produktmanagement im Verlag und von einem Partnerunternehmen, sondern auch von Künstlicher Intelligenz, die eben für diese Aufgabe trainiert wurde.

Feldinger: „Das System ist in der Lage, den Inhalt von Dokumenten selbsttätig zu interpretieren, also zu ,verstehen‘. Wir sind einer der ersten deutschsprachigen Verlage mit einem derartigen Machine-Learning-Modell. Das ist somit ein Quantensprung am Rechtsmarkt.“

Für das Projekt nimmt der MANZ Verlag die Dienste von Deepset AI in Anspruch. Das Berliner Unternehmen ist auf Natural Language Processing (NLP) spezialisiert. „Mit einer funktionierenden Lösung allein gibt sich das junge Team des Dienstleisters nie zufrieden. Wurde ein Projekt-Meilenstein erreicht, gab es bereits Ideen und Vorschläge für weitere Verbesserungen – das hat uns beeindruckt“, schildert der RDB-Produktmanager. Bei NLP handelt es sich um ein Teilgebiet Künstlicher Intelligenz, das sich mit der Verarbeitung natürlicher, menschlicher Sprache befasst. Im weiteren Sinne geht es um ein Verständnis von Texten.

„Die Möglichkeit der Textanalyse könnte in absehbarer Zukunft eine Alternative zur klassischen Sucheingabe darstellen.“

SUSANNE STEIN-PRESSL, MANZ VERLAG

Mit Machine Learning zur semantischen Suche

Möglich macht das alles ein Machine-Learning-Modell, das mit Unterstützung der externen NLP-Expert:innen und gemeinsam mit qualifizierten MANZ-Mitarbeiter:innen rund ein Jahr lang für die österreichische Rechtssprache trainiert wurde. Die Maschine liest dafür nicht ganze Texte, sondern bestimmte Teile davon, die je nach Dokumentenkategorie und zum Teil sogar -unterkategorie vordefiniert wurden. Im Fall einer Entscheidung sind dies etwa die rechtliche Beurteilung und der Sachverhalt.

Da ein Text mitunter unterschiedliche Inhalte behandelt, wurden die RDB-Dokumente in Abschnitte und Passagen untergliedert. Den 3 Millionen RDB-Dokumenten (ohne Indexdokumente und Bundesgesetzblätter) entsprechen damit in Summe 35 Millionen Passagen. Mit der Ähnlichkeitssuche wird der Zugang zu diesen Inhalten massiv erleichtert und beschleunigt.

Für die Rechtsbranche ist damit ein wichtiger erster Schritt getan, weitere werden folgen. „Eine gute Textanalyse kann den in Rechtsberatung, Gerichten, Behörden und Unternehmen Praktizierenden sehr viel Arbeit abnehmen. Wir werden daher weiter in diese Technologie investieren, in absehbarer Zeit könnte so eine Alternative zur klassischen Sucheingabe entstehen“, kündigt MANZ-CEO Susanne Stein-Pressl an. Im ersten Quartal 2023 starten die Betatests für eine semantische Suche. Dann sollte es Userinnen und Usern auch möglich sein, eine Frage oder einen Sachverhalt einzugeben.

Gekürzte Version der Story aus der Zeitschrift RECHTaktuell. Wie die RDB Ähnlichkeitssuche im Detail funktioniert und wohin die Reise in näherer Zukunft geht, lesen Sie im vollständigen Text in der Printausgabe – hier auch als ePaper. Mehr Informationen zu den RDB-Genjus-Funktionen finden Sie auf unserer Website.