Fallstudie: Kommerzielle Vertragsprüfung mit Legal AI
Die kommerzielle Vertragsprüfung ist ein Bereich, in dem Legal AI den Teamoutput deutlich verbessern kann: repetitiv genug für Automatisierung, sensibel genug für qualifizierte professionelle Prüfung. Fachliche Leitlinien zu generativer KI betonen genau diese Balance: KI als Werkzeug nutzen, aber Vertraulichkeit, Review und Verantwortlichkeit konsequent absichern (1). Diese Fallstudie zeigt, wie ein Rechts-Team seinen Prüf-Workflow neu ausgerichtet hat, um die Durchlaufzeit zu verkürzen und zugleich juristische Bewertung und Verantwortung im Zentrum zu halten.
Ausgangslage: erfahrene Juristinnen und Juristen, hoher Durchsatzdruck
Das Team prüfte Lieferantenverträge, Kundenbedingungen, Auftragsverarbeitungsvereinbarungen und wiederkehrende Beschaffungsdokumente. Die fachliche Qualität war hoch, aber die Durchlaufzeiten schwankten stark. Manche Mandate liefen schnell, andere bremsten, sobald sich die Prüfwarteschlangen aufbauten.
In der retrospektiven Analyse wurden drei wiederkehrende Probleme sichtbar:
- Juristinnen und Juristen investierten zu viel Zeit in die erste Extraktion von Pflichten, Daten und Risikokennzeichnungen.
- Prüfkommentare waren inhaltlich hochwertig, aber in Struktur und Priorisierung uneinheitlich, was Aufsicht und Delegation erschwerte.
- Mandatsverantwortliche hatten nur eingeschränkte Sicht auf Punkte, die priorisiert wurden, und auf solche, die sofort eine Senior-Bewertung erforderten.
Designprinzip: KI als Erstanalytikerin, nicht als Endentscheiderin
Das Implementierungsteam vermied den Fehler, KI als juristische Antwortmaschine zu nutzen. Stattdessen wurde sie als strukturierter Erstprüf-Assistent eingesetzt. Der KI-Workflow konzentrierte sich auf das Extrahieren und Ordnen von Informationen: Parteien, Definitionen, Zahlungsbedingungen, Kündigungsgründe, Freistellungsregelungen, Haftungsbeschränkungen, Vertraulichkeitsverpflichtungen, anwendbares Recht und Streitklauseln.
Jede generierte Zusammenfassung galt als Voranalyse. Verantwortliche Juristinnen und Juristen blieben für die rechtliche Auslegung, die Verhandlungsstrategie und die finale Empfehlung verantwortlich.
Workflow-Architektur, die die Zuverlässigkeit verbessert hat
Das Team führte einen vierstufigen Prüfpfad ein:
- Dokumenttyp und Risikoprofil aufnehmen und klassifizieren.
- Eine strukturierte Issue Map mit quellengebundenen Auszügen erzeugen.
- Rollenbasiertes Review anwenden: zunächst durch Associate, Eskalation zur Partnerinstanz bei Klauseln mit hoher Wirkung.
- Ein standardisiertes Memo-Format für Mandanten- und interne Nachverfolgung bereitstellen.
Diese Struktur reduzierte unnötige Kontextwechsel und vereinfachte die Aufgabenverteilung. Associates verbrachten weniger Zeit mit der ersten Faktenextraktion und mehr mit der Bewertung rechtlicher Folgen. Partner mussten weniger Analysen nachbearbeiten und konnten sich stärker auf Verhandlungspositionen sowie Risikobewertungen konzentrieren.
Qualitäts-Leitplanken gegen stille Fehler
Das Team setzte auf praxisnahe Kontrollmechanismen statt abstrakter Richtlinientexte:
- Jede wesentliche Risikodarstellung musste auf einen stützenden Klauselauszug verweisen.
- Keine mandantenbezogene Empfehlung durfte ohne Freigabe der juristischen Review veröffentlicht werden.
- Die Erkennung mehrdeutiger Klauseln löste automatisch die Kennzeichnung „manuelle Prüfung erforderlich“ aus.
- Zugriffs- und Mandatsgrenzen wurden für Suche, Zusammenfassungen und Exporte verbindlich durchgesetzt (2).
Diese Maßnahmen waren essenziell, weil es nicht darum ging, jeden Fehler vollständig auszuschließen. Entscheidend war, Unsicherheit frühzeitig zu erkennen, möglichen Schaden zu begrenzen und Prüfaufwand dort zu bündeln, wo die rechtliche Wirkung am höchsten ist.
Ergebnisse nach einem Quartal
Nach zwölf Wochen zeigten sich messbare Verbesserungen. Der Gesamteffekt blieb nur dann tragfähig, wenn er qualitätsadjustiert betrachtet wurde: Produktivitätsgewinne zählen nur, wenn Prüfqualität und Datenkontrollen stabil hoch bleiben (3).
- Die durchschnittliche Erstprüfzeit sank bei wiederkehrenden Vertragstypen von 95 auf 38 Minuten.
- Der Rückstau bei Standard-Lieferantenverträgen verringerte sich um rund 40 %.
- Die Eskalationsqualität verbesserte sich: Weniger niedrig priorisierte Fälle erreichten die Senior-Prüfung.
- Die Konsistenz der Mandanten-Updates stieg durch eine einheitliche Ausgabevorlage.
Das wichtigste Ergebnis war nicht allein Geschwindigkeit, sondern Planbarkeit. Mandatsteams konnten die Vertragsdurchlaufzeit zuverlässiger prognostizieren, was Mandantenkommunikation und interne Ressourcenplanung verbesserte.
Wo Teams weiterhin Vorsicht brauchen
Der Workflow funktioniert besonders gut bei wiederholbaren Vertragsfamilien. Er war weniger zuverlässig bei stark verhandelten, maßgeschneiderten Vereinbarungen mit ungewöhnlichen Haftungsstrukturen oder dokumentenübergreifenden Abhängigkeiten. Das Team hielt daher eine höhere Prüfungsschwelle für strategische oder neuartige Deals ein.
Außerdem wurde klar: Nutzertraining muss kontinuierlich erfolgen. Neue Mitarbeitende brauchen konkrete Beispiele dafür, wann die strukturierte Extraktion zu vertrauen ist und wann der vollständige Klauselkontext geprüft werden muss, bevor eine Schlussfolgerung gezogen wird.
Die wirksamsten Legal-AI-Programme in der Vertragsprüfung ersetzen juristische Bewertung nicht. Sie machen es leichter, diese in der richtigen Tiefe und zum richtigen Zeitpunkt anzuwenden.
Implementierungslehren für andere Kanzleien
Wenn Ihr Team Legal AI für die Vertragsprüfung erwägt, sollten Sie mit einer Dokumentenfamilie, einer Prüfvorlage und einer klaren Eskalationsrichtlinie starten. Messen Sie Durchlaufzeit und Prüfqualität gemeinsam. Erweitern Sie erst, wenn das Team klar erläutern kann, wie eine Ausgabe erzeugt, geprüft und freigegeben wird.
Dieser disziplinierte Ansatz macht Vertragsprüfungs-KI aus einem begrenzten Piloten zu verlässlicher juristischer Betriebsfähigkeit.