Komplexe Daten lesen: Generative KI im Steuerbereich von Finanzunternehmen

Komplexe Daten lesen: Generative KI im Steuerbereich von Finanzunternehmen

Dokumente effizient verarbeiten und Daten mit neuen Methoden schneller extrahieren

Keyfacts:

  • Generative künstliche Intelligenz kann gerade in der Steuerabteilung eine große Hilfe sein.
  • Durch eine Kombination von Large Language Models und Retrieval-Augmented-Generation-Tools lassen sich auch komplexe und unstrukturierte Dokumente verarbeiten.
  • Im Steuerbereich wichtige Richtlinien und BMF-Schreiben können ausgelesen und analysiert werden.

Seit der Einführung von GPT-3.5 ist generative künstliche Intelligenz in aller Munde und wird zunehmend für alltägliche Aufgaben eingesetzt. Denn die neuen Large Language Models (LLMs) sind mächtig und können auch Steuerabteilungen entlasten.

Eine der größten Herausforderungen in diesem Bereich ist die Verarbeitung von unstrukturierten Dokumenten. Großen Nutzen stiftet hier der Einsatz von LLMs und Retrieval-Augmented Generation (RAG).

Verarbeitung unstrukturierter Dokumente im Steuerbereich mit LLMs und RAG

Unstrukturierte Dokumente sind solche, die keine festgelegte Datenstruktur aufweisen und daher schwer maschinell zu verarbeiten sind. Im Steuerbereich sind das zum Beispiel Richtlinien, Schreiben des Bundesfinanzministerium (BMF) oder steuerliche Kommentare. Diese Dokumente enthalten eine Mischung aus Fließtext, Tabellen und manchmal auch Grafiken, was ihre Verarbeitung besonders komplex macht.

Alle LLMs haben eine Begrenzung für Tokens innerhalb eines Chatverlaufs. Das ist eine Zeichenbegrenzung, mit der das LLM arbeitet. RAG ist eine Technologie, die darauf abzielt, die Fähigkeiten von LLMs zu erweitern, indem sie über die Grenzen der Token-Zahl hinausgeht. Anstatt sich ausschließlich auf die im Modell gespeicherten Informationen zu verlassen, kann RAG relevante Dokumente aus einer großen Sammlung abrufen und diese Informationen in das Erzeugen von Antworten einfließen lassen. Das ist besonders im Steuerbereich nützlich, weil dort die genaue und kontextbezogene Verarbeitung von Dokumenten entscheidend ist.

Anwendungsfall steuerliche Richtlinien und BMF-Schreiben

Ein Beispiel für die Anwendung von RAG ist die Verarbeitung einer Sammlung von steuerlichen Richtlinien und BMF-Schreiben. Durch den Einsatz von RAG kann ein LLM relevante Abschnitte aus verschiedenen Dokumenten abrufen und diese Informationen nutzen, um kontextbezogene Antworten zu generieren, inklusive Quellenverweis. Das ermöglicht eine tiefere Analyse und ein besseres Verständnis der steuerlichen Vorschriften und ihrer Auswirkungen.

Durch das Überwinden der Token-Begrenzung mittels RAG entsteht leider aber auch ein Nachteil, der mit der Masse an Dokumenten einhergeht. RAG mangelt es an starker Präzision, was zu teilweise fehlerhaften Ergebnissen führen kann, sodass in einigen Fällen mehrere Prompts benötigt werden, um zu einem befriedigenden Ergebnis zu kommen.

Herausforderungen bei der Extraktion von Daten aus komplexen PDF-Dokumenten

Trotz der Fortschritte in der KI-Technologie gibt es immer noch erhebliche Herausforderungen bei der Extraktion von Daten aus komplexen PDF-Dokumenten. Diese Dokumente enthalten oft eine Mischung aus Text und Tabellen, die schwer zu interpretieren sind. Beispiele hierfür sind Jahresberichte, die detaillierte Informationen über die finanzielle Lage eines Unternehmens enthalten, oder auch Steuerbescheide. Diese Dokumente sind oft in einem Format, das für Menschen leicht verständlich ist, aber für Maschinen schwer zu verarbeiten.

Wie bereits angedeutet, ist RAG auf dem aktuellen technischen Stand für diese Art von Dokumenten nicht immer geeignet. Bei KPMG haben wir dazu eine eigene Anwendung erstellt, die nicht auf RAG basiert und die sich darauf spezialisiert, komplexe PDF-Dokumente zu analysieren, zu verstehen und effizient Daten aus PDF-Dokumenten zu extrahieren.

Dem LLM helfen, die Daten besser zu verstehen

Der Schlüssel dazu ist eine algorithmische Vorverarbeitung der Daten, die automatisiert geschieht, sodass das LLM die Daten besser versteht. Die speziell dafür entwickelte Anwendung zeigt vielversprechende Ergebnisse bei der Analyse und Extraktion von Daten aus solchen komplexen Dokumenten. Der Nachteil ist aktuell, dass man im Gegensatz zu RAG an die Token-Begrenzung gebunden ist.

Und obwohl RAG eine vielversprechende Technologie ist, gibt es noch viele Herausforderungen zu bewältigen, insbesondere das Thema der Genauigkeit und auch das allgemeine Verarbeiten von komplexen PDF-Dokumenten.

Künftige Entwicklungen in der KI-Technologie könnten diese Herausforderungen überwinden. Fortschritte in der natürlichen Sprach- und Bildverarbeitung könnten dazu beitragen, die Genauigkeit der Datenextraktion zu verbessern. Darüber hinaus könnten neue Techniken entwickelt werden, die speziell auf die Verarbeitung von unstrukturierten Dokumenten abzielen.

Effizientes Steuermanagement für Finanzinstitute

Optimieren Sie Ihre Abläufe und bleiben Sie compliant.

Jetzt informieren