Was getestet wird

Eingesetzt wird ein modifiziertes Modell auf Basis von Teuken-7B, das vom Fraunhofer IAIS in Sankt Augustin entwickelt wurde und mit 24 europäischen Sprachen trainiert ist. Die Pilotinstallation umfasst rund 4.200 Mitarbeiter aus dem Bundesministerium des Innern, dem Bundesministerium für Wirtschaft und Klimaschutz, dem Bundesministerium der Justiz und dem Bundesministerium für Bildung und Forschung. Zugang erfolgt über ein internes Web-Frontend, ohne Anbindung an externe Cloud-Dienste.

Drei konkrete Anwendungsfälle

Erstens: Zusammenfassung eingehender Bürgeranfragen, die im Innenministerium etwa 1.800 pro Werktag umfassen. Zweitens: Vorbereitung von Gesetzeskommentaren im Justizministerium — die KI schlägt relevante Paragrafen und Kommentarliteratur vor, eine Entscheidung trifft sie nicht. Drittens: Sprachvereinfachung von Förderbescheiden im BMWK, die heute oft auf Verwaltungsdeutsch verfasst sind und Antragsteller verwirren.

Warum offen, warum nicht GPT

Drei Gründe nennt das BSI in seiner technischen Vorlage. Erstens: Datensouveränität. Bürgerdaten und Verwaltungsvorgänge dürfen die Bundesinfrastruktur nicht verlassen. Zweitens: Reproduzierbarkeit. Bei Open-Source-Modellen kann das BSI selbst nachvollziehen, welche Trainingsdaten verwendet wurden — bei US-Modellen ist das nicht möglich. Drittens: Kosten. Eine Lizenz für GPT-4-Klasse-Modelle in dieser Größenordnung würde geschätzt 18 bis 24 Millionen Euro jährlich kosten; die Hardware-Investition für das Pilotprojekt liegt bei rund 7,4 Millionen Euro einmalig.

Was es noch nicht kann

Das Modell ist sprachlich deutlich schwächer als GPT-4 oder Claude. In internen Tests des BSI lag die Trefferquote bei juristischen Recherchefragen 22 Prozentpunkte unter GPT-4. Für den Pilotbetrieb wird dieser Abstand bewusst in Kauf genommen — entscheidend sei zunächst, das Verfahren der internen Nutzung zu erlernen, nicht der direkte Vergleich mit der Marktbestleistung. Eine Skalierung auf größere Modelle (Aleph Alpha Pharia oder ein Mistral-Derivat) ist für 2027 vorgesehen, falls das Pilotprojekt erfolgreich verläuft.

Reaktionen

Der Bundesbeauftragte für den Datenschutz und die Informationsfreiheit, Ulrich Kelber, begrüßte das Vorhaben grundsätzlich, forderte aber eine begleitende Datenschutzfolgenabschätzung, die bei Redaktionsschluss noch nicht öffentlich vorlag. Aus der Opposition kam Kritik am Investitionsvolumen: Der haushaltspolitische Sprecher der Linksfraktion bezeichnete den Betrag als „Symbolausgabe ohne klar definierte Erfolgsmetrik“.

Was nach dem Pilot kommt

Vorgesehen ist ein Evaluationsbericht im März 2027, der dem Bundestag vorgelegt wird. Auf dessen Basis soll entschieden werden, ob das System bundesweit auf alle Ministerien ausgerollt wird. Die geschätzten Folgekosten für einen vollständigen Rollout liegen laut BSI bei rund 31 Millionen Euro über drei Jahre. Zum Vergleich: Die externe IT-Beratung der Bundesverwaltung kostet derzeit jährlich rund 2,8 Milliarden Euro.