Älterer männlicher Techniker beim Einstecken von Glasfaserkabeln im Rechenzentrum
© Westend61/Infinite Lux

KERMIT – Knowledge Extraction and Retrieval
with Model-Driven Information Technologies

In der industriellen Praxis kleiner und mittlerer Unternehmen (KMU) im Maschinenbau geht wertvolles Wissen zunehmend verloren – sei es durch den demografischen Wandel, Fachkräftemangel oder ineffiziente, papierbasierte Dokumentationsprozesse. 

Das Projekt KERMIT setzt genau hier an und entwickelt eine innovative Lösung zur digitalen Wissenssicherung und -nutzung. Durch den Einsatz von Künstlicher Intelligenz, insbesondere Large Language Models (LLMs), Retrieval-Augmented Generation (RAG) und moderner optischer Zeichenerkennung (OCR), sollen unstrukturierte Daten – etwa handschriftliche Notizen oder veraltete digitale Formate – systematisch erschlossen und für die tägliche Arbeit nutzbar gemacht werden. Ziel ist es, die Wettbewerbsfähigkeit und Innovationskraft von KMU nachhaltig zu stärken und sie für die Herausforderungen der digitalen Zukunft zu rüsten.

Zielsetzung des Projekts

KERMIT verfolgt das Ziel, eine prototypische Lösung zur intelligenten Wissenserschließung für KMU im Maschinenbau zu entwickeln. Dabei sollen unstrukturierte Daten digitalisiert, semantisch organisiert und über eine benutzerfreundliche, dialogbasierte Schnittstelle zugänglich gemacht werden. Die Integration von LLMs, RAG und OCR-Technologien ermöglicht eine effiziente und sichere Nutzung interner Wissensressourcen – ein entscheidender Schritt zur Vermeidung von Wissensverlust und zur Förderung datengetriebener Entscheidungen.

Projektinhalte 

Das Projekt gliedert sich in sieben Arbeitspakete, die von der Anforderungsanalyse über die Datenaufbereitung bis hin zur Entwicklung eines Demonstrators reichen. Zentrale Inhalte sind:

  • Identifikation und Digitalisierung relevanter Datenquellen in KMU
  • Entwicklung einer offenen OCR-Pipeline mit Fokus auf handschriftliche Dokumente
  • Aufbau von Vektordatenbanken und Wissensgraphen zur semantischen Organisation
  • Integration von LLMs zur dialogbasierten Informationsabfrage
  • Validierung und Akzeptanztests mit Unternehmenspartnern
  • Entwicklung eines Frameworks zur Erklärbarkeit und Verantwortlichkeit von KI-Systemen

Besonderes Augenmerk liegt auf der praktischen Umsetzbarkeit und der Einbindung der Unternehmen in den Entwicklungsprozess.

Projektpartner

Forschungspartner:

Unternehmenspartner:

Österreich:

Deutschland:

Fördergeber/Förderprogramm:

  • CORNET – Collective Research Network
  • DE: DLR-PT - German Aerospace Center Project Management Agency
  • AT: The Austrian Research Promotion Agency (FFG)

Projektlaufzeit & Förderung

Das Projekt läuft von 01.07.2025 bis 31.06.2027 und wird im Rahmen des CORNET Calls gefördert. Die Gesamtkosten belaufen sich auf rund 1,12 Mio. Euro (Österreich: 606 T.Euro)