← PFEILTASTEN →
AI Meetup Vorarlberg · 12. Mai 2025

Shit in –
Shit out.

Warum Datenqualität die Grundlage für KI ist.

Ramona Nussbaumer · Clevere Nuss IT e.U.

Einstieg

Wessen KI spricht
immer die Wahrheit?

Keine. Und hier ist warum.

Die Realität im KMU · Kundenbeispiel

Wo liegen eure Daten wirklich?

Dateien & Dokumente
Lokale LaufwerkeNetzlaufwerke / NASUSB-SticksDropbox / Google DrivePapierordner
Kommunikation
E-Mail-PostfächerWhatsApp / SignalSMS & NotizenHaftzettel
Projekte & Aufgaben
Trello / Asana / JiraNotion / ConfluenceExcel als ProjektplanPost-its & Whiteboard
Kunden & Finanzen
CRM (oder Excel)BuchhaltungssoftwareAngebote in OrdnernVisitenkartenstapel
Branchensoftware
ERP / WarenwirtschaftCAD / BranchentoolsKassensystemePraxisverwaltung
⚠ Unsichtbare Silos
Wissen in KöpfenMündliche AbsprachenVerträge im SchrankNie dokumentierte Erfahrung
Wie viele Datenorte habt ihr?
Grundlage

Was KI lesen kann

Strukturiert
Excel / CSVDatenbankenFormulare
Unstrukturiert
Word / PDFE-MailsChatsNotizen
Kontextuell
Cloud-DokumenteKalenderProjekträume
Das Problem

KI halluziniert — sie füllt Lücken mit plausibel klingendem Unsinn.

Fehlt die Basis, zieht sie Schlüsse nach eigenem Ermessen. Selbstsicher formuliert. Und trotzdem falsch.

Das Konzept

Das KI-Hirn

Klicke eine Schicht · Ziehe zum Drehen

00 Datensilos aufräumen
01 Datenqualität
02 Struktur
03 Kontext
04 Zugang
05 Pflege-Rhythmus

Datensilos identifizieren und aufräumen — das ist die Basis von allem.

Datenqualität

Was ist vorhanden — und ist es brauchbar?

Was geprüft werden muss
Vollständig?Aktuell?Eindeutig?Widerspruchsfrei?Duplikate entfernt?Verantwortlichkeit geklärt?
Wird das übersprungen

KI halluziniert mit echtem Firmenvokabular. Klingt richtig — ist falsch. Schwerer zu erkennen als offensichtlicher Unsinn.

KI bewertet Dokumente nicht nach Alter — sie liest alles gleich. Veraltete Inhalte ohne Kennzeichnung fließen genauso in die Antwort ein wie aktuelle.

Struktur

Ohne Struktur ist das Ergebnis Zufall. Mal trifft KI, mal nicht — und du weißt nie wann.

Was gebraucht wird
Einheitliche OrdnerlogikKlare DateinamenEine Version pro DokumentKategorien & ThemenMetadaten & Tags
Wird das übersprungen

KI findet zufällig. Mal das richtige Dokument, mal nicht. Nicht reproduzierbar — das zerstört Vertrauen.

Kontext

Gleiche Information, anderer Kontext — andere Antwort.

Was dokumentiert sein muss
Für welches Projekt?Für welchen Kunden?Intern oder extern?Gültig ab wann?Vertraulichkeitsstufe
Wird das übersprungen

KI vermischt Projekte und Kunden. Oder gibt interne Kalkulationen im falschen Kontext raus.

Früher Google: drei Stichwörter, so kurz wie möglich. Bei KI ist es umgekehrt — stell dir vor, du rufst einen neuen Mitarbeiter an und sagst nur: "Angebot schreiben." Er kennt den Kunden nicht, das Projekt nicht, eure Preise nicht. KI ist genauso. Je mehr Kontext, desto besser die Antwort.

Zugang schaffen

Erst wenn die Basis stimmt, bekommt KI Zugriff. Nicht vorher.

Zugang zu schlechten Daten ist kein Fortschritt — es ist schnellerer Zugang zu Murks.
Jetzt erst
Cloud-AnbindungAPI-VerbindungenZugriffsrechte konfiguriertSilos gezielt verbindenLokale Daten migrieren
Häufigster Fehler

Die meisten fangen hier an. Tool kaufen, anschließen, hoffen. Dann geben sie der KI die Schuld.

Pflege-Rhythmus

Ein KI-Hirn ist kein einmaliges Projekt. Es ist ein laufender Prozess.

Was geregelt sein muss
Wer ist verantwortlich?Review-Intervall festgelegtNeue Docs sofort einpflegenWissenstransfer bei AbgangRegelmäßige Qualitätsprüfung
Wird das übersprungen

Ohne Pflege veraltet das KI-Hirn still und leise — irgendwann liefert es wieder schlechte Ergebnisse, und niemand weiß warum.

Das Ergebnis

Was kommt raus?

Falsche Reihenfolge
Tool kaufen, anschließen, hoffen.

KI antwortet selbstsicher und falsch. Vertrauen bricht — obwohl die Datenbasis das eigentliche Problem war.
Shit in → Shit out.
Richtige Reihenfolge
Qualität → Struktur → Kontext → Zugang → Pflege.

KI als echter Hebel. Korrekte Antworten aus eurem Unternehmenswissen.
Good in → Gold out.
Take-away · Fokus: Was du heute noch tun kannst

Drei Schritte.
Sofort. Ohne Budget.

Schritt 1 · Bestandsaufnahme

Schreib alle Orte auf, wo ihr Arbeitswissen speichert. Jeden einzelnen.

Liste aller DatenorteWer hat Zugriff?Wie aktuell ist es?
Ziel: Das volle Bild sehen. Das allein ist ein Aha-Moment.
Schritt 2 · Einen Bereich aufräumen

Nicht alles auf einmal. Den Bereich wählen, der am meisten bringt.

Duplikate löschenVeraltetes archivierenEinheitliche Benennung
Ziel: Ein Bereich, auf den du KI morgen schon loslassen kannst.
Schritt 3 · Verantwortung klären

Wer ist ab heute dafür zuständig, dass die Datenbasis sauber bleibt?

Eine Person benennenRhythmus festlegenRegel für neue Docs
Ziel: Kein Projekt. Eine Gewohnheit.
Kein Budget nötig. Keine IT-Abteilung. Nur die Bereitschaft, ehrlich hinzuschauen — und anzufangen.
Unveränderlich

KI unterstützt.
Menschen entscheiden.

Egal wie gut die Datenbasis ist — KI-Output ist immer ein Vorschlag, keine Wahrheit.

Der Mensch bleibt verantwortlich für
Output kritisch prüfenQuellen hinterfragenKontext einbringenLetzte Entscheidung treffenVerantwortung übernehmen
Niemals blind vertrauen

KI kann selbstsicher falsch liegen — auch bei guter Datenbasis. Wer den Output nicht prüft, trägt die Konsequenzen.

Der Mensch ist nicht das Problem — der Mensch ist die Lösung. Und die letzte Instanz.
Der Satz, der bleibt
Gute Daten.
Gute KI.
Eure Entscheidung.

Ramona Nussbaumer

Clevere Nuss IT e.U. · cleverenuss.at

Der Mensch ist nicht das Problem – der Mensch ist die Lösung.

QR Vortrag PRÄSENTATION cleverenuss.at/vortrag-datenqualitaet
QR LinkedIn LINKEDIN linkedin.com/in/cleverenuss