• Frage: Woher kriegt die KI ihre Informationen?

    Frage gestellt nans25tad am 4 Mrz 2024.
    • Foto: Karsten Weber

      Karsten Weber Beantwortet am 4 Mrz 2024:


      KI-Systeme wie ChatGPT werden mit unzähligen Daten trainiert; ChatGPT wurden Millionen Texte unter anderem aus dem Internet für das Training genutzt. Bei anderen Systemen, die bspw. zur Bilderkennung genutzt werden, müssen als Trainingsdaten Bilder verwendet werden. Das gilt auch für Bildgeneratoren wie Midjourney oder Google Gemini.

    • Foto: Diana Schneider

      Diana Schneider Beantwortet am 4 Mrz 2024:


      Eine KI ist besonders gut darin, Daten zu verarbeiten, Muster zu erkennen oder Prozesse und Aufgaben zu optimieren. Damit sie das tun kann, benötigt sie qualitativ hochwertige, möglichst repräsentative Daten und einen klaren Handlungsauftrag oder eine konkrete Aufgabe, was genau sie mit den Daten machen soll. Was nicht funktioniert ist, dass wir einer KI einfach sagen: „Hier hast Du die Daten – mach mal.“ Die Informationen, die eine KI benötigt, stammen also stets vom Menschen: (1) Daten, die Menschen gesammelt und der KI zur Verfügung stellen (bspw. Hunde- und Katzenbilder) und (2) eine Aufgabe, die durch Menschen formuliert und als Arbeitsanweisung an die KI gegeben wurde (bspw. „Finde alle Hundebilder“). Zudem wird das Training der KI in der Regel ebenfalls durch Menschen überwacht, die der KI rückmelden: „Stimmt, ein Hund“ oder „Nein, das ist eine Katze“.

    • Foto: Anne Jaap

      Anne Jaap Beantwortet am 5 Mrz 2024:


      Die KIs können sich die Daten nicht selbst „suchen“. Sie haben nur auf das Zugang, wozu ihnen Zugang gegeben wird. Das kann man sich wie eine Box vorstellen, in die man dann alle Daten hineinlegt, die der Algorithmus / die KI verarbeiten soll. Und am Ende bekommt man dann etwas aus der Box herausgereicht.
      So wurde auch ChatGPT z.B. mit einem bestimmten Datensatz „gefüttert“ und kann auch nur aus diesem das Wissen schöpfen. Falls man also Fragen stellt, die dort im Datensatz nicht enthalten waren (oder falsch), dann kann man auch keine sinnvolle Antwort von ChatGPT bekommen. Da ChatGPT aber nicht weiß, was da an Daten fehlt, gibt er trotzdem oft Antworten aus … nur eben falsche. Deswegen muss man da auch sehr aufpassen.

    • Foto: Christoph Lipps

      Christoph Lipps Beantwortet am 5 Mrz 2024:


      Das ist eine spannende Frage. Du hast absolut recht, ohne Daten können die Methoden der Künstlichen Intelligenz nicht sinnvoll arbeiten. Es gibt bei der Generierung von Daten unterschiedliche Möglichkeiten: i) reale Daten verwenden ii) Daten künstlich erzeugen und diese für ein Training verwenden.

    • Foto: Jens-Bastian Eppler

      Jens-Bastian Eppler Beantwortet am 6 Mrz 2024:


      Im Prinzip trainiert man eine KI mit den Daten, die man sinnvoll hält für die Aufgabe, die sie später erledigen soll. Wenn es darum geht Hunde von Katzen zu unterscheiden, sollte man ihr viele Bilde rvon Hunden und Katzen zeigen. Wenn man einen Chatbot trainiert, wie z.B. ChatGPT, wurden viele Texte aus dem Internet genutzt.

      Auf jeden Fall muss man dabei immer sehr vorsichtig sein, dass die KI nichts lernt, was man nicht möchte. Bei Texten aus dem Internet muss man dann irgendwie falsche Informationen oder rassistische Beleidigungen entfernen. Aber selbst bei Hunden und Katzen kann es Probleme geben. Wenn z.B. keine Dackel in den Daten dabei sind, wird die KI später auch keine Dackel erkennen können.

Kommentare