KI Algorithmen und Hintergründe

Bei KI denkst du sicherlich zuerst an ChatGPT und ähnliche generative KIs. Aber eigentlich zählt noch viel mehr zum Bereich KI und maschinellem Lernen.

Hier habe ich z.B. ein Tic Tac Toe Spiel mit einem Gegner, der das Spiel aus deinen Zügen nach und nach lernt, indem Siege belohnt und Niederlagen bestraft werden. So entstehen die Zahlen in der Ecke, die angeben, als wie gut die KI den Zug bewertet. Spiel doch einmal ein paar Runden gegen die KI!

Wahrscheinlich wirst du anfangs immer gewonnen haben. Die KI lernt aus einzelnen Spielen auch zu langsam, als dass man nach einigen Spielen schon einen Effekt sehen könnte. Probiere dazu einmal den Button in der oberen rechten Ecke “Trainieren”, um den ganzen Prozess zu beschleunigen. Hierbei tritt die KI gegen eine andere, gleich aufgebaute KI an, sodass sich die KIs gegenseitig trainieren. Das Ergebnis davon ist auch immer noch weit schlechter als ein menschlicher Spieler, aber schon deutlich besser als vorher. Probiere es aus und beobachte, wie sich die Zahlen in den Feldern geändert haben! Du kannst die KI auch jederzeit wieder mit dem roten Button “Reset AI” zurücksetzen.

Hintergründe für Interessierte

Die KI basiert auf dem sogenannten verstärkenden Lernen oder “Reinforcement Learning”. Die spezielle Unterart dieser Form des maschinellen Lernens wird “Q-Learning” genannt. Hierbei wird zu jedem möglichen Zustand des Spielfeldes von der KI eine Karte vom Feld angelegt, in der der Wert jedes einzelnen möglichen Zugs hinterlegt ist. Der beste Zug wird ausgewählt und dann danach neu bewertet, wie gut der bestmögliche Zug im Folgezustand ist und wie gut die direkte Belohnung für diesen Zustand ist. Diese direkte Belohnung meint, dass die KI direkt belohnt wird, wenn der Zug den Sieg gebracht hat und direkt bestraft wird, wenn er die Niederlage gebracht hat. So können nach und nach auch in früheren Spielzügen schon Vorhersagen getroffen werden, ob das Spiel am Ende vorteilhaft ausgehen wird oder nicht. Um zu verhindern, dass sich das Modell auf eine mittelmäßig erfolgreiche Strategie festlegt, bleibt aber immer eine geringe Wahrscheinlichkeit für einen zufälligen Zug, um auch neue ggf. bessere Strategien auszuprobieren. Vielleicht hast du schon beobachtet, wie die KI einen solchen vermeintlich falschen Zug gemacht hat.

Wer interessiert ist am Code hinter dem Spiel, kann sich gerne die Dokumentation der entscheidenden Klasse hinter dem Spiel angucken.

Entwicklung von KI

Wie du in dem kleinen Spiel gesehen hast, kann KI auch etwas sehr viel simpleres und “dümmeres” als ChatGPT meinen. Tatsächlich ist KI auch ein sehr viel älteres Konzept als viele annehmen.

Der Begriff wurde schon 1956 geprägt, als man versuchte, das Konzept der Intelligenz und des Lernens so zu erfassen, dass eine Maschine solche Prozesse nachahmen konnte. Man hatte also die Idee, ein Konzept zu konstruieren, das einer Maschine das Lernen ermöglicht.

Schon 1966 wurde auch ein erstes Programm entwickelt (ELIZA), das Antworten geben konnte. Es war allerdings bei weitem nicht so komplex wie ChatGPT heute, sondern konnte die Antworten nur auf Basis von einprogrammierten Listen und einigen einfachen Regeln geben. Es war also nicht so sehr das, was man sich heute unter KI vorstellen würde, aber es hat damals schon Menschen beeindrucken können.

Deutlich bekannter dürfte heute der Sieg von IBMs KI “Deep Blue” 1997 gegen den amtierenden Weltmeister in Schach sein. Die KI konnte die Züge deutlich weiter voraus “planen” als ein Mensch und hatte so den entscheidenden Vorteil. Eine noch größere Herausforderung konnte AlphaGo von Google 2016 mit dem Sieg gegen Lee Sedol meistern. Alpha Go basiert dabei auf zwei neuronalen Netzwerken, von denen eines den nächsten Spielzug auswählt und das andere den wahrscheinlichen Gewinner des Spiels vorhersagt. Als Training ist auch diese KI ähnlich wie auch die Tic Tac Toe KI vom Anfang (bloß natürlich deutlich aufwändiger und komplexer) gegen andere Versionen von sich selbst angetreten und hat aus den Fehlern gelernt, was verstärkendes Lernen oder “Reinforcement Learning” genannt wird. Was noch eine Parallele zwischen dieser KI und der primitiven KI vom Anfang ist, ist die Bewertung der einzelnen Züge mit Blick auf mögliche zukünftige Erfolge. Bei AlphaGo bewertet ein zweites neurales Netzwerk den Wert eines Zuges, indem der Sieger vorhergesagt wird. In meiner primitiven KI protokolliert die KI aus der Erfahrung im Training den Wert eines Zuges anhand der bereits erfahrenen Spielverläufe nach diesem Zug. Obwohl zwischen diesen beiden KIs Welten liegen und sie eigentlich nicht miteinander vergleichbar sind, stecken also doch teilweise recht ähnliche Gedanken auf kleinster Ebene hinter den Algorithmen.

Generative KIs sind natürlich nochmal eine ganz andere Liga und deren technische Hintergründe genauer zu erklären, würde nochmal den Rahmen sprengen, da ich nicht einmal erklärt habe, wie überhaupt ein neuronales Netzwerk funktioniert. Aber lernen kann man aus dieser Einheit auf jeden Fall, das künstliche Intelligenz keineswegs Zauberei ist und auch im Detail doch “dümmer” ist, als ChatGPT, Gemini und ähnliche es uns glauben machen. Schon ELIZA, was wir heute kaum KI nennen würden, hat damals die Leute so beeindruckt, dass Menschen angeblich dazu verleitet wurden, dem Programm sogar intime Geheimnisse anzuvertrauen. Es ist also sinnvoll, sich immer wieder vor Augen zu führen, dass KI wenig mit menschlicher Intelligenz und menschlichem Verstehen zu tun hat und man daher immer auch hinterfragen sollte und KI eher als Werkzeug benutzen sollte und nicht als Ersatz für selbstständiges Denken.

Genau dafür wurde die Website erstellt, um einen produktiven und verantwortungsvollen Einsatz von KI zu fördern. Wenn dich das Thema also interessiert, schau doch in die anderen Artikel auf dieser Website hinein!