Schlüsselwörter

1 Einleitung

Schwärme in der Natur, also größere Gruppen von Tieren, zeigen oft ein sogenanntes emergentes Verhalten. Emergenz bezeichnet dabei die Herausbildung von neuen Eigenschaften oder Strukturen eines Systems infolge des Zusammenspiels seiner Elemente. In der Informatik wird emergentes Verhalten bewusst erzeugt, um eine Gruppe von Individuen (z. B. Roboter, Sensoren oder virtuelle Agenten) zu steuern.

Dieser Artikel gibt einen Überblick über künstliche Schwarmintelligenz in technischen Systemen. Emergentes Verhalten wird dabei als grundlegendes Merkmal der Schwarmintelligenz erklärt. Das Hauptaugenmerk liegt dabei auf zwei Aspekten: die Rolle der Anführer und die Möglichkeit, ein selbstorganisierendes System (Schwarm) durch externe Einflüsse (Umwelt) zu steuern.

Innerhalb eines Schwarms ist die Rolle von (temporären) Anführern von besonderer Bedeutung, da in dieser Rolle Individualität und Kollektivität zusammentreffen. Zu diesem Zweck wird der Einfluss der individuellen Entscheidungsfindung in Kollektiven erläutert. Zusätzlich werden die Auswirkungen der Umwelt auf den Schwarm gezeigt, die die Möglichkeit geben, das kollektive Verhalten zu steuern. Anhand der kollektiven Wahrnehmung werden dabei die Auswirkungen von Umweltveränderungen auf das emergente Verhalten des Schwarms betrachtet. Zudem wird die Möglichkeit betrachtet, das Verhalten der Individuen mithilfe evolutionärer Algorithmen zu erlernen.

2 Schwarmintelligenz: „Das Ganze ist mehr als die Summe seiner Teile“

Schwarmintelligenz beschreibt das kollektive Verhalten einer Gruppe von Individuen, die nur lokal miteinander kommunizieren und interagieren können. Das Ergebnis dieser lokalen Interaktion ist normalerweise ein globales, kollektives Verhalten, das für die einzelnen Individuen unbekannt ist (Bonabeau et al. 1999). Viele solcher Phänomene existieren in der Natur: Ameisen, Herdentiere, Vögel und Fische bilden Schwärme (Camazine et al. 2003). In einem Schwarm sind sich die Individuen nicht bewusst, dass sie Teil des globalen Verhaltens sind. Das globale Verhalten kann Emergenz im oben genannten Sinne zeigen (Müller-Schloer et al. 2011, S. 39). Einfacher ausgedrückt wird von emergentem Verhalten gesprochen, wenn gilt: „Das Ganze ist mehr als die Summe seiner Teile“.

Das folgende einfache Beispiel verdeutlicht das Prinzip emergenten Verhaltens: Mehrere Individuen bewegen sich zufällig in einem zweidimensionalen Raum und haben die Aufgabe, farbige Objekte zu transportieren. Jedes Individuum handelt nach den folgenden Anweisungen (Regeln):

  1. 1.

    Wenn du gerade kein Objekt trägst, hebe ein Objekt auf.

  2. 2.

    Ansonsten lege dein Objekt neben ein Objekt der gleichen Farbe.

Obwohl der Algorithmus einfach ist, ist überraschenderweise das globale Verhalten dennoch komplex und nicht leicht vorhersagbar. In Simulationen zeigt der Schwarm emergentes Verhalten: Der Schwarm sortiert die Objekte. Die Objekte verschiedener Farben werden nach Farben in Haufen angeordnet, wie die Abb. 1 zeigt. Eine Besonderheit an diesem Sortierverfahren ist, dass die Haufen an anderen Positionen entstehen, wenn der Schwarm mit unterschiedlichen Anfangsverteilungen beginnt.

Abb. 1
figure 1

(Quelle: eigene Abbildungen)

Kollektives Sortieren in der Ebene, Links: Ausgangszustand, Mitte: sortiert, Rechts: neu sortiert.

2.1 Schwarmintelligenz in Gruppen von Menschen

Auch Gruppen von Menschen zeigen unter bestimmten Bedingungen ein Schwarmverhalten. Dabei ist interessant zu wissen, welche Faktoren (Kommunikation, Führung, Einflüsse der Umwelt) benötigt werden, damit ein kollektives Verhalten entstehen kann. Um individuelles Verhalten in einem Schwarm zu analysieren, haben wir ein Schwarmexperiment mit 200 Menschen durchgeführt. Im Gegensatz zum vorherigen Beispiel wurde das globale Ziel des Schwarmverhaltens (z. B. Sortierung) vorgegeben.

Das Ziel des Experiments war, den Umfang der Interaktion und Kommunikation der Teilnehmenden bei der Lösung von vier Aufgaben mit verschiedenen Schwierigkeitsgraden zu untersuchen und Verhaltensmuster zu finden. Ähnlich wie bei früheren Experimenten (Palmer et al. 2003) erhielten die Teilnehmenden T-Shirts mit mehreren Merkmalen, die für die Aufgaben von Bedeutung waren.

In der ersten Aufgabe sollten die Teilnehmenden sich nach den Farben der T-Shirts (blau, orange, dunkelrot, grün) gruppieren. In der zweiten Aufgabe sollten sie sich wieder gruppieren, diesmal allerdings nach einer von vier geometrischen Figuren, die auf die Vorder- und Rückseite der T-Shirts gedruckt waren. In der dritten Aufgabe (Abb. 2) sollten sich die Teilnehmenden in einer Reihe aufstellen, wobei die Reihenfolge durch die Zahl auf der Vorderseite des T-Shirts vorgegeben war. Die vierte und schwierigste Aufgabe bezog sich auf den Buchstaben, der auf der Rückseite des jeweiligen T-Shirts gedruckt war. Die Teilnehmenden sollten damit Wörter bilden, ähnlich wie im Spiel Scrabble. Die Häufigkeit der Buchstaben auf den T-Shirts wurde nach der Häufigkeit der Buchstaben der deutschen Sprache (Beutelspacher 2009) vergeben. In allen vier Aufgaben bestand die Schwierigkeit für die Teilnehmenden darin, dass die Personen nur die Merkmale in ihrer Nähe beobachten und deswegen nur mit ihren Nachbarn interagieren konnten.

Abb. 2
figure 2

(Quelle: eigene Photographie)

SchwarmExperiment, 2015 – Aufgabe 3.

Die Analyse der Videoaufzeichnung der Experimente erbrachte folgende Ergebnisse:

  • Für das erste Experiment bedurfte es einer weniger intensiven Kommunikation, da die Teilnehmenden die verschiedenen Farben leicht über größere Entfernungen hinweg erkennen konnten.

  • Die zweite Aufgabe erforderte im Vergleich mehr Kommunikation und zusätzliche Führung aus dem Schwarm heraus. Die Experimente zeigten, dass mehr als 20 % der Personen die Anführer-Rolle übernommen hatten, jedoch immer nur für einen sehr kurzen Zeitraum.

  • Bei der dritten Aufgabe mussten die Individuen mehr interagieren, um sich in die Reihe einordnen zu können. Hier war Führung (aus dem Schwarm heraus) bei der Organisation des Schwarms unverzichtbar. Während dieser Aufgabe gab es insgesamt weniger Teilnehmende in der Anführer-Rolle, jedoch wurde diese Rolle wesentlich länger beibehalten.

  • Die Lösung von Aufgabe vier dauerte wesentlich länger. Die Wörter, die von den Teilnehmenden gebildet wurden, waren häufig nur kurz. Außerdem wurde bei dieser Aufgabe mehr Interaktion beobachtet, da sich die Teilnehmenden innerhalb von Gruppen auf ein konkretes Ziel (Wort) einigen mussten, was sich in der langen Zeit zur Lösung der Aufgabe niederschlägt.

Die Ergebnisse zeigen, dass Führung (aus dem Schwarm heraus) und Kommunikation (der Teilnehmenden) eine wesentliche Rolle beim Schwarmverhalten von Menschen spielen. Im Folgenden wird beschrieben, wie diese Erkenntnisse für Schwarmintelligenz in technischen Systemen genutzt werden können.

2.2 Schwarmintelligenz in technischen Systemen

Heutzutage sind technische Systeme wie Roboter, Sensoren, Computer, mobile Kommunikationsgeräte allgegenwärtig. Diese Systeme werden immer kleiner, zahlreicher und sind mit mehr Kommunikationsfähigkeiten ausgestattet. Das Internet der Dinge bietet ein gutes Beispiel für ein sich selbst organisierendes System, das aus vielen solchen Geräten besteht. Die vernetzten Geräte sollen sich an die veränderliche Umgebung und deren Dynamik anpassen, das System soll gegen Ausfälle einzelner Geräte robust sein und die Geräte sollen sich selbstorganisieren.

Mit Hilfe von Methoden aus dem Forschungsgebiet Schwarmintelligenz können solche Herausforderungen oft besser gemeistert werden. Die Hauptgründe sind:

  • Skalierbarkeit: Da für alle Individuen einfache Regeln erstellt werden und alle Individuen gleich aufgebaut sind, können sehr viele Individuen verwendet werden, um eine Aufgabe zu bearbeiten. Dadurch kann zum Beispiel ein Schwarm von Robotern in Szenarien wie der kollektiven Suche dazu beitragen, einen größeren Bereich abzudecken als ein einzelner Roboter.

  • Robustheit gegen Ausfälle: Wenn einzelne oder mehrere Individuen nicht funktionieren, kann der Schwarm die Aufgabe trotzdem erfüllen.

  • Adaptives Verhalten: Schwärme können sich an Änderungen der Umgebung anpassen.

Schwarmintelligenz in der Informatik wird primär in drei Forschungsbereichen bearbeitet:

  • Kollektive und Crowds,

  • Kollektive Intelligenz

  • Kollektives Lernen

Die erste Forschungsdomäne behandelt kollektives Verhalten, indem die Schwärme auf makroskopischer Ebene untersucht werden. Die Individuen und ihre Verhaltensweisen werden dabei nicht im Detail untersucht, sondern nur das globale Verhalten und dessen Folgen (Helbing und Molnar 1995). In der kollektiven Intelligenzwerden Individuen mit festen Regeln betrachtet. Im dritten Teilgebiet, dem kollektiven Lernen, verändern die Individuen ihre Regeln. Kollektive Suchmechanismen wie Ameisenkolonie-Optimierung (Bonabeau et al. 1999) und Partikelschwarm-Optimierung (Kennedy und Eberhart 2001), kollektive Sortieralgorithmen (Bonabeau et al. 1999), kollektive Entscheidungsfindung und kollektive Wahrnehmung (Schmickl et al. 2016) gehören zum Gebiet der Kollektiven Intelligenz. Die wichtigsten Bereiche im Gebiet des Kollektiven Lernens sind evolutionäre Algorithmen (Kruse et al. 2016) und evolutionäre Robotik (Nolfi und Floreano 2000).

Gegenstand dieses Aufsatzes sind die Bereiche Kollektive Intelligenz und Kollektives Lernen.

2.3 Komponenten der Kooperation in Schwarmintelligenz

Das kollektive Verhalten im Schwarm basiert im Wesentlichen auf drei Komponenten:

  • Lokale Kommunikation und Interaktion zwischen den Individuen

  • Regeln, die für alle Individuen gleich sind

  • Entwicklung einer Führung, aus dem Schwarm heraus

Auch wenn ein Anführer nicht explizit festgelegt ist und die Individuen mit den gleichen Regeln programmiert werden, übernimmt ein Individuum die Rolle des Anführers. Die Rolle eines temporären Anführers ist eines der wesentlichen Elemente zur Lösung einer festgelegten Aufgabe.

Beispiele für Führung können in der Natur oft beobachtet werden: In einem Schwarm von Vögeln, die nach Nahrung suchen, übernimmt ein Vogel an der Spitze die Rolle des Anführers. Selbst wenn die Rolle nicht ausdrücklich festgelegt ist, ist in einem Schwarm ein Anführer erkennbar. Der Anführer bringt seine eigene Individualität entgegen dem Schwarm zum Tragen und trägt gerade damit zum Erfolg des gesamten Schwarms bei. Dieses Verhalten kann auch in technischen Systemen beobachtet werden, zum Beispiel in kollektiven Suchszenarien in Optimierungsalgorithmen (Kennedy und Eberhart 2001) oder im Kontext kollektiver Suche mit Robotern (s. u.) beobachtet werden.

Insgesamt basiert die Selbstorganisation in der Schwarmintelligenz auf den eben genannten Komponenten. Meistens gibt es keine explizite externe Steuerung des Schwarms.

Bei der Anwendung der Schwarmintelligenz in technischen Systemen ist häufig gewünscht, das organisierte Verhalten extern zu steuern. Eine Möglichkeit, diese gesteuerte Selbstorganisation zu erreichen, besteht darin, die Randbedingungen, das Umfeld, etc. zu verändern, in der der Schwarm seine Aufgabe ausführt. Ein alltägliches Beispiel für gesteuerte Selbstorganisation sind Ampeln (kontrollierbarer Teil der Umwelt), die mehrere Fahrzeuge (Individuen im Schwarm) steuern. In der gesteuerten Selbstorganisation ist es effizienter und oft einfacher, die Umgebung zu beeinflussen und dadurch den Schwarm zu steuern, als auf einzelne oder sogar alle Individuen einzuwirken.

3 Die Rolle der Kommunikation und der Führung

Ein wichtiges Merkmal der Schwarmintelligenz in technischen Systemen ist die Rolle des Anführers. Wie bereits erwähnt, ist die Rolle des Anführers nicht vorherbestimmt. Eines der Individuen übernimmt diese Rolle für eine bestimmte Zeit. Wie bei Vögeln in der Natur übernimmt ein Vogel für einige Zeit die Führungsrolle, ein paar Sekunden später ein anderer. Die Rolle des Anführers in technischen Systemen soll am Beispiel einer kollektiven Suche (Kenndy und Eberhardt 2001) mit Anwendungen in Optimierungsproblemen und der Robotik verdeutlicht werden.

Dabei wird angenommen, dass mehrere Individuen (Roboter) nach Positionen mit hohen Temperaturwerten in ihrer Umgebung suchen. Jedes Individuum kennt seine aktuelle Position und kann dort die Temperatur messen und speichern. Die Individuen agieren nach den folgenden Regeln:

  1. 1.

    Sende deine Position und die dort gemessene Temperatur zu den Nachbarn.

  2. 2.

    Bewege dich in Richtung auf das Individuum mit der höchsten gemessenen Temperatur in deiner Nachbarschaft (Soziale Bewegungs-Komponente).

  3. 3.

    Bewege dich in Richtung einer zufälligen Position in der Nähe des Ortes deines höchsten gespeicherten Temperatur-Messwertes (Kognitive Bewegungs-Komponente).

In diesem Szenario ist das Individuum mit der aktuell höchsten Temperatur der Anführer der anderen Individuen, in dessen Richtung sich diese bewegen (soziale Bewegungs-Komponente). Dieses „soziale“ Verhalten stimmt meist nicht mit den eigenen Messwerten des Individuums überein. Deswegen bewegt sich jedes Individuum zusätzlich zur Bewegung in Richtung zum Anführer auch in Richtung des eigenen besten Messwertes (Kognitive Bewegungs-Komponente). Ein errechneter Kompromiss aus beiden Bewegungskomponenten ergibt die tatsächliche Bewegung der Individuen. Die richtige Balance zwischen sozialer Komponente (Kollektivität) und kognitiver Komponente (Individualität) führt zur schnellen Auffindung der Position mit dem höchsten Temperaturwert.

Ein anderes Szenario, das ursprünglich von Miller et al. (2013) untersucht wurde, bezieht sich auf das kollektive Verhalten in einem Fischschwarm in einem Aquarium. Angenommen, es gibt zwei Gruppen bereits trainierter Fische. Gruppe A wurde trainiert, um in einen Bereich des Aquariums mit gestreiften Mustern zu schwimmen. Gruppe B wurde darauf trainiert, ein farbiges Gebiet der Umgebung aufzusuchen. Miller et al. (2013) haben untersucht, was passiert, wenn beide Gruppen zusammen agieren. Einige Fische schwimmen in ein Gebiet mit einer Kombination der beiden Umgebungseigenschaften (gestreift und farbig). Dieser Bereich wird als Konsensgebiet bezeichnet.

In einer unserer Studien haben wir dieses Verhalten in einer Computersimulation untersucht und uns auf die individuelle Entscheidungsfindung konzentriert (Hassan und Mostaghim 2018). Unter gleichen Bedingungen wie bei Miller et al. (2013) wurde der künstliche Schwarm so programmiert, dass jeder Fisch entscheiden konnte: Folge ich dem Schwarm oder sollte ich in die Region schwimmen, für die ich trainiert wurde? Zu diesem Zweck haben wir das Konzept der multikriteriellen Optimierung (Deb 2001) verwendet. Wir konnten die Ergebnisse von Miller et al. (2013) reproduzieren und zeigen, dass über 50 % der Individuen dem Anführer im Schwarm und nicht ihrer individuellen Präferenz folgen.

Inspiriert von diesen Ergebnissen gehen wir im Folgenden der Frage nach, ob individuelle Entscheidungen in das Schwarmverhalten integriert werden können, damit der Schwarm davon profitiert. Wie bei Szenarien der kollektiven Suche mit Robotern modellieren wir jeden Roboter mit einer begrenzten Batteriekapazität und geben ihm die Möglichkeit, individuelle Entscheidungen zu treffen. Wir ändern dazu die zweite oben genannte Regel so, dass jedes Individuum einen Anführer anhand der eigenen Präferenz auswählen kann:

2‘. Bewege dich in Richtung einer zufälligen Position in der Nähe eines Nachbarn, der einen höheren Temperaturwert hat als du selbst.

Mit der neuen Regel kann als Anführer auch ein anderes Individuum gewählt werden, das nicht das mit der höchsten Temperatur in der Nachbarschaft ist, jedoch mit geringerem Batterieverbrauch erreicht werden kann. Dies bedeutet, dass innerhalb einer Nachbarschaft kein einzelnes Individuum die Rolle des Anführers für alle innehat, sondern mehrere Anführer existieren. Unsere Experimente zeigen, dass der Schwarm sowohl hinsichtlich des gesamten Energieverbrauchs als auch der Suchzeit effizienter ist, als wenn alle Individuen denselben Anführer auswählen (Mostaghim et al. 2016; Mai et al. 2019). Dasselbe gilt für weitere Experimente (Bartashevich et al. 2017), in denen wir einen Schwarm in einer sehr dynamischen Umgebung betrachten, die die Bewegung und die Effizienz der Individuen hinsichtlich der Suchzeit beeinflusst (z. B. Quadrokopter, die vom Wind beeinflusst werden). Jetzt muss jedes Schwarmmitglied eine individuelle Entscheidung treffen: Folge ich dem Schwarm oder sollte ich dem Gegenwind entgehen und einen anderen Anführer wählen? Auch hier liefern die Ergebnisse der einzelnen Algorithmen zur Entscheidungsfindung, die auf multikriterieller Optimierung basieren, eine klare Antwort: Mehr Anführer tragen zu einer insgesamt besseren Leistung des Schwarms bei. Darüber hinaus trägt die individuelle Entscheidungsfindung dazu bei, die Auswirkungen der Umwelt (z. B. Gegenwind) zu berücksichtigen.

4 Die Rolle der Umwelt

Die Herausforderung in der Anwendung der Schwarmintelligenz in technischen Systemen besteht darin, die Selbstorganisation so zu beeinflussen, dass das entstehende Verhalten des gesamten Schwarms den Wünschen der Anwender entspricht. Da die direkte Steuerung einzelner Individuen oft nicht möglich ist (z. B. bei einer großen Anzahl von Individuen), ist die Änderung der Umwelt die einzige Möglichkeit zur Steuerung solcher Systeme. Ein Beispiel ist die (indirekte) Steuerung des Verkehrs durch Lichtsignalanlagen.

Der Forschungsbereich Organic Computing (Müller-Schloer et al. 2011) untersucht die Methodik der „gesteuerten Selbstorganisation“. Steuerung und Selbstorganisation sind zwei widersprüchliche Begriffe. Der Kompromiss aus Steuerung und Selbstorganisation wird gemessen im „Grad der Selbstorganisation“, einer wichtigen Kennzahl eines selbst-organisierten Systems.

Im Folgenden werden die Methoden der Schwarmintelligenz und der Einfluss der Umwelt auf das Verhalten des Schwarms dargestellt. In einem Szenario der Kollektiven Wahrnehmung (Schmickl et al. 2016) wird überprüft, ob die negativen Auswirkungen der Umgebung in positive Effekte und dadurch zur Steuerung des Systems genutzt werden kann. Der Forschungsbereich der Kollektiven Wahrnehmung beschäftigt sich mit Methoden, mit denen man das subjektive Wissen mehrerer Individuen (z. B. fehlerbehaftete Messwerte von Robotern) zu einer besseren Wissensbasis kombinieren kann.

In dem hier betrachteten Beispiel bewegen sich zufällig mehrere Individuen in einem 2-dimensionalen Raum, der schwarze und weiße Flächen in einem Raster enthält. Die genaue Anordnung der Flächen (Abb. 3) sowie das Verhältnis von weißen zu schwarzen Flächen ist den Individuen nicht bekannt. Jedes Individuum kann die Farbe (schwarz oder weiß) an der Position, die es in den letzten \(n\) Zeitschritten besucht hat, wahrnehmen und speichern. Das Ziel des Schwarms ist es, gemeinsam die in der Umgebung vorherrschende Farbe zu bestimmen.

Abb. 3
figure 3

(Quelle: eigene Abbildungen)

Szenario der kollektiven Wahrnehmung in zwei verschiedenen Umgebungen, jedoch mit den gleichen Anteilen der schwarzen und weißen Flächen. Rechts: der Schwarm ist nicht erfolgreich, Links (transformierte Umgebung aus rechts): der Schwarm ist erfolgreich.

Die Individuen im Schwarm handeln nach den folgenden Regeln:

  1. 1.

    Finde eine Entscheidung für die Frage nach der vorherrschenden Farbe, indem Du die eigenen Wahrnehmungen in den letzten \(n\) Zeitschritten analysierst.

  2. 2.

    Teile deine Entscheidung deinen Nachbarn mit.

  3. 3.

    Ändere deine Entscheidung, wenn die Mehrheit deiner Nachbarn eine andere getroffen hat.

Mit diesem Algorithmus treffen alle Individuen nach einiger Zeit eine einheitliche Entscheidung, ob die Mehrheit der Flächen schwarz oder weiß ist. Dieser Ansatz funktioniert sehr gut, wenn der Schwarm in Umgebungen mit stark verschiedenen Anteilen der farbigen Flächen agiert. In Umgebungen mit sehr ähnlichen Verhältnissen, z. B. 48 % schwarz und 52 % weiß (Abb. 3), ist der Schwarm jedoch nicht immer in der Lage, die richtige Antwort zu finden.

Um den positiven Einfluss der Umgebung zu zeigen, wurde die Umgebung mithilfe einer isomorphen Transformation geändert (Bartashevich und Mostaghim 2019). Eine solche Transformation verändert den Anteil der Farben nicht, sondern verschiebt die farbigen Flächen an eine andere Position. Die linke Umgebung in Abb. 3 wurde mithilfe der Isomorphen Transformation erzeugt. Obwohl der Anteil der Farben nicht verändert wurde und die Individuen die gleichen Regeln befolgten, fand der Schwarm innerhalb kürzester Zeit die korrekte Lösung.

In beiden Szenarien ist die Umgebung unbekannt. So kann ein Schwarm mit vorher festgelegten Regeln ähnliche Aufgaben oft nicht lösen, vor allem wenn die Umgebung Hindernisse enthält und deswegen ein Teil der Umgebung für die Individuen nicht zugänglich ist. Eine mögliche Alternative zu fest vorgegebenen Regeln ist, die Regeln während der Bearbeitung der Aufgabe dynamisch anzupassen. Diese Methode wird im Bereich des kollektiven Lernens untersucht, in dem die Regeln von den Individuen während der Ausführung der Aufgabe gelernt (entwickelt oder optimiert) werden.

Basierend auf dem Konzept der evolutionären Algorithmen (Kruse et al. 2016) besteht das Ziel des kollektiven Lernens darin, von sehr einfachen, abstrakten Regeln auszugehen und diese sukzessive weiter zu entwickeln. Im folgenden Szenario Gate Passing Experiment agieren mehrere Individuen, die lokal ihre Umgebung wahrnehmen können und die eine Bewegungsregel erlernen sollen: Die Individuen sollen sich stets bewegen, Kollisionen vermeiden und ein schmales Tor von einem Raum zum anderen durchqueren (Abb. 4, links). Das schmale Tor (Gate) zu passieren stellt eine Herausforderung dar, weil dort Kollisionen zwischen den Individuen sehr wahrscheinlich sind.

Abb. 4
figure 4

(Quelle: eigene Abbildungen)

Ein Beispiel für kollektives Lernen: Ein Schwarm soll lernen, sich ohne Kollisionen zu bewegen und das Tor zu passieren. Links: das Szenario, Rechts: die Bahn des entwickelten Verhaltens durch evolutionäre Robotik (Wall-following).

Um dieses Verhalten zu erzeugen, wird eine Kombination aus bestimmten Bewegungsmustern wie vorwärts-fahren, rechts-abbiegen, links-abbiegen und anhalten verwendet. Diese Muster werden gespeichert und können durch Übergangsregeln kombiniert werden, in denen die Sensoren der Roboter ausgewertet werden. Zum Beispiel kann eine erlernte Verhaltensregel so aussehen: Wenn Sensor eins den Wert null misst, dann vorwärts-fahren, ansonsten links-abbiegen.

Der evolutionäre Ansatz funktioniert wie folgt:

  1. 1.

    Jedes Individuum ändert oder fügt nach jeweils \(n\) Zeitschritten zufällig einen neuen Baustein hinzu.

  2. 2.

    Die Individuen messen die Leistung (die sogenannte Fitness) ihres eigenen Verhaltens, indem sie die Anzahl ihrer Schritte und Kollisionen zählen und messen, wie oft sie das Tor passiert haben.

  3. 3.

    Sobald ein Individuum andere Individuen trifft, tauscht es seine Fitness mit den anderen aus. Falls es eine bessere Fitness hat, gibt es seine Verhaltensregeln an die anderen weiter, sonst löscht es das eigene Verhalten und übernimmt das beste Verhaltensmuster aus seiner Nachbarschaft.

Wenn der Schwarm über längere Zeit agiert, konvergiert er zu einem nahezu perfekten Verhalten (König et al. 2009): Alle Individuen bewegen sich an der Wand entlang, indem sie einander folgen. Dieses Wall-following ist ein emergentes Verhalten.

5 Zusammenfassung

Dieser Artikel bietet einen Überblick über Schwarmintelligenz in technischen Systemen. Wir haben verschiedene Aspekte des Schwarmverhaltens untersucht: Kommunikation, Führung und den Einfluss der Umgebung des Schwarms. Mithilfe dieser Techniken gelingt es, emergentes Verhalten zu erzeugen. Wir haben zudem Möglichkeiten aufgezeigt, ein selbstorganisierendes System zu schaffen, das trotzdem gesteuert werden kann.

Die Analyse von biologischen Schwärmen ist eine sehr gute Inspirationsquelle für die Realisierung technischer Schwärme. Umgekehrt tragen technische Schwärme auch zum Verständnis von Schwärmen von Tieren und Menschen bei, da diese Verhaltensmuster sehr gut simuliert werden können.