5.1 Einleitung

Der Einsatz von robotergestützten Assistenzsystemen für Menschen mit kognitiver Einschränkung oder Demenz kann die Autonomie und Unabhängigkeit sowie das Wohlbefinden der betroffenen Personen stärken und soziale Interaktionen ermöglichen. Darüber hinaus können solche Systeme auch den Pflegebedarf reduzieren bzw. hinauszögern und Pflegekräfte sowie Angehörige entlasten (Ienca et al. 2017; Pollack 2005). Jedoch birgt der Einsatz von robotergestützten Assistenzsystemen auch Risiken wie soziale Isolation, Verlust der Privatsphäre, Autonomie und Würde. Auch Sicherheitsrisiken oder Überforderung der Nutzer werden als Gefahren genannt (Sharkey und Sharkey 2012; Körtner 2016; Vandemeulebroucke et al. 2018; Manzeschke et al. 2013). Unterschiedliche robotische Systeme müssen dabei jedoch differenziert in Bezug auf ihre Funktionen, ihr Design und ihren Einsatz in verschiedenen Zielgruppen beurteilt werden (Körtner 2016).

Definitionsgemäß sind alle potenziellen Nutzergruppen von Unterstützungssystemen in verschiedenen Funktionen eingeschränkt, stellen also in verschiedener Hinsicht Risikogruppen dar. Eine besonders vulnerable Gruppe umfasst Personen mit kognitiver Einschränkung. Neben dem progressiven Verlust von relevanten kognitiven Teilleistungen und dem oft assoziierten Verlust von motorisch-funktionellen Leistungen bei diesen oft hochbetagten, multimorbiden Menschen spielen auch psychosoziale Aspekte (Stichworte: geringe Selbstwirksamkeit, Scham, Überforderung, Angst, Stigmatisierung) eine bedeutende Rolle. Einem besonders hohen Hilfsbedarf stehen in dieser Gruppe vielfältige Risiken bzw. Limitierungen gegenüber, die eine spezifische Abstimmung in der Entwicklung von technikgetriebenen Hilfssystemen notwendig machen. Eine besondere Bedeutung spielen in dieser Gruppe auch vielfältige ethische Aspekte (z. B. eingeschränkte formale Autonomie bei Einverständniserklärung, eingeschränkte Möglichkeiten, eigene Positionen zu vertreten und zu artikulieren). Ethische Aspekte bzw. die Ausrichtung der technischen Entwicklung auf die Zielgruppe stellen dabei keinen Verzögerungsgrund und kein Hindernis dar, sondern sind die Voraussetzung, um adäquate, passende Hilfsmittel zu entwickeln und die Akzeptanz bei den potenziellen Nutzern zu stärken (Körtner 2016). Diese strategische Ausrichtung der Entwicklung wird bislang oft unzureichend erfüllt (Robinson et al. 2013). Fast die Hälfte von gesundheitsrelevanten, häuslichen IT-Lösungen funktionieren nicht oder werden aufgrund einer unzureichenden Berücksichtigung von soziotechnischen Aspekten nicht angenommen (Alaiad und Zhou 2014). Die Akzeptanz von robotergestützten Assistenzsystemen ist jedoch entscheidend für deren erfolgreiche Implementierung und Nutzung (Ienca et al. 2017; Shah und Robinson 2006; Heerink et al. 2006).

Es gibt eine Vielzahl von individuellen Faktoren, die entscheidend sind für die Akzeptanz von robotergestützten Assistenzsystemen. Dazu gehören z. B. Alter, subjektiver Bedarf an Hilfe/Motivation, Geschlecht, Vorerfahrungen mit Technologien/Robotern, kulturelle Aspekte, soziale Rollen, individuelle Erfahrungen, Ängste und generelle Haltung gegenüber Robotern/technischen Hilfssystemen. Kognitive Fähigkeiten/Einschränkungen und das Bildungsniveau spielen dabei eine hervorgehobene Rolle und sind zudem mit anderen oben genannten Faktoren assoziiert (Broadbent et al. 2009). Einfache, kognitiv wenig herausfordernde Handhabung und das Wohlbefinden stellen ebenfalls wichtige positive Einflussfaktoren dar (Kulviwat et al. 2007).

Aufgrund der oben beschriebenen Vulnerabilität der Gruppe von Menschen mit kognitiver Schädigung werden diese in Forschungsprojekten oft ausgeschlossen. Ein Ausschluss von Forschungsprojekten kann dabei die Stigmatisierung von betroffenen Personen verstärken (Vernooij-Dassen et al. 2005; Werner und Heinik 2008), wohingegen der Einschluss die Autonomie und Empowerment fördern (Cubit 2010; Hellström et al. 2007; Nygard 2006) und die Stigmatisierung reduzieren kann (Robinson et al. 2009). Auch wenn die Vulnerabilität und eingeschränkte Autonomie dieser Gruppe Forschungsprojekte erschweren kann (Ienca et al. 2017), kann nur so ein konkreter, spezifischer Bedarf ermittelt werden (Astell et al. 2009). Die Einbindung der Nutzerperspektive wird daher von internationalen Vertreterorganisationen gefordert (Prince et al. 2015, S. 70) zur optimierten Passung der technischen Systeme an die Nutzerbedürfnisse.

5.2 Passung (Match/Mismatch) technischer Unterstützungssysteme im Hinblick auf die Zielgruppe von Menschen mit kognitiver Schädigung

Im Folgenden werden exemplarisch zwei Teilfunktionen eines intelligenten mobilitätsassistierenden Roboters vorgestellt und hinsichtlich ihrer Passung auf die Zielgruppe von älteren, multimorbiden Menschen mit und ohne kognitive(r) Schädigung bewertet. Das multimodale Mobilitätsunterstützungssystem auf Basis eines Rollators wurde im Rahmen eines europäischen AAL-(Ambient-Assisted-Living)-Projekts entwickelt: MOBOT: Intelligent Active Mobility Assistance Robot Integrating Multi-Modal Sensory Processing, Proactive Autonomy and Adaptive Interaction. (EU FP7-ICT-2011.2.1,ICT for Cognitive Systems and Robotics – 600796). Der „smarte“ MOBOT-Rollator (s. Abb. 5.1) nimmt vielfältige innovative Teilfunktionen auf, die die Mobilitätsunterstützung herkömmlicher Rollatoren deutlich erweitern (siehe Tab. 5.1). Durch einen sensorgesteuerten Motorantrieb und smarte Unterstützungssysteme kann das ca. 100 kg schwere Gerät sehr einfach bewegt werden.

Abb. 5.1
figure 1

Eingesetzter Prototyp des multimodalen MOBOT-Rollators

Tab. 5.1 MOBOT-Teilfunktionen

Beim Vergleich der Mensch-Maschine-Passung werden im Folgenden zwei Teilfunktionen verglichen, die in dem Forschungsprojekt spezifisch für diesen Mobilitätsassistenten entwickelt wurden:

  • Szenario 1. Sprachgesteuerte (auditive) Navigationshilfe zur Orientierung in fremder Umgebung und

  • Szenario 2. Sprach- und gestenbasierte (audio-gesturale) Steuerung von MOBOT-Teilfunktionen.

Die Bewertung basiert auf Ergebnissen einer Validierungsstudie des MOBOT-Prototyps und standardisierten Bewertungskriterien aus der Nutzerperspektive (Hauer et al. 2016). In beiden Testszenarien wurden vergleichbare Teilnehmerkollektive untersucht. Einschlusskriterien waren Alter >65 Jahre, kognitiver Status: Mini Mental State Examination (MMSE) 18–30 (Untergruppen: Personen mit moderater kognitiver Schädigung: 18–26; Personen ohne kognitive Schädigung MMSE scores 27–30), keine schwerwiegenden somatischen, funktionellen oder sensorischen Schädigungen, die eine Teilnahme an der Studie ausschließen, und die aktuelle Nutzung eines Rollators als Gehhilfe. Das Studienkollektiv entspricht dem Kreis potenzieller Nutzer solcher Hilfssysteme und ist gekennzeichnet durch hohes Alter (82,5 Jahre), beginnende Einschränkungen in Aktivitäten des Alltags (Barthel-Index 86,4 Punkte), eingeschränkte funktionelle Leistung (Gehgeschwindigkeit 0,56 m/sec) und deutlich erhöhtes Sturzrisiko (Personen mit Sturz im letzten Jahr: 59,5 %). Die Gruppenzugehörigkeit wurde randomisiert, es bestanden keine signifikanten Unterschiede zwischen den Untersuchungsgruppen (Tab. 5.2).

Tab. 5.2 Beschreibung des Studienkollektivs

5.2.1 Szenario 1: Kognitive Assistenz – Navigationspfad in fremder Umgebung

Hintergrund/Beschreibung

Das Testszenario untersucht die Effektivität eines auditiven Assistenzsystems zur Navigation in fremder Umgebung. Orientierungsprobleme in fremder Umgebung sind häufig, nicht nur bei älteren Menschen, kognitiv geschädigte Personen sind besonders betroffen. Ein typisches Setting sind komplexe Raumstrukturen in großen Gebäuden, wie z. B. Krankenhäusern.

Die untersuchte auditive Navigationshilfe wird unterstützt durch verschiedene komplexe Assistenzmodule, die für das Projekt entwickelt und erfolgreich validiert wurden und in der MOBOT-Mobilitätsplattform integriert sind: Lokalisation (eigene Position), Kontexteinordnung der Position (Umgebung), Pfadfindung (Direktion) und Instruktion.

Die auditiven Instruktionen werden als kurze, standardisierte Sprachbefehle (audio cues) (z. B. links, geradeaus fahren) während der Rollatornutzung kontextnah ausgegeben (vgl. TomTom-System beim Autofahren). Die Orientierung des Systems beruht auf vorinstallierten Informationen zum Raum (kartenbasiertes, systeminternes Modul) in Verbindung mit vorinstallierten „guard points“ (externe Sensormodule im Raum) mit assoziierten „audio-tokens“. Das kognitive Assistenzmodul erlaubt eine optimierte Anpassung. Die Forschungsfrage bezieht sich auf die Effekte eines solchen Navigationssystems in einem typischen Setting (Krankenhauskorridore) bei einer typischen Nutzergruppe hochbetagter, multimorbider Menschen mit und ohne kognitive(r) Schädigung.

Studiendesign

Ein 2 × 2-Studiendesign wurde gewählt, um die beiden Untersuchungsgruppen (kognitiv intakt [MMSE >26] vs. geschädigt [MMSE ≤26]) unter zwei unterschiedlichen Konditionen (unterstützter vs. nicht unterstützter Navigation) zu untersuchen.

Experimentelles Design

Als Testumgebung wurde ein Navigationskurs in einem für die Anwendung repräsentativen Setting gewählt: Korridore in einem Krankenhaus (Bethanien-Krankenhaus, Heidelberg). Der Navigationskurs wurde in zwei Teilstrecken aufgeteilt. Der erste Teil führte vom Startpunkt bei einem Aufzug einer Akutstation einen Korridor entlang, durch die Haupteingangshalle zur Krankenhauskapelle, dem ersten Zielort (kürzeste Wegstrecke 45 m). Die zweite Teilstrecke führte von der Kapelle durch die Haupteingangshalle, entlang des Korridors zum Aufnahmezentrum des Krankenhauses (kürzeste Wegstrecke 55 m) (siehe Abb. 5.2).

Abb. 5.2
figure 2

Navigationskurs im Erdgeschoss des Bethanien-Krankenhauses

Beide Untersuchungsgruppen absolvierten einen identischen Navigationskurs. Die Teilnehmer, die durch das MOBOT-Navigationssystem unterstützt wurden, erhielten auditive Hinweise (audio cues) an kritischen Wegpunkten, sobald sie sich einer kritischen Zone näherten. Jeder Hinweis wurde alle drei Sekunden wiederholt, bis der Teilnehmer die Zone wieder verlassen hatte. Die nicht assistierte Gruppe war bei der Orientierung auf die klassischen Hinweisschilder an Wänden oder Decken angewiesen (siehe Abb. 5.3, rechtes Bild, zur Positionierung und Häufigkeit der klassischen Orientierungshilfen).

Abb. 5.3
figure 3

Position der externen Sensoren (guard points) zur technischen Navigationshilfe (assistierte Navigation, linkes Bild); Kreise mit einer 1 am Anfang repräsentieren audio cues auf dem Weg zur Kapelle (1. Testabschnitt), Kreise mit einer 2 am Anfang audio cues zum Aufnahmezentrum (2. Testabschnitt). Die Größe der Kreise markieren die kritischen Zonen für die jeweiligen audio cues. Hinweisschilder zur Orientierung ohne Assistenz (rechtes Bild); blaue Vierecke markieren Hinweisschilder zur Kapelle, lila Vierecke die zum Aufnahmezentrum

Die Hinweisschilder innerhalb der Klinik waren für den Routinegebrauch bereits optimiert und erlauben eine gute Orientierung. Es wurde ein relativ einfacher Kurs gewählt, um Floor-Effekte auch bei den kognitiv geschädigten Personen zu vermeiden. Der Kurs war allen Studienteilnehmern nicht bekannt. Unabhängig von der Gruppenzugehörigkeit (assistierte vs. nicht assistierte Navigation) wurden keine weiteren Instruktionen oder Hilfen gegeben. Nachfragen zur Orientierungshilfe bei anderen Personen waren in beiden Gruppen nicht erlaubt. Jeder Teilnehmer wählte seine eigene, habituelle Gehgeschwindigkeit. Nach Erreichen des ersten Zielortes (Kapelle) wurde eine kurze Pause gewährt, bevor der zweite Teil des Navigationstests (Zielort Aufnahmezentrum) durchgeführt wurde. Die generellen Zielangaben zu den Zielorten waren streng standardisiert in beiden Untersuchungsgruppen.

Ergebnisse

Es zeigte sich eine drastische Verbesserung der Durchführungsdauer bei Personen mit moderater kognitiver Schädigung, wenn die Orientierung durch die MOBOT-Navigationshilfe unterstützt wurde. Die Leistungen sind dann mit den Leistungen von Personen ohne kognitive Schädigung vergleichbar. In der bewusst gewählten, relativ einfachen Orientierungsaufgabe erreichen fast alle Personen (37 von 40 Personen) unabhängig von der Assistenzunterstützung und dem kognitiven Status das Ziel. Vermutlich aufgrund von Deckeneffekten (ceiling effect) verbessert das Assistenzsystem die Testleistung (Gesamtdauer) bei kognitiv intakten Teilnehmern nicht. Das Ergebnis weist darauf hin, dass Assistenzsysteme dann wirksam sind, wenn eine gute Passung von technischer Lösung und Bedarf besteht. In dem Beispiel wird zudem deutlich, dass die Passung nicht nur vom Typ der Unterstützung, sondern auch auf der Nutzerseite vom Grad einer eventuellen Schädigung bzw. dem Aufgabenkontext abhängt. Bei geändertem Kontext (komplexere Orientierungsaufgabe) wären bei den kognitiv Intakten möglicherweise ebenfalls Effekte nachzuweisen (Abb. 5.4 und Tab. 5.3).

Abb. 5.4
figure 4

(Dargestellt ist die Ausführungszeit für den Gesamtkurs [Teil 1 und 2] für die Konditionen mit und ohne Assistenz nach kognitivem Status [MMSE ≤ 26, mit kognitiver Schädigung, und MMSE > 26, ohne kognitive Schädigung])

Vergleich der Ausführungszeit nach Gruppe und Unterstützung.

Tab. 5.3 Effekt von Kognition und Navigationshilfe

Subjektive Nutzerzufriedenheit

Die Nutzerzufriedenheit wurde durch einen standarisierten Fragebogen (TSQ-WT questionnaire) erhoben, der unterschiedliche Aspekte der Nutzerbewertung erlaubt (Nutzen/Benefit, Nutzerfreundlichkeit/Usability, Selbstkonzept/Self-concept, Lebensqualität/Quality of life). Für das erste Testszenario war eine standardisierte Erhebung der subjektiven Zufriedenheit möglich, da an die Testkonditionen eine Teilfunktion des Mobilitätssystems direkt gekoppelt war (in diesem Fall audio cues für die Navigation). Die Erhebungsmethode erlaubt nur Bewertungen, die einen solchen Bezug aufweisen. Dem zweiten Testszenario (gestenbasierte/verbale Kommandos) waren zum Zeitpunkt der Untersuchung keine MOBOT-Teilfunktion/-Reaktion (später integriert waren autonome Bewegungen des Systems, initiiert durch die jeweiligen Kommandos) zuzuordnen. Eine Erfassung der subjektiven Bewertung war daher im zweiten Szenario nicht möglich.

Die Nutzerevaluation wurde bei allen Teilnehmern durchgeführt, die das MOBOT-Navigationssystem getestet hatten (Gruppe mit Navigation) (n = 22). Die Medianwerte aller Fragebogendomänen liegen im oberen Wertebereich (≥13,5–16,5) und zeigen eine generell sehr positive Einschätzung des MOBOT-Navigationsunterstützungssystems an. Überraschenderweise zeigt sich keine Korrelation von kognitivem Status und der subjektiven Bewertung der Navigationshilfe (keine signifikanten Korrelationen zwischen MMSE Scores und verschiedenen Fragebogen-Items (Spearmans rho = −,138−,033; p-Werte = ,541−,981) als möglicher Hinweis darauf, dass das Navigationssystem generell als hilfreich eingeschätzt wurde, auch wenn dies in der einfachen Testsituation bei den kognitiv intakten Teilnehmern nicht zu besseren Testergebnissen geführt hatte und ggf. somit auch das Potenzial als die tatsächlich notwendige Unterstützung bewertet wurde (vgl. Abb. 5.5).

Abb. 5.5
figure 5

(Dargestellt sind Ergebnisse des TSQ-WT [Median/Range max-min]: Nutzerbewertung des Navigationsunterstützungssystems, höhere Werte zeigen positivere Einschätzung an)

Ergebnisse zur subjektiven Nutzerbewertung.

Nutzen/Benefit

Der Medianwert von 13,5 für die Domäne „Nutzen“ (Range 8–20) dokumentiert, dass das MOBOT-Navigationsunterstützungssystem einen erkennbaren Nutzen für die Teilnehmer hat. Der Gebrauch dieser Funktionalität scheint für die Teilnehmer lohnenswert, da sie das System auch anderen Menschen in einer ähnlichen Situation empfehlen würden.

Nutzerfreundlichkeit/Usability

Die Nutzerfreundlichkeit erreicht in der Bewertung den Höchstwert unter allen Domänen (17 von 20 Punkten [Range 7–20]). Die Navigationshilfe wird als leicht bedienbar wahrgenommen. Sie ist ohne große Anstrengung, sicher und zuverlässig zu handhaben, die Nutzung ruft keine Unsicherheits-/Überforderungsgefühle hervor.

Selbstkonzept/Self-concept

Eine hohe Zustimmung kann auch in der Domäne „Selbst-Konzept“ (Median = 16, Range 9–19) dokumentiert werden. Die Teilnehmer assoziieren die Nutzung nicht mit dem negativen Gefühl, die Eigenständigkeit zu verlieren oder sich älter zu fühlen, als sie tatsächlich sind, und fühlen sich nicht beschämt/peinlich berührt, wenn sie das System in der Öffentlichkeit nutzen.

Lebensqualität/Quality of life

Der überdurchschnittliche Wert von 13,5 (Range 7–18) dokumentiert die positive Einschätzung der Nutzer zum Potenzial des Navigationssystems, das Wohlbefinden, soziale Kontakte und die Selbstständigkeit zu steigern. Die – öffentliche – Nutzung war nicht mit einem unangenehmen Gefühl verbunden, das die Lebensqualität der Nutzer negativ beeinflussen würde.

Gesamtbewertung

Die große Mehrzahl der Teilnehmer ist in der Lage, die technischen Anforderungen gut zu bewältigen. Das Unterstützungssystem verbessert bei Personen mit leichter bzw. moderater kognitiver Schädigung die motorische Leistung/Orientierung in fremder Umgebung sehr deutlich. Das System wird als leicht bedienbar, nützlich, effektiv und in seiner – öffentlichen – Nutzung als nicht diskriminierend empfunden.

Eine ausführliche Darstellung der Ergebnisse des Navigationsszenarios findet sich in Werner et al. (2018).

5.2.2 Szenario 2: Sprach- und gestenbasierte (audio-gesturale) Steuerung von MOBOT-Teilfunktionen

Hintergrund

Mensch-Maschine-Schnittstellen eröffnen natürliche Kommunikationswege für ältere Menschen, die die Interaktion potenziell erleichtern und multimodale Zugänge erlauben. Das vorgestellte multimodale Aktionserkennungssystem stellt in technischer Hinsicht immer noch eine Herausforderung dar im Hinblick auf die komplexe Sensorik, die große Menge an technisch zu verarbeitenden Daten, aber auch die Menge an Daten, die notwendig ist, um Techniken des maschinengestützten, autonomen Lernens zu unterstützen. Die Mensch-Maschine-Interaktion ist aus der Nutzerperspektive kaum untersucht.

Studiendesign und experimentales Design

Drei verschiedene Steuerungskommandos/Kommunikationsmodi zwischen dem Teilnehmer und dem MOBOT-System wurden in diesem Szenario untersucht, ein Erinnerungstest wurde zusätzlich eingebaut (real life szenario).

  1. 1.

    Audio-Modus

  2. 2.

    Gestenbasierter Modus

  3. 3.

    Kombinierter Audio-Gesten-basierter Modus

  4. 4.

    Selbstgewählter/freier Modus (Erinnerungstest)

In jedem Modus wurden die folgenden fünf Kommandos getestet/abgefragt:

  1. 1.

    Herkommen: „MOBOT, komm her“ (in der Endversion des Systems fährt MOBOT autonom zum Nutzer)

  2. 2.

    Aufstehen: „MOBOT, ich will aufstehen“ (in der Endversion hilft MOBOT beim Aufstehen)

  3. 3.

    Helfen: „MOBOT, hilf“ (in der Endversion des Systems ruft MOBOT den Notruf)

  4. 4.

    Orientieren: „MOBOT, wo bin ich?“ (in der Endversion antwortet MOBOT mit der Raumlokalisation)

  5. 5.

    Einparken: „MOBOT, parke“ (in der Endversion parkt MOBOT ein)

Die Testung für dieses Szenario fand mit einem Prototypen statt, bei dem die Systemaktionen, die in der finalen Version vorgesehen waren, in dieser Version noch nicht aktiviert waren. Die Erfolgsmeldung durch das System erfolgte in dieser Testung als Audiorückmeldung: „MOBOT führt … aus“. Die Teilnehmer befinden sich während der gesamten Testung auf einem Standardstuhl 1–2 m hinter dem MOBOT-System.

Audio-Modus

Vor der Testung findet eine sehr ausführliche Einweisung statt, auch im Test selbst wurden die Teilnehmer in den Modi 1–3 unterstützt. Der Testleiter zeigt zuerst die fünf Audio-Kommandos in der festgelegten Reihenfolge auf einem Poster (1–5), der Teilnehmer liest diese gleichzeitig laut vor. In einem zweiten Schritt wird die Prozedur wiederholt, der Teilnehmer liest erneut die Kommandos in der richtigen vorgegebenen Reihenfolge. Falls Fehler auftreten, werden Lesefehler korrigiert und wiederholt, bis der Teilnehmer in der Lage ist, die Kommandos wie vorgegeben zu lesen. Zur Testung selbst zeigt der Testleiter die Kommandos noch einmal in derselben Reihenfolge.

Der Teilnehmer ist dann aufgefordert, die Kommandos laut vorzulesen (vom Poster). Nach dem Lesen wird eine kurze Pause gemacht, um dem System die Möglichkeit zu geben, die Kommandos zu registrieren und zu reagieren. Im Erfolgsfall reagiert das System mit einer Audiorückmeldung. Wenn maximal nach sieben Sekunden keine Rückmeldung erfolgt, fährt der Testleiter mit dem nächsten Audiokommando fort. Alle fünf Kommandos werden nacheinander in derselben Reihenfolge dreimal hintereinander durchgeführt (insgesamt also 3 × 5 = 15 Kommandos). Außengeräusche/Gespräche von/mit anderen Personen werden strikt ausgeschlossen.

Gestenbasierter Modus

Vor der Testung werden Gesten ebenfalls vom Testleiter vorgestellt und trainiert. In einem ersten Schritt werden die – einfachen – Gesten für jedes Kommando demonstriert. Die Geste wird dann nochmals vom Testleiter wiederholt und der Teilnehmer wird aufgefordert, die Geste zu imitieren. Jede Geste wird so lange trainiert, bis sie in der geforderten Weise durchgeführt wird.

Für die Testung demonstriert der Testleiter die Geste nochmals und der Teilnehmer imitiert die Geste unmittelbar im Anschluss (s. Abb. 5.6). Im Fall einer erkannten Geste reagiert das System mit einer Audiorückmeldung (nicht mit einer unmittelbaren Aktion wie im finalen Prototyp vorgesehen). Auch im Falle einer Nichterkennung wird die nächste Geste gezeigt. Alle fünf Gesten werden hintereinander in derselben Reihenfolge gezeigt/getestet. Es wird streng darauf geachtet, dass keine weiteren Personen in den Erfassungsbereich treten oder ins Sichtfeld kommen.

Abb. 5.6
figure 6

Ein Teilnehmer führt gestenbasierte Kommandos aus (links: „komm her“; rechts: „aufstehen“)

Audio-gesturaler Modus

Für den kombinierten audio-gesturalen Modus werden beide Testprotokolle kombiniert, supervidiert von zwei Testleitern (A, B). Zur Einführung zeigt Testleiter A die Audiokommandos und liest diese laut vor, während Testleiter B simultan die Gesten demonstriert. Die kombinierten Kommandos werden nun so lange trainiert, bis sie korrekt durchgeführt werden.

Zur Testung werden die Teilnehmer aufgefordert, die Kommandos vorzulesen, die von Testleiter A gezeigt werden, und gleichzeitig die korrespondierenden Gesten auszuführen, die von Testleiter B demonstriert werden. Bei erfolgreicher Erkennung reagiert das System ebenfalls mit einer akustischen Rückmeldung. Alle fünf audio-gesturalen Kommandos werden ebenfalls hintereinander in derselben Reihenfolge dreimalig präsentiert (s. Abb. 5.7).

Abb. 5.7
figure 7

Darstellung des kombinierten audio-gesturalen Modus. Der Teilnehmer führt die Geste (obere Reihe) und gleichzeitig einen Sprachbefehl aus (Akustikwellen untere Reihe). Die Farbelemente in der oberen Reihe sind überlagert mit Verarbeitungssignalen (Fokus: Bewegungserkennung)

Selbstgewählter/habitueller Modus

Die ersten drei Testkonditionen sind im Wesentlichen auf die technische Funktionalität hin (Erkennen von audio-gesturalen Kommandos) optimiert. Die massive Unterstützung durch simultane Gestenpräsentation und schriftliche Befehle entspricht nicht einer Situation, wie sie üblicherweise in der Bedienung eines solchen Hilfssystems in der täglichen Nutzung vorkommen würde. Die intensive Vorbereitung und die wiederholte Durchführung der Modi 1–3 stellen jedoch ein intensives Kurztraining dar, um für die potenziellen Nutzer die Voraussetzung für die korrekte Ausführung zu schaffen. Ein letztes Experiment sollte zeigen, welche Leistung die Teilnehmer ohne simultane Unterstützung zeigen können und was ggf. erinnert werden kann. Die Teilnehmer werden unmittelbar nach Abschluss der Testung aufgefordert, so viele Kommandos zu wiederholen, wie sie innerhalb von drei Minuten erinnern können, unabhängig von der Reihenfolge oder vom Modus. Es werden aber im Gegensatz zu den anderen Testungen keinerlei Unterstützungshilfen (simultane Gestendarstellung, Posterdarstellung) angeboten.

Ergebnisse

Bei der Ergebnisdarstellung fokussieren wir in diesem Beitrag auf den Modus 4 (selbstgewählter/habitueller Modus). Die Ergebnisse der Modi 1–3 zeigen, dass 10–15 % der Teilnehmer, trotz intensivem Vortraining und trotz massiver simultaner visueller wie auch akustischer Unterstützung, nicht in der Lage sind, einige Kommandos auszuführen, die auch vom System erkannt werden. Unter denen, die erkannt werden, reicht die Erfolgsrate der kombinierten Bewertung von menschlicher Ausführung und technischer Detektion von 6–26 % bis zu 47–60 % in einzelnen Modi mit einer tendenziell schlechteren Erfolgsrate bei gestenbasierten Aufgaben. Diese Ergebnisse sind insofern schwierig zu bewerten, als unterschiedliche Perspektiven sich überlagern (Qualität der technischen Erkennung und Qualität der menschlichen Ausführung). In dem Kontext dieses Beitrags liegt der Auswertungsfokus jedoch auf der Leistung der Teilnehmer (Nutzerperspektive), Modus 4 (selbstgewählter/habitueller Modus).

Anzahl der erinnerten/ausgeführten Kommandos

Obwohl jedes Kommando sehr intensiv eingeführt, demonstriert und mehrfach trainiert wurde, wurden durchschnittlich lediglich 3,5 (23,3 %) der möglichen 15 Kommandos erinnert. Differenziert nach einzelnen Modi wurden von jeweils fünf möglichen Kommandos nur 1,31 ± 1,3 (26,0 %) im Audio-Modus, 1,3 ± 1,4 (26,0 %) im gestenbasierten Modus und 1,6 ± 1,6 (32,0 %) im kombinierten Modus erinnert und ausgesprochen bzw. dargestellt (siehe Abb. 5.8).

Abb. 5.8
figure 8

(Dargestellt sind Ergebnisse der unterschiedlichen Modi nach kognitivem Status)

Ergebnisse der audio-gesturalen Steuerung

Die Daten wurden in einem Sub-Kollektiv der Untersuchungsgruppe des Navigationstests durchgeführt (diejenigen Personen, die einverstanden waren, einen weiteren Test durchzuführen). Das Subsample war aus diesem Grund nicht identisch mit dem ersten Sample (Navigation), da zwei kognitiv geschädigte Personen mit schlechterem funktionellem Status zum zweiten Test (audio-gesturale Steuerung) ausgeschieden waren. Beide Kollektive sind ansonsten vergleichbar (siehe Tab. 5.5) und entsprechen beide einem typischen potenziellen Nutzerkollektiv für die untersuchten Hilfssysteme. Für den hier wichtigen Vergleich der Leistungen in beiden Tests (Navigation vs. audio-gesturale Steuerung) ist der Unterschied nicht primär von Bedeutung, da kein direkter Gruppenvergleich beabsichtigt ist. Die audio-gesturale Gruppe wäre aber im Hinblick auf die kognitiv motorischen Ressourcen etwas besser zu bewerten. Erkennbar sind im Trend kleinere Unterschiede zwischen Personen mit und ohne kognitive Schädigung, die aber in dem kleinen Untersuchungskollektiv nicht signifikant werden. Insgesamt wird sichtbar, dass beide Subgruppen unabhängig von kognitiven Status, trotz umfassendem Kurztraining vor Testung, sehr deutlich limitiert sind, sowohl auditive, gestenbasierte wie auch kombinierte Befehle nachzuvollziehen (Tab. 5.4).

Tab. 5.4 Datenanalyse der audio-gesturalen Steuerung
Tab. 5.5 Vergleich der Subsamples beider Untersuchungen

Bewertung der Ergebnisse: Match bzw. Mismatch von Nutzerressourcen und technischen Anforderungen

Die Bewertung, ob technische Hilfssysteme in Passung auf die potenzielle Nutzergruppe hin erfolgreich entwickelt werden, hat neben technischen Bewertungskriterien eine besondere ethische Komponente. Ist eine solche Passung nicht oder unzureichend erreicht, so ist das System nicht nur nicht einsatzfähig bzw. nutzbar, ein Einsatz hätte sogar potenzielle negative Konsequenzen, die neben einer akuten Gefährdung auch psychosoziale Aspekte betreffen wie Selbstachtung/-bewertung und Scham oder externe negative Bewertungen und Stigmatisierung. In der großen potenziellen Nutzergruppe für AAL-Unterstützungssysteme stellen Menschen mit Demenz eine besonders vulnerable Gruppe dar, die in dieser Hinsicht besonders gefährdet erscheint, zugleich aber besonders wenig ihre Interessen vertreten und sich artikulieren kann. In der Entwicklung von AAL-Systemen ist die Nutzerperspektive bislang noch deutlich unter-, die technisch-ingenieurwissenschaftliche Perspektive deutlich überrepräsentiert. Von überragender Bedeutung ist eine Anpassung und Gleichberechtigung beider Anforderungen (wenn nicht sogar Priorisierung der Nutzerinteressen). Ein erster Schritt ist daher die optimierte Passung beider Entwicklungsperspektiven, bei der aber generalisierende Kriterien nur bedingt hilfreich sind. Voraussetzung einer spezifischen nutzerorientierten Entwicklung sollte daher eine detaillierte, maßgeschneiderte Analyse von vorhandenen Nutzerressourcen, technischen Anforderungen und deren Passung sein. Im Folgenden sollen beide untersuchte Unterstützungssysteme im Hinblick auf spezifische Kriterien bewertet werden, die für die potenzielle Nutzergruppe älterer Menschen, insbesondere auch solcher mit kognitiver Einschränkung, relevant sind. Als Bewertungskriterien wurden kognitive, motorische und psychosoziale Aspekte ausgewählt, die für die Nutzung/Bedienbarkeit der getesteten Systeme von besonderer Bedeutung sind (Tab. 5.6).

Tab. 5.6 Vergleich MOBOT-Unterstützungssysteme

Zusammenfassung des Vergleichs

Im Vergleich beider Unterstützungssysteme schneidet das Navigationssystem mit einer Abbrecherquote von <10 % und drastischen Verbesserungen in Verlaufsparametern wie Durchführungszeit gegenüber einer Erfolgsquote von ca. 30 % in der audio-gesturalen Steuerung in der Evaluation deutlich besser ab. Eine detaillierte Analyse des Anforderungslevels und der Passung auf die Nutzergruppe ermöglicht eine spezifische Bewertung der Testergebnisse.

Navigationsszenario

Die kognitiven Anforderungen an die Nutzung des Navigationssystems sind als eher gering einzustufen. Die Navigationshilfe ist vielen Nutzern zudem vom Autofahren bekannt, es liegen somit ggf. bereits Erfahrungen vor, die die Handlungsplanung und Ausführung unterstützen. Die spezifischen Anforderungen an Gedächtnisinhalte, die bei neurodegenerativen Schädigungen wie z. B. vom Alzheimer-Typus relativ früh im Krankheitsverlauf auftreten, sind gering. Sowohl für das semantische Gedächtnis (Teil des expliziten Gedächtnisses, speichert Fakten und Wortbedeutungen, Anforderung im Szenario allenfalls im Speichern von einfachen Handlungsanleitungen in der Instruktionsphase) als auch für das prozedurale Gedächtnis (speichert implizite oder nichtdeklarative Inhalte, die automatisch eingesetzt werden, z. B. motorische Abläufe; Anforderungen sind im Szenario sehr einfach und weitgehend vorstrukturiert) und für das Arbeitsgedächtnis (ermöglicht es, Informationen vorübergehend zu speichern und gleichzeitig zu manipulieren; im Szenario kaum gefordert wegen extern vorgegebener Handlungsstruktur) liegt das Anforderungsniveau niedrig und entspricht sehr einfachen Alltagsaktivitäten.

Ebenfalls früh eingeschränkt im Krankheitsprozess sind Aufmerksamkeit und Exekutivfunktionen, die im Szenario ebenfalls wenig gefordert sind. Die Aufmerksamkeitsspanne beschreibt jene Menge an Information, die in einer Situation bei kurzzeitiger Darbietung entnommen werden kann, also in den Kurzzeitspeicher aufgenommen wird. Im Testszenario ist die Informationsmenge, die in der Instruktion, insbesondere aber während des Betriebs anfällt, wenig komplex und sehr kurz, die Anforderung an die Testpersonen daher gering. Die geteilte Aufmerksamkeit beschreibt die kognitive Teilleistung, die es ermöglicht, unterschiedliche Informationsquellen zu verarbeiten und mehrere Aufgaben gleichzeitig erfolgreich durchzuführen. Im Testszenario werden die – wenig komplexen – Anforderungen im Wesentlichen konsekutiv und nicht gleichzeitig angefordert, das Anforderungsniveau an die Dual-Task-Fähigkeit der Teilnehmer ist gering.

Das Anforderungsniveau an die motorisch-funktionelle Leistung ist für das Studienkollektiv, bei dem schwere funktionelle Schädigungen ein Ausschlusskriterium darstellten, als eher gering einzustufen. Als motorische Funktion werden im Wesentlichen Gehleistungen gefordert, die aber durch die rollatorbasierte Mobilitätshilfe abgesichert werden. Sensorische Leistungen sind notwendig beim Hören der akustischen Instruktionen und bei der visuellen Orientierung im Raum. Da schwere sensorische Schädigungen ebenfalls ein Ausschlusskriterium der Studie darstellen, ist auch das Anforderungsniveau in Bezug auf die Sensorik gering und entspricht, wie bei den motorischen Leistungen, normalen Basisanforderungen im Alltag.

Das eher geringe Anforderungsniveau, z. T. auch die gelungenen Unterstützungsfunktionen des MOBOT-Navigationssystems, hat positive Effekte auf psychosoziale Bewertungskriterien. Weder bei der Gruppe der kognitiv intakten noch bei der Gruppe der kognitiv geschädigten Teilnehmer wird eine Überforderung der Teilnehmer erkennbar. Positive Wahrnehmungen der eigenen Leistung und die durchgehende Kontrolle über das System wirken dem Verlust der Selbstwirksamkeit/Kontrollverlust entgegen. Obwohl die Nutzung des Navigationssystems im öffentlichen Raum stattfindet, mit einem potenziell erhöhten Risiko für Schamgefühle seitens der Nutzer wie auch externer Stigmatisierung, zeigen sich keine solchen negativen Reaktionen. Interessanterweise wird die Nutzerrolle eher positiv wahrgenommen („Kapitän“ einer schweren Hightech-Maschine, die man souverän bedient). Die Navigationshilfe ist zudem aus der Automobilnutzung bekannt und etabliert (TomTom) und nicht negativ besetzt.

Audio-gesturale Steuerung

Die kognitiven Anforderungen an die Nutzung der audio-gesturalen Steuerung sind als hoch einzustufen. Die innovativen Steuerungsmodi sind vielen Nutzern nicht bekannt, es liegen somit keine Vorerfahrungen vor, auf die die Nutzer ggf. zurückgreifen können. Alle aufgeführten spezifischen gedächtnisbasierten Teilleistungen sind beteiligt. Sowohl für das semantische Gedächtnis (Anforderung im Szenario im Speichern von zahlreichen, komplexen, neuen Handlungsanleitungen in der Instruktionsphase) als auch für das prozedurale Gedächtnis (Anforderung im Szenario für die neuen, dreidimensionalen Bewegungsmuster der Gesten) und für das Arbeitsgedächtnis (Anforderung im Szenario bei der simultanen Ausführung von gestenbasierten und auditiven Befehlen), aber auch bei gleichzeitiger Informationsaufnahme (externe Hilfen wie Gestendarstellung, Poster) und Ausführung liegt das Anforderungsniveau sehr hoch und findet kaum eine Entsprechung in Alltagsaktivitäten. Andere kognitive Teilfunktionen wie Aufmerksamkeit und Exekutivfunktionen sind im Szenario ebenfalls stark gefordert. Im Testszenario ist die Informationsmenge, die in der Instruktion, insbesondere aber während des Betriebs, anfällt, komplex und relativ umfangreich, die Anforderung an die Testpersonen daher hoch. Die geteilte Aufmerksamkeit ist im Testszenario in den ersten drei Modi notwendig, da zur Unterstützung der Erinnerung die zahlreichen und komplexen Befehle simultan extern von Testleitern dargestellt werden; das Anforderungsniveau an die Dual-Task-Fähigkeit der Teilnehmer ist daher hoch.

Das Anforderungsniveau an die motorisch-funktionelle Leistung ist für das Studienkollektiv, vergleichbar dem Navigationsszenario, als eher gering einzustufen. Als motorische Funktion werden im Wesentlichen Arm-/Handbewegungen im Sitzen beim gestenbasierten Modus gefordert, die allenfalls vereinzelt bei bestimmten Gesten bei individuell eingeschränkter Schulterbeweglichkeit limitiert sein können. Sensorische Leistungen sind notwendig beim Hören/Erkennen der akustischen und visuellen Instruktionen. Das Anforderungsniveau in Bezug auf die Sensorik ist gering und entspricht, wie bei den motorischen Leistungen, normalen Basisanforderungen im Alltag.

Das hohe Anforderungsniveau, z. T. auch die fehlenden Unterstützungsfunktionen des MOBOT-Audio-Gesten-basierten Steuerungssystems hat potenziell negative Effekte in Bezug auf psychosoziale Bewertungskriterien. Sowohl in der Gruppe der kognitiv intakten wie auch in der Gruppe der kognitiv geschädigten Teilnehmer wird eine Überforderung der Teilnehmer deutlich erkennbar (Floor-Effekte). Die Wahrnehmungen der eigenen unzureichenden Leistung und die geringe Effektivität der Steuerung der Systemfunktion verringern potenziell die Selbstwirksamkeit und verstärken das Gefühl des Kontrollverlustes. Obwohl die Nutzung des audio-gesturalen Steuerungssystems nicht im öffentlichen Raum stattfindet, ist die durchgehende Überforderungssituation potenziell mit einem erhöhten Risiko für Schamgefühle seitens der Nutzer wie auch externer Stigmatisierung (ggf. seitens von pflegenden Angehörigen in einer habituellen Nutzung) verbunden. Die subjektive Bewertung dieses Szenarios wurde nicht standardisiert erhoben. Individuelle Rückmeldungen oder Reaktionen der Studienteilnehmer (wie z. B. ein kompletter Ausstieg aus der Testung) belegen jedoch die negative Bewertung des audio-gesturalen Steuerungssystems in dieser Entwicklungsphase.

Bewertung der Passung des Anforderungsniveaus und Ressourcen der Nutzergruppe

Beide Systeme zeigen ein vergleichbares Anforderungsniveau in den relevanten Bereichen motorische und sensorische Leistung, die auch in beiden Fällen zur potenziellen Nutzergruppe passen. Beide Systeme sind zudem für jeweils hochrelevante Unterstützungsbereiche (Mobilität/Steuerung) und relevante spezifische Teilfunktionen (Navigation/Orientierung; autonome Hilfsmittelsteuerung) entwickelt worden. Entscheidend bei der Bewertung der Passung ist jedoch das kognitive Anforderungsniveau.

Die kognitive Passung der Anforderungen des Navigationssystems an die Nutzergruppe erscheint anhand der obigen Bewertung als gut bis sehr gut. Insbesondere die Gruppe der Personen mit moderater kognitiver Schädigung profitiert in hohem Maße von der kognitiven Unterstützung bei der – in dieser Gruppe geschädigten – räumlichen Orientierung in dem relativ einfachen Orientierungsparcours. Bei einem deutlich komplexeren Navigationskurs würde ggf. auch die Gruppe der kognitiv intakten Personen profitieren. Die generell positive subjektive Bewertung der Gesamtgruppe zeigt die Einsicht in das offensichtliche Potenzial des Hilfssystems auch bei kognitiv nicht geschädigten Personen.

Die kognitive Passung der Anforderungen des Audio-Gesten-basierten Steuerungssystems an die Nutzergruppe erscheint anhand der obigen Bewertung als ungenügend. Beide Untersuchungsgruppen mit und ohne kognitive Schädigung sind in hohem Maße vom komplexen kognitiven Anforderungsniveau überfordert.

Die Ergebnisse weisen auch auf die Prioritäten bei der Entwicklung des Hilfssystems und des Studiendesigns hin. Das Studiendesign des Navigationssystems wurde in enger Kooperation mit klinischen Partnern entwickelt und in seinem Anforderungsniveau auf die Limitierungen des Studienkollektivs ausgerichtet (einfaches Setting, Vermeidung von Floor-Effekten auch, um innovative Verlaufsparameter – Gehstrecke, in späteren Analysen auch qualitativ-quantitative Gangparameter – zu erfassen, die in der späteren Entwicklung für andere Unterstützungsfunktionen wie Sturzprävention relevant sind). In der technischen Entwicklung sind zudem einfache, stark strukturierte Teilunterstützungen im Fokus, die sehr geringe Anforderungen an die kognitive Leistung der Nutzer stellen, die sich an etablierte Unterstützungssysteme in anderen Lebensbereichen anlehnen (TomTom).

Das Studiendesign der Audio-Gesten-basierten Steuerung wurde hingegen maßgeblich von technischen Partnern entwickelt mit dem strengen Fokus auf die technische Evaluation der Erkennung der auditiven oder gestenbasierten Befehle und in seinem Anforderungsniveau nicht auf die Limitierungen des Studienkollektivs ausgerichtet. Die Limitierungen des Studienkollektivs wurden so weit wie möglich mit maximaler externer Unterstützung (Poster, simultane Präsentation von Gesten) durch den Testleiter kompensiert, wobei nicht bedacht wurde, dass die Unterstützung z. T. das kognitive Anforderungsniveau weiter steigert (Dual Tasking). Einzig der freie Modus ohne Unterstützung (Modus 4) wurde von den klinischen Partnern eingeführt, um wenigstens eine Testkondition zu dokumentieren, in der ein realistischer Nutzungskontext (nicht extern unterstützte Ausführung) vorgegeben wird und zudem eine Rückmeldung zu erinnerten Befehlen ermöglicht, die in den vorigen Modi 1–3 intensiv trainiert wurden. Die auditive und gestenbasierte Steuerung lehnt sich nicht an in der Lebenswelt von älteren Menschen schon etablierten Systemen an, die komplexen Anforderungen werden nicht von systemimmanenten Hilfsstrukturen unterstützt.

Zusammenfassung

Der Vergleich von zwei unterschiedlichen Hilfssystemen im Rahmen eines AAL-Projekts zeigt, dass eine detaillierte Anforderungsanalyse der Nutzergruppe im Hinblick auf die technische Entwicklung notwendig ist, um einerseits sinnvolle technische Funktionen zu garantieren und andererseits die Limitierungen und verbliebenen Ressourcen der potenziellen Nutzergruppe miteinzubeziehen, um eine hohe Adhärenz und Akzeptanz zu gewährleisten und gleichzeitig potenzielle Risiken auszuschließen.