Mehr als Modelle

Judith, denkst du, es ist nur noch eine Frage der (Entwicklungs-) Zeit, bis es möglich ist, uns mit Technologien vollständig zu durchschauen?

Technologien basieren immer auf Modellen, die wir uns von der Wirklichkeit machen. Und sie funktionieren ausschließlich dann, wenn der Kontext, in dem sie arbeiten, den Modellen hinreichend entspricht.

Um der Angst vor abstrakten Bedrohungen einen Ausdruck zu geben, braucht es eine Maske. Das eigene Gesicht lässt sich nicht genügend aufladen.

Sehr deutlich sieht man diesen Zusammenhang bei Robotern, die darauf programmiert sind, zu laufen und bei leichtesten Unebenheiten spektakulär ungebremst fallen.
Der Zusammenhang zwischen Modellen der Realität und der tatsächlichen Arbeitsumgebung von Maschinen gilt auch für Gesichtserkennungstechnologien. Sie funktionieren nur dann, wenn unsere Gesichter genügend den Modellen entsprechen, auf denen die Technologie basiert.

Werden einzelne Aspekte des Gesichts bei der Entwicklung der Technologie nicht berücksichtigt, fallen notgedrungen einige Individuen durch das Schema. Das passiert sowohl bei der Indexfunktion, wenn etwa Algorithmen nicht auf verschiedene Hautfarben trainiert werden und dann Personen mit dunkler Hautfarbe nicht als Menschen erkennen. Das Gleiche passiert auch bei der Mimik-Interpretation, wenn nur die Modelle der universellen Ausdrücke verarbeitet werden, kulturelle Ausdrücke jedoch nicht.

Problematisch werden Technologien jedoch auch dann, wenn die Modelle, auf denen eine Technologie basiert, grundsätzlich nicht korrekt sind. Die Forscher Xiaolin Wu und Xi Zhang von der Shanghai Jiao Tong University entwickelten 2016 eine Künstliche Intelligenz, der es vermeintlich gelingt, anhand von äußeren Merkmalen des Gesichts darauf zu schließen, ob eine Person kriminell ist oder nicht. Ein Blick in die dazugehörige Publikation zeigt jedoch offensichtliche wissenschaftliche und logische Fehler auf. Doch ob wissenschaftlich unzulänglich oder nicht – die KI liefert Ergebnisse. Werden solche Entwicklungen in einen gesellschaftlichen Kontext gebracht, dann urteilt ein falsches Modell über die Biografie von Menschen.

In solchen Fällen besteht die Problematik darin, dass die Modelle immer eine Reduktion der Realität vornehmen.


Die Frage ist nicht, ob wir durchschaut werden, sondern was passiert, wenn wir uns selbst Modellen unterwerfen und wir uns zwangläufig reduzieren?


Fragile Masken des Alltags

Judith, haben Alltagsmasken – Schminke, Verstellung, Schönheitschirurgie, Accessoires wie Brillen oder Piercings – auch diesen Zauber oder geht der im Alltag verloren?

Generell neigen wir dazu, rituelle Masken oder Karnevalsverkleidung und Alltagsmasken getrennt voneinander zu betrachten. Masken im herkömmlichen Sinne haben die Eigenschaft, unsere Mimik und die Indexfunktion des Gesichts mit zu verdecken und zeigen sich in einem manifesten Ausdruck.
Alltagsmasken hingegen beeinflussen unser Aussehen nur, überlagern es nicht vollständig. Beiden Masken ist jedoch gemein, dass sie zeitlich stark eingeschränkt sind. Karnevalsmasken nehmen wir ab, Schminke verläuft, Bartfrisuren wachsen heraus und Botox verliert seine Wirkung. Die Vergänglichkeit jeder Maskierung macht einen Teil ihres Zaubers aus. Selbst wenn wir versuchen, unsere Erscheinung dauerhaft zu kontrollieren, so gestaltet die Zeit das Gesicht immer mit und fügt unserem Erscheinungsbild es etwas Zufälliges hinzu.

Eine Maskierung ist also an den Jetzt–Zustand des Gesichts gebunden und funktioniert ausschließlich im Augenblick des Angesichts wirklich gut.

Wenn wir einer Person ins Gesicht blicken, ist das Bild, was wir von ihr bekommen, einzigartig und nur für uns sichtbar. Die Maske wirkt nur in diesem gemeinsamen Moment.

Alltagsmasken haben nicht weniger Zauber, sie sind im Gegenteil sogar fragiler und kommunizieren subtiler mit den Mitmenschen. Zwischen einzelnen subtilen Hinweisen, wie eine Person gesehen werden möchte, sind lauter Leerstellen, die darauf hindeuten, wie viele Seiten einer Person wir in dem Augenblick des Angesichts nicht sehen können.


Barbara, wenn wir so viel aus dem direkten Kontakt schöpfen, können Gesichtserkennungstechnologien uns diesen Zauber der direkten Begegnung nehmen?


Hinter der Maske nur Zufall

Judith, was vermittelt uns eine Maskierung?

Masken haftet oft ein fahler Geschmack von Verstellung oder Täuschung an. Meist betrachten wir Masken als einen Versuch, das „echte“ Gesicht hinter der Maske verbergen, um uns zu verstellen oder dem Gegenüber wichtige Informationen von uns zu verheimlichen. Betrachten wir Masken jedoch als eine Form der Symbolebene, dann können wir die Maske in einem völlig neuen Licht betrachten. Nach welchen Stereotypen wir betrachtet werden, hängt von den zufälligen Eigenschaften ab, die mein Gesicht ausmachen.

So ist es Resultat eines Zufalls, ob ich ein rundes oder ein kantiges Kinn habe. Mit den Stereotypen, die auf die Form meines Kinns projiziert werden, muss ich notgedrungen leben, auch wenn sie mit meiner Persönlichkeit und der Art, wie ich erscheinen möchte, oft überhaupt nichts zu tun haben. Wenn ich nun die zufälligen Eigenschaften meines Gesichts mit einer Maske überlagere, dann kann ich gezielt beeinflussen, mit welchen Vorstellungen meine Erscheinung verbunden werden soll. Eine Maskierung wirkt dann wie ein Schutz vor der Beurteilung meiner Persönlichkeit aufgrund meines Erscheinungsbilds.

Wenn ich das Aussehen meines Gesichts künstlich beeinflusse, macht das mein Gesicht nicht weniger „echt“, sondern vor allem weniger zufällig. Masken sind also mitnichten eine Verstellung des echten Gesichts, sondern eine Möglichkeit, die Gestaltung der Symbolebene nicht vollständig dem Gegenüber zu überlassen, sondern aktiv daran mitzuwirken.

Mit einer Maske biete ich nur gezielt die Eigenschaften an, bei denen ich das Gefühl habe, dass sie der Art, wie ich erscheinen möchte, entsprechen. Masken könnten so das „echte“ Gesicht von mir vielleicht mehr zum Ausdruck bringen, als es mein ungeschminktes Gesicht für mich tut.


Barbara, ist das Verbergen des echten Gesichts immer unehrlich? Kann man Maskierung auch positiv betrachten? Liegt darin nicht auch ein besonderer Zauber?


Zufällig ein Bild von Dir machen

Judith, denkst du, dass wir auch als Menschen manchmal den jeweiligen Ausdruck des Gegenübers fehlinterpretieren?

Frau mit Holzmaske

Sicherlich tun wir das nicht nur manchmal, sondern ständig. Grund dafür ist die Symbolebene des Gesichts. Diese Ebene ist sicherlich die seltsamste und gleichzeitig zauberhafteste der Ebenen, die wir hier betrachten. Wir können uns die Symbolebene des Gesichts wie eine Projektionsfläche vorstellen, die dem Gegenüber zwar einige Anhaltspunkte zur Person liefert, vor allem aber viele Andockstellen an denen man allerlei Ideen, Urteile und Vorurteile anheften kann.

Animation von Judith Block, Zwei Wesen machen sich ein Bild voneinander

Wenn wir sagen, dass wir uns „ein eigenes Bild“ von einer Person machen wollen, dann sagt das einiges über die Symbolebene des Gesichts aus. Das Bild, das wir uns von einer Person machen, ist nämlich tatsächlich von uns als Betrachter mit erstellt.
Ein Gesicht besteht immer aus einer Reihe an zufälligen Eigenschaften, die durch die Ausprägung unserer Gene entschieden werden. Diese Eigenschaften sind tatsächlich genau das – zufällig.

Im Laufe unseres Lebens wird unser Gesicht aber auch von den Dingen, die wir erfahren, mitgestaltet. So hinterlässt die Zeit allerhand Spuren in unserem Gesicht, ebenso wie die Sonne, die Pubertät, Krankheiten oder Verletzungen. Freude hinterlässt Lachfalten im Gesicht und emotional auszehrende Episoden Sorgenfalten.
Wenn wir ein Gesicht betrachten, dann ist die Symbolebene ein Versuch, die Spuren, die das Leben dort hinterlassen hat, richtig zu deuten. Dazu addieren wir meist eine bunte Mischung an Erfahrungen, die wir mit der Person bereits gemacht haben, dem Kontext, in dem wir ihr begegnen, Generalisierungen, Vorurteilen und visuellen Stereotypen. Wissenslücken werden hierbei großzügig mit Vorstellungen aufgefüllt.

Die Symbolebene bietet uns eine Möglichkeit, uns in sozialen Interaktionen zu orientieren und bestimmt maßgeblich, wie wir einer Person gegenübertreten. Ohne sie würden wir jeden Mitmenschen wie einen Fremden behandeln.

Gleichzeitig ist die Symbolebene immer auch an das Jetzt gebunden. Sie entsteht in dem Moment, in dem sich zwei Personen persönlich begegnen, einem Augenblick des Angesichts. Man kann sich den Augenblick des Angesichts so vorstellen: Zwei Menschen stehen sich gegenüber und tragen jeweils eine halbtransparente Maske, die sie nicht selbst erstellt haben, sondern die ihnen das Gegenüber aufgesetzt hat. Im Augenblick des Angesichts schauen wir also auf eine halbverschleierte Version des Gesichts unseres Gegenübers. Und diese Verschleierung haben wir selbst erschaffen.

Die Symbolebene bietet uns eine trügerische Gelegenheit, dort allerlei stereotype Vorstellungen drauf zu projizieren, die unser Gegenüber unberechtigt belastet. Wir sollten uns immer klarmachen, dass die Symbolebene mehr über uns als Ersteller der halbtransparenten Maske aussagt, als über die Person, der wir sie aufsetzen.


Barbara, was hältst du davon? Was drücken Stereotype deiner Meinung nach aus? Wie können Stereotypen auch entstehen?


Mimik decodieren

Judith, wie können Maschinen denn Mimik erkennen und verstehen?

Einige unserer mimischen Ausdrücke zeigen sich universell auf die gleiche Weise und sind wahrscheinlich in unserer DNA eingeschrieben. Diese Ausdrücke wurden erstmals von Paul Ekman und Wallace Friesen erforscht und unter dem Begriff „Basisemotionen zusammengefasst“. Dazu gehören Freude, Wut, Trauer, Angst, Ekel, Überraschung und Verachtung. Die Universalität dieser Basisemotionen ist für uns von herausragender Bedeutung, weil es bedeutet, dass wir unabhängig von Kultur, Sprache oder Fremdheit die Gefühle eines Gegenübers erkennen können. Die Basisemotionen geben uns eine grundlegende Orientierung über den emotionalen Kontext einer sozialen Interaktion.

Ekman und sein Forschungsteam entwickelten außerdem eine Systematik für Gesichtsausdrücke, das Facial Action Coding System (FACS). Dieses beinhaltet alle zu den Basisemotionen gehörenden Muskelbewegungen und macht es dementsprechend möglich, Mimik nach einer festen Logik zu decodieren. Das FACS bildet die Grundlage für alle derzeit bestehenden Mimik-Interpretations-Systeme. Diese werten die Bewegungen im Gesicht aus und vergleichen die Abweichungen mimischer Punkte (Mundwinkel, Lippenposition, Augenbrauen, etc.) mit ihrer neutralen Position. Es ist insofern technisch möglich, anhand von Bilddaten eine Aussage zu der emotionalen Grundverfassung einer Person zu treffen.

Allerdings ist Mimik nicht nur universell, sondern zu Teilen auch kulturell ausgeprägt. Zahlreiche Ausdrucksnuancen haben eine kulturelle Konnotation, deren Bedeutung wir nur verstehen können, wenn uns die Kultur bekannt ist. Dazu gehören etwa die Ausdrücke, die du bereits beschrieben hast: Was wird als Flirt wahrgenommen, was als Autorität? Wie zeigen wir Fürsorge oder drücken Ironie aus?
Kulturell geprägte Ausdrücke sind keine festen Einheiten wie die Basisemotionen, sondern entwickeln sich ständig weiter. Sie teilen sich diese Eigenschaft mit der gesprochenen Sprache, die sich ebenfalls ständig verändert und das Zeitgeschehen widerspiegelt.
Diese kulturell geprägten Ausdrücke werden in den derzeitigen Mimik-Interpretationstechnologien nicht berücksichtigt.

Der Umstand, dass unsere Mimik auf ihre universelle Ausprägung reduziert wird, ist problematisch. Werden kulturelle Ausdrücke von technischer Seite nicht anerkannt, kann das dazu führen, dass wir sie langfristig in unserer Ausdrucksweise auslassen werden, da sie keine (technologische) Resonanz erfährt.  


Barbara, was verrät unser Ausdruck über uns, wozu ist er wichtig?