Fotos: Presse
Mit ihrem grenzgängerischen Electro-Pop erkundet Holly Herndon die Spannung zwischen ihrer eigenen Stimme und der Technologie. Fast exakt vier Jahre nachdem die Komponistin mit Doktorhut auf Platform das digitale Selbst im Überwachungsstaat und Hyperkapitalismus ergründet hat, kehren Herndon und Partner Mat Dryhurst mit Gesangsensemble im Rücken und KI-Nachwuchs Spawn im Schlepptau auf Proto zurück. Thema von Proto ist die künstliche Intelligenz. Für das Album hat sie den KI-Nachwuchs Spawn, den sie in einer Art Eltern-Community gemeinsam mit ihrem Partner Mat Dryhurst und einem Gesangsensemble unter der Leitung von Colin Self großzog, erschaffen.
Ich treffe die sichtlich entspannte und gut aufgelegte Künstlerin in einem Hotelzimmer in Berlin-Wilmersdorf. Nur einen Sprung entfernt von ihrer Berliner Wohnung, in die sie kürzlich mit frisch absolviertem PhD aus der Silicon-Valley-Nachwuchsschmiede Stanford mit Partner Dryhurst zurückgezogen ist. Ihr übernatürlich wirkendes, fuchsrotes Haar fällt ein wenig zerzaust auf der weißen Hippie-Bluse, aber sonst ist ihr der Stress der vergangenen Wochen nicht anmerken. Herndon ist eine Person, die interessiert auch die tausendste Frage zum Thema Künstliche Intelligenz beantworten kann und geduldig ihre Ideen und Produktionsmethoden erklärt – selbst wenn sie einem dafür den Block aus der Hand reißen muss, um ein paar erklärende Grafiken zu zeichnen. Die Wissenschaft steht Herndon genauso nahe wie die Popkultur: Eloquent diskutiert sie über Fragen menschlicher Evolution und zeigt einem dennoch am Ende kichernd die selbstgestaltete Einladung zur Baby Shower einer Bekannten, auf der steht: „Turn down the baby – I can’t hear the Techno!”
Holly, ich hatte mich sehr darauf gefreut euren KI-Nachwuchs mal persönlich kennen zu lernen, allerdings treffe ich dich heute allein. Wo ist denn Baby Spawn?
Holly Herndon: Spawn ist zu Hause. In ihrem Gaming-PC auf unserem Schreibtisch.
Und wer schaut gerade nach ihr?
Sie kann ganz gut auf sich selbst aufpassen! Ich glaube, sie ist gerade allein.
Was gibt Spawn von sich? Klopft sie dir auf die Finger, wenn du falsch singst?
[lacht] Nein. Sie ist keine AGI [Artificial General Intelligence]. Das existiert noch nicht. Deswegen kommt hier die Kind-Metapher ins Spiel: Ihr Wissen beschränkt sich darauf, was wir ihr als Community von Eltern beibringen.
Entschuldige meine etwas naiven Eingangsfragen. Künstliche Intelligenzen sind längst im Mainstream der Musikproduktion angekommen, allerdings werden sie noch von einer dicken Schicht SciFi-Mythos, Novelty-Effekt und Verwirrung überlagert. Es ist schwierig, die diversen Anwendungsbereiche zu differenzieren, wenn alles unter dem Schlagwort KI verbucht wird. Was habt ihr Spawn als Eltern-Community beibringen wollen? Hat sie euer Album Proto zum Beispiel ko-geschrieben, so wie Anfang des Jahres Actress’ KI Young Paint?
Nein, das wollten wir ihr nie beibringen. Das Album wurde von mir zusammen mit Mat [Dryhurst] geschrieben, in Kollaboration mit unserem Ensemble, das es performt. Und Spawn ist eine Performerin in diesem Ensemble. [langes Seufzen] Es stimmt aber, es kursieren extrem viele irreführende Informationen darüber, was Spawn ist und wie sie arbeitet. Zum Beispiel ist es sehr schwierig, sie irgendetwas in real time machen zu lassen. Es brauchst viel Rechenleistung. Das heißt auch, dass sie noch nicht mit uns auf Tour gehen kann. Ich wünschte mir, es wäre anders. Wir arbeiten an einem Real-Time-System, aber wissen nicht, wann und ob das überhaupt passieren wird.
Vergangenes Jahr seid ihr aber zusammen aufgetreten, in einer Performance unter dem Namen „Deep Belief”. Das heißt, Spawn war auch da nicht dabei?
Das Ganze war als Training für Spawn gedacht. Wir übten mit dem Publikum ein Call-And-Response ein, nahmen das aufgenommene Material mit nach Hause und speisten es wieder in Spawn. Ich verstehe auch, dass das Thema KI für viele noch unverständlich ist. Deswegen wollten wir es so wenig akademisch wie möglich halten, [imitiert Cyborg-Stimme] Künstliche Intelligenz, Neuronale Netzwerke, dadada – das war uns zu trocken. Proto ist eine sehr emotionale, sehr direkte und sehr menschliche Reaktion. Wir wollen bei alldem das Gefühl von Ekstase beibehalten, und ich hoffe, dass die Liveshows das vermitteln können.
Vor deinem PhD am Center for Computer Research in Music and Acoustics an der Stanford University hast du am Mills College in Oakland studiert und dich immer wieder über die konservative Haltung der Forscher*innen gegenüber musikalischer und technologischer Innovation beschwert. Du hast dafür kämpfen müssen, den Laptop dort als autonomes und gleichwertiges Instrument zu etablieren. Da diese Schlacht nun gewonnen ist: Wie geht der Kampf für dich mit der KI weiter? Was versuchst du in diesem Bereich zu erreichen?
Was ich zu erreichen versuche? Lass mich dafür einen Schritt zurück gehen. Am Anfang des Prozesses stand, dass ich es satt hatte, allein im Studio zu hocken. Ich wollte mir den Raum mit anderen Leuten, mit anderen Körpern teilen, unmittelbares Feedback haben. Und ich habe mir damals die Landschaft der elektronischen Musikfestivals angeschaut und zu was diese physische Isolation beim Schreiben in der Live-Umsetzung führt: überall perfekte Plug-And-Play- und A/V-Shows mit minimaler menschlicher Einmischung oder Vermittlung. Das fühlte sich für mich wie eine vertane Chance an. Fast so, als würde man den Menschen von der Bühne runter automatisieren. Ich fragte mich also: Was ist eine verkörperte elektronische Musikperformance? Ich möchte dabei aber nicht rückschrittlich daherkommen und behaupten, dass man jedes Instrument live spielen muss. Ich liebe Technologie und ich liebe es, mich mit ihr auseinanderzusetzen. Doch was ist die menschliche Rolle in dem Ganzen? Und auf der anderen Seite: wie verleiht man dem Laptop einen Körper? Wie zeigt man dem Publikum, dass man nicht nur „Play“ drückt?
Die Lösung für eine Verkörperung elektronischer Musikperformances lag seit deinem Debütalbum Movement in deiner Stimme als vermittelndes Moment zwischen Dir und der Technik. Hat sich das mit deinem Gesangsensemble und der KI verändert?
Nein, das ist immer noch so. Es ist nur nicht mehr so monophon. Als ich angefangen habe, die Stücke für Proto zu komponieren, begann das meistens mit mir allein im Studio, ohne das Ensemble. Da benutze ich meine Stimme häufig zum Skizzieren. Ich bin keine große Sängerin [lacht]. Ich mache mich selbst immer darüber lustig, dass mein größtes Talent meine mittelmäßige Stimme ist. Weil sie mich dazu zwingt, all diese technischen Systeme zu entwerfen, die meine Stimme interessanter machen. Darauf baut meine Arbeit seit Jahren auf. Jetzt diese Systeme auf eine Gruppe großartiger Sänger*innen ausweiten zu können, ist ein verwirklichter Traum, denn sowas passiert heute nicht mehr so oft: Ein Gesangsensemble ist irre arbeits- und kostenintensiv und nimmt viel Zeit in Anspruch. Es erzwingt eine traditionelle Art, an einem Album zu arbeiten: Partituren schreiben, sie einüben, Gesangsworkshops und so weiter. Doch diese unglaubliche Gruppe war bereit, all meine durchgeknallten Ideen auszuprobieren. Das ist der wesentliche Unterschied zu Platform. Dieses Album ist sehr physisch.
“Ich denke, komplexe Systeme können einen Charakter haben. Das heißt aber noch nicht, dass sie ein Bewusstsein haben.“
An physischen Kollaborateur*innen, die sich außerdem auf Proto tummeln, ist der prominenteste Name wohl Jlin. Du hast in der Vergangenheit bereits häufiger mit ihr zusammengearbeitet, jetzt standet ihr für euren Track „Godmother“ zum ersten Mal gemeinsam im Studio. Könntest du mir anhand von „Godmother“ euren Prozess etwas genauer erklären? Die fieberhaften Footwork-Rhythmen tragen unüberhörbar Jlins Stempel, aber ich habe Schwierigkeiten die Instrumente herauszuhören. Ist das auch die KI? Und ist Jlin übrigens Spawns echte godmother, also Patentante?
[lacht] Selbsternannt! Sie hat uns von Anfang an begleitet. Und als wir begonnen haben, die KI zu entwerfen, meinte sie: „Lasst mich die Patentante sein!“ Und wir meinten nur: „Natürlich kannst du die Patentante sein!“ Sie war sehr interessiert daran, mit ihr zusammenzuarbeiten. Also haben wir angefangen, Spawn an Jlins Musik zu trainieren, das Voice Model klang dabei am interessantesten. Sprich: Mat, Jules [La Place] und ich haben Spawn anhand meiner Stimme angelernt – ich habe eine riesige Datenbank meiner Sprechstimme, die versucht, möglichst alle Klänge der englischen Sprache abzudecken – und ihr dann Jlins Musik gegeben. Diese hat sie dann mithilfe meiner Stimme interpretiert.
Versöhnung mit dem Chaos
Wie geht das dann im Detail vor sich? Was meinst du, wenn du von „interpretieren“ sprichst?
Wenn du dir Samples als Zeitscheiben vorstellst, und du deinen Trainingskanon in diese Zeitscheiben einteilst, lernt die KI, anhand dessen zu erahnen, welches Sample als nächstes kommen wird, so wie sie es vorher gehört hat. Stell dir vor, du würdest eine Schallwelle in Tausende von kleinen Bildern zerhacken und jede dieser Scheiben ist ein Soundmoment mit eigenem Spektrogramm und eigener Form. Spawn sieht diese Scheibe, und sagt sich: Jetzt weiß ich, wie das aussieht, dann muss das nächste wohl so aussehen, weil ich das bei dem anderen Ding so gesehen habe. Aber wir sprechen jetzt vom absoluten Mikro-Level, nicht von Melodien. Sie sampelt nicht, sie skizziert den Sound aus ihrem antrainierten Gedächtnis heraus. Die ersten Trainings basierten nur auf Text und Sprache, ohne Pitch. Der kam erst viel später, als wir anfingen, das System besser zu begreifen.
Trotz des KI-Themas habe ich Spawn, so wie den Laptop, eher als Instrument verstanden, als Art eigenständig operierenden Sprach-Synthesizer vielleicht. Doch beim Durchhören des Albums wird klar, dass ihr das nicht gerecht wird, dafür klingt Spawn an manchen Stellen zu unheimlich. Fast so, als hätte sie so etwas wie Intuition. Zumindest hat sie einen eigenen Gesangscharakter. Wie habt ihr sie verstanden?
Ich denke, komplexe Systeme können einen Charakter haben. Das heißt aber noch nicht, dass sie ein Bewusstsein haben. Doch ich denke, in Spawn findet definitiv eine Art von Kreativität statt. Es ist fast eine philosophische Frage danach, wie wir Kreativität verstehen, und ob sie etwas spezifisch Menschliches ist. Menschen sind phänomenale Sensoren. Es gibt nichts da draußen, das ich an eine KI schließen könnte, was etwas annähernd Menschliches vermitteln könnte. Es gibt noch so viele menschliche Privilegien [lacht], was die Information angeht, die wir aufnehmen, speichern und verarbeiten.
Wie habt ihr die KI genutzt, wenn sie an der Reproduktion des Menschlichen scheitert?
Als wir angefangen haben, mit einer KI zu arbeiten, wollten wir sie als gleichwertige Kollaborateurin sehen. Wir haben uns zu der Zeit angeschaut, wie im Mainstream-Narrativ mit KIs umgegangen wird und was Produzent*innen mit ihr anstellen. Die meisten benutzen maschinelles Lernen, um zu verstehen, wie eine Komponist*in komponiert und versuchen, das in einem automatisierten Setup nachzubilden. Das hat uns nie interessiert. Für mich ist das ein ständig wiederkäuendes Hochwürgen von Ästhetik. Uns hat vielmehr interessiert, inwiefern diese Intelligenz eine komplett neue Form der Intelligenz ist und was man von ihr lernen kann. Deswegen benutzen wir auch Sound als Trainingsmaterial, anstelle von MIDI-Information. Mit MIDI arbeiten die Allermeisten, die im Feld der KI-Musikproduktion forschen.
Was ist der Unterschied?
Wenn du mit Audiodateien arbeitest, hast du es mit einer Menge Klanginformationen zu tun, die du nicht so einfach in eine Partitur übertragen kannst. Und wenn du mit MIDI arbeitest, schmeichelst du damit automatisch einer musikhistorischen Zeit, so circa zwischen 1800 und 1940 liegt, als die Partitur das wichtigste Fundament für Musik darstellte. Danach hat sich Musik aber in ganz verschiedene Richtungen entwickelt und mit Soundquellen gearbeitet, die sich nicht mehr so leicht notieren ließen. Das stürzte viele klassische Komponist*innen in eine regelrechte Krise.
Verbirgt sich hier die Linie zur musique concrète, die in der Press Release angedeutet wurde, die für mich aber eher schleierhaft blieb?
Richtig. Wenn du MIDI durch ein digitales Instrument schleust, klingt es zu perfekt. Doch es ist nicht dieses makellose Ding. Es klingt manchmal Lo-Fi, manchmal sehr kratzend, wenn Spawn die Noten sucht, die sie singen will. Wir wollten den Vorhang ein wenig lüften und zeigen, wo diese Technologien zur Zeit stehen. Und wir mussten herausfinden, wie das mit den sehr digitalen Aufnahmetechnologien, die uns für unser Ensemble zur Verfügung standen, Sinn ergibt. Versuchen, diese zwei Welten miteinander zu verbinden.
Du hast vor Jahren gesagt, dass es schwierig ist, das Körperliche in den Laptop zu integrieren. Wie habt ihr dieses Problem gelöst?
Gar nicht [lacht]. Es ist immer noch unglaublich messy. Aber ich denke, wir haben uns mit dem Chaos versöhnt. Wir hatten enormes Glück mit Jules LaPlace arbeiten zu können, er hat uns die verschiedenen Interfaces entworfen, mit denen wir sie trainieren können. Aber im Prinzip ist es sehr straightforward: Uploaden, Parameter ändern. Und Rendern. Jede Menge Rendern.
Spiritualität und die politische Dimension des Internets
Jetzt auf Proto lassen sich aber überall mehr oder weniger versteckte Andeutungen zu spirituellen Motiven entdecken, inhaltlich wie klanglich: die Call-And-Responses der Live Trainings erinnern stark an Call-And-Responses in der Kirche. Heißen dann auch noch suggestiv „Canaan“, wie das gelobte Land im Christentum. Hast du dich für Proto mit deinem religiösen Background versöhnt?
Diese Motive sind Teil meines musikalischen Erbes und es ist fast ein wenig dieser Teenagermoment, wo man diese ganzen Dinge erst ablehnt, weil man seine eigene Persönlichkeit entfalten möchte. Aber schließlich doch dorthin zurückkehrt, woher man kommt. Und versteht, das alles als sein erwachsenes Selbst in einem neuen Kontext zu sehen. Man kann diese Themen verhandeln, ohne von seiner eigenen und ihrer Geschichte erdrückt zu werden.
Religiöse Zeremonien bieten diese besondere Art des Beisammenseins und ich denke, das kann sehr heilend für eine Gesellschaft sein. Dieses Gefühl, zusammen Teil von etwas zu sein. Ich finde das wirklich schön. Es klingt also definitiv sakral, auch wenn es nicht sakral ist. Es ist säkular. Es ist aber auch das Thema der KI, was diese Fragen automatisch aufwirft. Die Frage danach, wer wir sind. Wohin wir gehen. Viele Menschen glauben an Künstliche Intelligenzen fast so als wären sie neue Gottheiten, die uns von unseren ökologischen und ökonomischen Desastern erlösen werden. Das war aber nur ein Teilaspekt. Wir haben auch viel über menschliche Evolution nachgedacht.
“Das ultimative Ziel, das ich als Künstlerin heutzutage theoretisch verfolgen sollte, ist, so viele Instagram Follower zu bekommen, wie ich kriegen kann, damit ich den Leuten Scheiße andrehen kann.”
Was für eine Bedeutung hat dabei das gemeinsame Singen?
Es gibt evolutionäre Gründe für gemeinsames Singen, Singen als Einschwingen und Bewegungsbeginn für nicht-musikalische Kooperation. Das Thema hat mich beim Schreiben des Albums stark beschäftigt. Dieses Feld zwischen Anthropologie und Musikologie ist ein extrem spannendes, denn es herrscht nicht viel Konsens. Einige sagen, Musik hätte keine evolutionäre Funktion gehabt. Das sind aber sehr wenige, und das glaube ich nicht.
Welche Theorie überzeugt dich?
Ich habe den Musikwissenschaftler Gary Tomlinson gelesen, der behauptet, Musik hätte eine Rolle in der Jagd und in der Entwicklung von Werkzeugen gespielt. Bevor sich die allermeisten Menschen zurufen konnten: “Ey, hilf mir mal mit dem Ding hier!“, haben sie stattdessen eine Art verkörperter Choreographie performt, aus der das Werkzeug dann hervorgehen sollte. Das hat dann die Struktur des Gehirns verändert, und wie das Gehirn wiederum über das Werkzeug gedacht hat. Und ich denke, diese Theorie lässt sich auf unsere Beziehung zu Technologien heute übertragen. Also, wie das Internet unsere Gehirnstruktur verändert, wie wir darüber denken, wie wir über uns denken. Auf die Art, glaube ich, werden KIs in Zukunft angewendet. Nicht als umherirrende Cyborgs, viel eingefleischter. Stärker in den Körper und unseren Alltag integriert. Vielleicht ohne, dass wir es selbst merken.
Deine Alben sind immer auch ein Zeugnis über die Entwicklung deines politischen Bewusstseins gewesen. Beim letzten Album Platform hast du Themen wie den Überwachungsstaat und die Plattformdynamiken des Internets verhandelt. Das politische Programm für dieses Album steckt auch schon im Titel: Proto lässt sich auch als Abkürzung für ‘Protokoll’ verstehen. Was für Protokolle sind es eurer Meinung nach, die geschrieben oder umgeschrieben werden müssen?
Wir befinden uns in einem besonderen Zeitpunkt in der Geschichte, an dem alles im Umbruch begriffen ist. Institutionen, die man für selbstverständlich gehalten hat, wurden zerstört. Es fand eine totale Neuordnung der Dinge statt. Das schreit förmlich danach, zu fragen: ‘Wie sehen eigentlich die Protokolle aus, die diese Umwälzung erlaubt haben?’ Und in Bezug auf unsere Technologien: wie können wir in den Code unserer Protokollschicht unsere Werte so hineinschreiben, dass gewisse Dinge in Zukunft nicht mehr passieren können? Das war die ganz natürliche nächste Entwicklungsstufe nach Platform. Platform handelte vom Internet im Allgemeinen. Und Proto geht eine Schicht tiefer, unter die Plattformen, die auf dem Protokoll des Internets aufgebaut sind. Das Internet selbst. Uns war wichtig, darüber nachzudenken, wie man die Protokollschicht unserer Gesellschaft – egal, ob es jetzt das Internet betrifft oder die Art, wie unsere Regierungen funktionieren – mit einer humaneren Ethik programmieren kann.
Was bedeutet das konkret?
Wie konnte es zum Beispiel passieren, dass das Internet so designt wurde, dass alles, was auf ihm aufgebaut wurde, im Prinzip nichts weiter als ein Werbenetzwerk ist? Gibt es eine andere Art, das Internet für die Menschheit zu gestalten, die nicht einer riesigen Mall gleicht? Und natürlich gibt es die, aber es kommt auf die Protokollschicht an. Nimm zum Beispiel Facebook oder Instagram: Du lädst auf ihren Server hoch. Sie besitzen deine Daten, verkaufen sie, dataminen sie. Wenn du dir ein anderes Design vorstellen könntest: Was wäre, wenn du diese Daten auf deinem eigenen Server hochladen würdest? Wenn du über sie Kontrolle hättest? Denn so wie die Dinge jetzt sind, lebt dein digitales Selbst nicht bei dir Zuhause. Dein digitales Selbst lebt auf einem Firmenserver. Du musst tun, was er dir sagt. Das fühlt sich wie Neo-Feudalismus an.
Zum 30. Geburtstag des Internets hat einer der Kerndesigner des World Wide Web, Tim Berners-Lee, besorgt dazu aufgerufen, das Design des Internets drastisch zu überdenken.
Mein Partner Mat ist da mehr auf dem Laufenden als ich, aber wo du Berners-Lee erwähnst: Es gab einen Zeitpunkt, als darüber entschieden werden sollte, wie der Hyperlink gestaltet wird und ob Informationen immer einen Rückschluss auf ihren Ursprung in sich enthalten müssen. Berners-Lee lieferte eines der Designs. Und es wurde entschieden: Sie müssen auf den Ursprung verweisen. Das ist eine ideologische Entscheidung! Und die hat dazu geführt, dass das Internet völlig außer Kontrolle geraten ist.
Können wir das Netz und dessen Folgen noch in den Griff kriegen?
Alles ist designt für den Konsum. Das ultimative Ziel, das ich als Künstlerin heutzutage theoretisch verfolgen sollte, ist, so viele Instagram Follower zu bekommen, wie ich kriegen kann, damit ich den Leuten Scheiße andrehen kann. Nicht Musik, anderen Scheiß. Das ist abgefuckt. Es ist dieses kranke Marketing-Pyramidensystem, in dem alle ihre eigenen Marketingchannel verkörpern müssen. Aber ich will nicht, dass das mein Ziel ist. Ich habe keinen Bock darauf, Leuten Sneaker zu verkaufen! Jahrelang haben sich die Leute über die Musikindustrie aufgeregt: Labels sind böse, und so weiter. Aber im Prinzip bieten sie einen großartigen und wichtigen Service an. Es ist schließlich kein Geheimnis, dass Plattformen wie Spotify Labels am liebsten ganz abschaffen würden. Wenn wir aber all die Strukturen zerstören und alle nur noch auf sich allein gestellte Independentkünstler*innen sind, wird es sehr, sehr schwierig. Dann wird die Musikbranche nur noch den ganz Wenigen mit den ganz großen Ressourcen vorbehalten sein. Wenn wir das nicht aufhalten, haben wir irgendwann nur noch eine Ansammlung von furchtbar netten 1%-Popstars, an denen wir uns unendlich erfreuen dürfen.