Speaking Orchestra

„Jelenünk technikai zeneszerzését a mesterséges intelligencia határozza meg” – Dobri Dániellel Balogh Máté beszélgetett.
Balogh Máté írásai a Jelenkor folyóiratban>
Az Alba Regia Szimfonikus Zenekar március 21-én Székesfehérváron, illetve 24-én a Zeneakadémián mutatja be Dobri Dániel Speaking Orchestra című, a mesterséges intelligencia segítségével komponált új művét. A szerzővel Balogh Máté beszélgetett a digitális technikai apparátussal való komponálás jelenéről, illetve a mű megalkotásának körülményeiről.
*
Balogh Máté: Akik szorosan követik a magyar kortárs zenei nyilvánosságot, már talán értesülhettek róla, hogy nemrég Párizsban, az IRCAM-ban (Institut de recherche et coordination acoustique et musique) részt vettél egy nemzetközi szakmai programon, amely többek között a mesterséges intelligencia zenei alkotó- és előadó-művészetben való alkalmazhatóságára fókuszált.
Dobri Dániel: Az IRCAM talán legfontosabb állandó fóruma a ManiFeste elnevezésű fesztivál, amin, ha jól emlékszem, egyszer neked is ment darabod. A fesztiválhoz nemcsak koncertek, hanem egy kéthetes intenzív és összetett fesztiválakadémia is tartozik, ezen vettem részt. A workshopokon a fesztiválon fellépő zeneszerzők tartottak előadásokat az elhangzó műveikről, illetve azok technikai apparátusairól. Az erről szóló diskurzusokat idén Chaya Czernowin izraeli–amerikai zeneszerző koordinálta.
Az IRCAM annak idején az avantgárd zene Mekkájának számított. Mennyire tekinthető még az ott tapasztalt közeg valamiféle iskolának?
Úgy láttam, kétféle irányzat van erősen jelen: a spektralizmus és a szerializmus. A spektralista művek egy-egy zenei hang nem temperált részhangjaira épülnek, minden összetevőjüket a természetből és a világból fakadó alapvető fizikai adottság: a felhangrendszer határozza meg. Az egyes zenei hangokat sokszor számítógéppel elemzik, mielőtt meghatároznák a darabok hangkészletét, hangszíneit. Ennek ellenére úgy tapasztaltam, ezek a művek sokszor nagyon intuitív módon megkomponáltak, és gyakran termékenyítődnek meg popkulturális elemekkel, főleg az elektronikus könnyűzenei irányzatokból beemelve. A szerialista művek ezzel szemben matematikai struktúrákon, előre meghatározott zenei sorokon, mértani folyamatokon alapulnak, és mára gyakorlatilag kizárólag számítógépen programozva, high-tech apparátussal hozzák őket létre. A fesztiválon elhangzó művek komponistái tehát mindenképpen nagyon felkészültek voltak az elektronikus zene terén. Az előadások legnagyobb része emiatt főleg technológiai témákról, szoftverekről és hardverekről, számítógépes eljárásokról, illetve ezek komponálási folyamathoz fűződő viszonyáról szóltak.
Volt alkalmad megismerni olyan technikai vívmányt, amit a saját zeneszerzői praxisodban is alkalmazhatónak találtál?
Több dolgot is nagyon inspirálónak vagy legalábbis érdekesnek találtam, de a Somax 2 elnevezésű, mesterséges intelligencia alapú plug-in teljesen levett a lábamról. Távolról indítva: az IRCAM az 1970-es években indult, és azóta minden évtizednek így-úgy megvolt a maga technológiai sajátossága, ami meghatározta a zeneszerzés irányait. A ’80-as évek főleg a hangszínről és akusztikus hangszerek elektronikus utánzásáról szólt. A ’90-es években az élő elektronika, a 2000-es években pedig – az iPhone, majd a Nintendo Wii megjelenésével – a gesztus- és mozgásalapú zene került a fókuszba. A 2010-es évek kognitív forradalma a machine learning és mindenféle más data-alapú komponálás időszakát hozta el. Mindenképpen ki lehet jelenteni, hogy szűkebb értelemben vett jelenünk technikai zeneszerzését a mesterséges intelligencia határozza meg. Ennek a folyamatnak az egyik legfontosabb mérföldköve a Somax 2 nevű szoftver, amit zenei improvizációra fejlesztettek ki. A program mint előadóművész tevékenykedik, és képes egy élő (ember) zenésszel érzékenyen kommunikálva közösen zenélni. Ha egy hangszeres vagy énekes beleénekel egy mikrofonba, akkor a program azt felfogva – egy előre megépített corpus alapján – vele real time közösen zenél.
A megépített corpus tehát egy stílust definiál.
Valami ilyesmiről van szó, igen. A programnak van egy Python programnyelv alapú szerverrésze, amit tekinthetünk az agyának. Ezt előre megépítik. A corpust ezzel szemben a zeneszerző hozza létre, az alkotói folyamat során, az improvizáció előtt. A zeneszerző audio- vagy MIDI-formátumban zenéket tölt bele a programba, ezekben az adatokban fellelhető zenei struktúrák és mintázatok határozzák meg a Somax későbbi eszköztárát, tehát az improvizáció alapját. Ezt a rendszert rengeteg paraméter szerint lehet utána finomhangolni, létrehozva a program zenei személyiségét. A Somax a közös zenélés során eszerint hoz majd döntéseket, hogy kapcsolódjon, vagy ellenpontozza az élő zenész játékát. Ha erre van kompozíciós igény, a program a közös zenélés alatt visszamenőleg is vizsgálja saját magát, illetve az egész zenei folyamatot, valamiféle nagyobb összefüggésre is figyelve, tehát végső soron kompozíciót hozva létre.
Tehát a program „előítélet-mentes” olyan értelemben, hogy egy 1920-as évekbeli chicagói jazz-zenésszel ugyanolyan hatékonysággal tudna zenélni a színpadon, mint John Cage-dzsel, Keith Jarrett-tel, Domenico Scarlattival vagy a dodekafón jazzt játszó Ávéd Jánossal.
Nem hogy Keith Jarrett-tel, hanem az 1975-ös kölni koncerten fellépő Keith Jarrett-tel.
A kérdésem ezek után alighanem kézenfekvő: milyen módon tud kapcsolódni a Somax program a te művészetedhez?
Jelenleg egy olyan szimfonikus művön dolgozom, amely József Attila Nagyon fáj című versének Latinovits Zoltán-féle ikonikus előadására épül. Latinovits nagyon komplex deklamációját a Somax 2 szoftver segítségével nagyítom fel. A program négyféle paraméter szerint elemzi az előadást. Térképet készít Latinovits szövegmondásának időkezeléséről (tagolás, ritmus), hangszínének változásairól (felhangsűrűség), hangmagasságairól (a beszédhang dallama) és a szövegmondás dinamikájáról. Ezek alapján egyfajta csontvázat hoz létre, ami a szimfonikus mű makrostruktúráját határozza meg. A szimfonikus hangszerek anyagának corpusát egyfelől ez az elemzés, másfelől egy korábbi zongoraművem alkotja. A Somax ebből „improvizált” többféle változatot, amiből kiválasztottam néhányat, és ezeket felhangszerelem szimfonikus zenekarra. Máshogy megfogalmazva: a Latinovits-deklamáció átkódolódott a szimfonikus anyagba. A szöveg közvetlenül nem hallható a műben, csak ilyen áttételes módon. Ez a fajta komponálási metódus nagyon sok technikai tudást igényel, ebben Tóth Barnabás elektronikus zeneszerző, realizátor van segítségemre.
A Somax által improvizált anyagokat elfogadtad késznek, vagy hozzányúltál utána?
A fő paramétereket igyekeztem megtartani, de ha a felrakás túl mechanikusnak, gépszerűnek hatott, ott megváltoztattam néhány dolgot a hangszerelés során. A Somax alapvetően improvizál, és nem notál. A leirataim közben tehát akarva-akaratlanul hoztam szubjektív döntéseket. Fontosnak tartottam továbbá, hogy egy, az egésztől teljesen független, ha úgy tetszik, „emberi” réteg is jelen legyen a műben, ehhez megkomponáltam egy, a művön végig vonuló, intuitíven ható jazzdob-szólót, amelynek előadója a koncerten Serei Dániel jazzütőhangszeres művész lesz. Azt hiszem, ilyesmi gesztusok mindenképpen fontosak ahhoz, hogy a gép által generált zene igazán élvezhető legyen.