Podle akademiotoelektronik, 15/02/2023
2021 - 2026: velký epos hudební AI - L'ADN
Od vzhledu K7 v roce 1963 poslechová média doslova zmutovala pod popudem digitálních technologií. Abychom dnes objevili nové zvuky a poslouchali je, kdekoli chceme, většina z nás se řídí doporučeními streamovacích platforem, které běží na umělé inteligenci. Ale jak nám řekli Frédéric Amadu a Nicolas Pingnelain z Ircam Amplify, toto je jen začátek.
Inteligence prostředí, geografická kontinuita, prostorová restituce: jak umělá inteligence změní životy milovníků hudby?
Jak stream napadl svět
Mezi metrem, prací a spánkem nastala rutina: hudební stream. Ve Francii se v roce 2016 specializované platformy prosadily na trhu a staly se hlavním zdrojem příjmů pro hudební průmysl. Kapilaritou spotřeba streamování od té doby neustále roste, v roce 2019 explodovala a dosáhla rekordů s krizí Covid. Podle studie Kantar 25 % Francouzů konzumovalo od prvního uvěznění více streamované hudby a 65 % z nich je rozhodnuto tento dobrý zvyk neztratit.
Princip doporučení hudby, který teď všichni milujeme na streamovacích službách, funguje díky umělé inteligenci a přesněji Machine Learning, technologii, která se učí náš vkus navrhovat řadu seznamů skladeb. Tyto křížící se styly, žánry, atmosféry a novinky, které jsme během týdne konzumovali. Umělá inteligence, která určuje tyto kompilace, někdy také nabízí tematické směsi, které mají doprovázet náladu každodenních činností (sportovní setkání, pracovní setkání) nebo odrážet pociťované emoce.
Ale pro Frédérica Amadu, CTO Ircam Amplify, jsou tyto tematické návrhy příliš automatické, lineární a ve skutečnosti nedodržují své sliby. „Na hlavních hudebních platformách jsou nabízené seznamy skladeb různorodé a statické. Problém je, že jsou společné pro všechny. Nemohou odpovídat tomu, co každý očekává jako atmosféru pro tu a takovou činnost nebo jako reakci na emoci,“ vysvětluje nám. Navíc dodává Nicolas Pingnelain, obchodní manažer Ircam Amplify: „Dnes máme nepřeberné množství výrobních toků, a proto máme mnoho možností. Přesto jsme nikdy tolik neposlouchali stejné věci.
Uzavíráme se zákeřně do bubliny hudebního filtru, jak teoretizoval Eli Pariser? Spolupachatelé, algoritmy, se kterými se denně setkáváme, se podílejí na inteligenci s našimi kognitivními předsudky, na této intelektuální kompartmentalizaci, která posiluje náš vkus a odvádí nás od neočekávané. Na Spotify jsou personalizované seznamy skladeb zodpovědné za polovinu měsíčních poslechů více než 8 000 umělců. Podle výzkumníků Jean-Samuela Beuscarta, Samuela Coavouxe a Sisley Maillarda ve své publikaci Music Recommendation Algorithms and Listener Autonomy se „práce hodnotící účinky algoritmických doporučení zaměřuje především na jejich vliv na rozmanitost obsahu: protože je založena na konkurenci konzumu, kolaborativní filtrování může podpořit omezení v portfoliu velmi podobných produktů. I když je to považováno za způsob, jak podpořit objevování málo známých umělců, může také paradoxně posílit místo hvězd.
Aby nám pomohl zbavit se těchto (špatných) návyků a podpořit konzumaci nové hudby, Ircam Amplify, dceřiná společnost Ircam (Institut pro výzkum a koordinaci akustiky/hudby), spustila v březnu Metasound. Toto řešení si klade za cíl vytvořit nová propojení mezi tituly, žánry a různými světy, ale také nabídnout inteligentní a škálovatelné seznamy skladeb (přizpůsobitelné a kontextové). Tituly a katalogy procházející pod radarem široké veřejnosti tak mohou být oceněny. To je povzbudivá zpráva pro mladé umělce, jejich distributory a uživatele toužící po nových objevech!
2023: deskriptor v reálném čase pro chytré seznamy skladeb
Rychle vpřed na soundtrack budoucnosti. Do dvou let bude deskriptorů v reálném čase celá řada. Ale co to je?Tato technologie analyzuje živé audio vysílání a zvukové prostředí poslechového místa. Například vezme v úvahu intonaci, intenzitu, rytmus, frekvence a zvuky v pozadí, aby přizpůsobil svou hlasitost a zdokonalil hudební návrhy.
Deskriptor pro rodinná setkání kuplířů, večeře s přáteli nebo deštivé neděle? To je ten nápad! Pokud je základním kamenem těchto vzácných okamžiků hudba, nemusí být nutně stejná v závislosti na náladě. Kolektivní nebo introspektivní poslech má obsáhnout okamžik a provázet jej od začátku do konce. Aby se zabránilo čtení podle AI a lineárních seznamů skladeb, může jej deskriptor přizpůsobit energii místnosti, okolnímu zvuku, intenzitě, a tak se samoregulovat a splynout s pociťovanou atmosférou při hledání dokonalého atmosféra: správný obsah, ve správný čas, pro dané použití. Protože „co dnes nefunguje, je předstírat, že máme seznam skladeb, na kterém se dá pracovat, být klidný a soustředěný, bez ohledu na vkus a atmosféru, do které je uživatel ponořen“, zdůrazňuje Frédéric Amadu, „a pak, dodává Nicolas Pingnelain, při večeřích někdy potřebujeme, aby se hudba přizpůsobila intonacím, energii debat nebo únavě hostů tím, že nabídneme adekvátní zvukové prostředí, zachytíme, nebo nebudeme dávat pozor na známé názvy nebo nové písně.“ .
Dnes může být objevování nových skladeb obtížné, zejména kvůli této bublině filtrů, které máme problém se zbavit. Ale proč ? Umělé inteligence jsou založeny na struktuře nebo stylu skladby a definují přísné standardy pro kvalifikaci našeho hudebního vkusu. Příliš předformátované poslechové sugesce, které se mají snoubit s naším vkusem a posouvat nás k eklekticismu, zůstávají „heterogenní a statické“. "Dnes a za dva roky bude nutné vytvořit homogenní "identifikační karty" mezi díly, tedy identifikovat a automaticky extrahovat základní data jakékoli hudby a proč ne, ke konkrétnímu použití, zvýšit jejich obsah ručními redakčními zásahy . Nejen propojit je žánrem, ale i emocí, intenzitou, atmosférou... Některé modelky dnes navrhují své playlisty automatizovaně. Ostatní budou muset přizpůsobit redakční přístup a údaje o použití, aby se co nejvíce přiblížily přáním uživatele v okamžiku T, a byly tak spravedlivější,“ vysvětluje Nicolas Pingnelain a dodává: „ jinak bude hrozit neustálé vrátit se k písním, které nás utěšují. Musíte posouvat hranice a umožnit skladbám zapadnout do nových personalizovaných poslechových kontextů (žánry, emoce, nálady atd.). Kvalifikací hudebních katalogů milionů titulů pomocí strojového učení tak umožníme více objevů pro přizpůsobenější a bohatší hudební cesty“.
Adaptabilita je proto klíčovým slovem pro tento AI dirigent a jeho stále sofistikovanější algoritmus, který bude generovat inteligentní seznamy skladeb podle lidí a jejich prostředí.
Co kdyby existovala jiná nastavení, která by zážitek ještě více pohltila?
2026: od geografické kontinuity k prostorové restituci
Za pět let budou technologie doprovázet uživatele z bodu A do bodu B, přičemž se přizpůsobí jeho prostředí, jeho vybavení a jeho geografické poloze (nebo dokonce jeho emocionálnímu Stát!).
Do nekonečna a ještě dál? Pro Frédérica Amadu je budoucnost obrácena směrem k doprovodné AI, kde kontinuita bude zásadním parametrem: „za pět let nás bude hudba provázet všude. Spustí se přes vysílací stanici doma, skladba se automaticky obnoví v autě, poté ve sluchátkách cestou do práce, aby pokračovala sama na počítači“. A měnit podle míst? Velké "ano!" pro Nicolase Pingnelaina: „Je možné si představit, že hudba se změní, jakmile se přiblížíte k práci, jakmile jste úplně vzhůru, abyste dodali motivaci! ". Duo však vyvolává problém: tato kontinuita by fungovala pro introspektivní poslech hudby. Bude se tedy muset díky zvukovým deskriptorům v reálném čase přizpůsobit, pokud uživatele v autě doprovázejí přátelé nebo děti. Dva pokoje, dvě atmosféry, ale tisíc možností.
Na technické úrovni přichází do hry restituce. Výbava se liší, od domu přes helmu až po auto. Umělá inteligence bude v těchto různých prostorech schopna reprodukovat odpovídající zvuk inteligenčně a hraním na prostorový nebo binaurální zvuk (zejména přes audio sluchátka) – to vše „díky mikrofonu a zachycení přes vybavení,“ vysvětluje Frédéric Amadu.
Pro Nicolase Pingnelaina budou díky tomuto prostorovému uspořádání a deskriptorům v reálném čase budoucností hybridní zážitky poháněné zdravotní krizí a technologickým pokrokem. "Za pár let bude možné díky této prostorizaci a těmto deskriptorům zažít koncert doma, například integrovat vaše povzbuzování se zvukem fanoušků živě na stadionu během fotbalového zápasu." Osobnější a intimnější , náš vztah k hudbě, k jejímu poslechu, rychle promění umělá inteligence. Společník na cesty pro milovníky hudby, který se bude moci přizpůsobit jak jejich soukromému prostředí, tak jejich technologickému vybavení.
Související články