Den nye kunstige intelligensen til bilstereo kan forbedres mer enn bare melodier

Hollywood har evig fremstilt kunstig intelligens (AI) som operasjonslaget av dystopiske roboter som erstatter intetanende mennesker og skaper den eskalerende, sentrale konflikten. I beste fall kan du forestille deg en ung Hailey Joel Osment som spiller David, den selvbevisste, kunstige ungen i Spielbergs polar-caps-tint-og-oversvømte-kystbyer-verden (høres det kjent ut?) AI: Kunstig intelligens som (spoiler alert) bare dreper seg selv. Eller kanskje du husker Robin Williams stemme som Bicentennial Man som, nok en gang, er en selvbevisst robot som prøver å trives som (nok en gang på spoileralarm), ender opp med å bli hans eneste offer. Og selvfølgelig er det en nesten klisjéreferanse til Terminator og dens post-apokalyptiske verden med maskiner som forsøker å ødelegge mennesker og vel, (ikke-så-spoileralarm) mange ofre over et par tiår. I ingen av disse scenariene eksisterer imidlertid mennesker samtidig med et forbedret liv, enn si forbedret underholdning og sikkerhet.

Det er imidlertid den nye virkeligheten. Algoritmer for kunstig intelligens kan inkluderes i lyddesign og kontinuerlig forbedres via trådløse oppdateringer for å forbedre kjøreopplevelsen. Og i direkte motsetning til disse Hollywood-eksemplene, kan slik AI faktisk forbedre menneskets sannsynlighet for å overleve.

Bare for nytelse

Inntil nylig har alt brukergrensesnitt (UI) inkludert lydutvikling krevd kompleks programmering av ekspertkodere i løpet av de standard trettiseks (36) månedene av et kjøretøyprogram. Platemetall-styling og elektroniske bokser er spesifisert, hentet og utviklet parallelt bare for å kalibrere individuelle elementer sent i utviklingen. Merkelyder. Akustiske signaturer. Alle separate initiativ innenfor samme, anemiske systemdesign som har koster produsentene milliarder.

Men kunstig intelligens har tillatt en langt mer fleksibel og effektiv måte å nærme seg lydopplevelsesdesign på. "Det vi ser er konvergensen av trender," sier Josh Morris, DSP Concepts maskinlæringssjef. "Lyd er i ferd med å bli en mer dominerende funksjon innen bilindustrien, men samtidig ser du at moderne prosessorer blir sterkere med mer minne og muligheter."

Og, ved å bruke en systemfokusert utviklingsplattform, gir kunstig intelligens og disse sterkere prosessorene sjåfører og passasjerer et nytt nivå av adaptiv respons i sanntid. . "I stedet for det historiske behovet for å skrive bunker med kode for alle tenkelige scenarioer, veileder AI systemets respons basert på en innlært bevissthet om miljøforhold og hendelser, sier Steve Ernst, DSP Concepts sjef for forretningsutvikling for biler.

Den helt åpenbare måten å bruke et slikt læringssystem på er å "avstøye" kjøretøyet slik at førsteklasses lyd kan skreddersys og forbedres til tross for å ha byttet til vinterdekk eller andre slike endringer i omgivelsene. Men LG Electronics har utviklet algoritmer som kjører i DSP Concepts Audio Weaver plattform for å tillate stemmeforbedringer av filmens dialog under bakseteunderholdning for å fremheve den kontra eksplosjoner i filmen, og dermed la passasjeren bedre høre det kritiske innholdet

Et annet ikke-opplagt aspekt ville være hvordan merkede lydlyder orkestreres midt i andre lyder. Krever dette spesifikke kjøretøyet den eskalerende oppstartssekvensen for å spille av mens andre lyder som radio og klokkespill blir automatisk skrudd ned? Hver opplevelse kan justeres.

Mer sannsynlig å trives

Når verden raser inn i både elektriske kjøretøy og autonom kjøring, vil frekvensen og behovene til hørbare varsler sannsynligvis endre seg drastisk. For eksempel kan en autonom taxis sikkerhetsingeniør ikke anta at passasjerene er i nærheten av et visuelt display når det kreves et varsel i tide. Og hvor hørbart er det varselet for nesten 25 millioner amerikanere med funksjonshemminger for hvem bør autonome kjøretøy åpne nye mobilitetsmuligheter? "Lyd er nå ikke bare for å lytte til favorittsangen din," sier Ernst. "Med autonom kjøring er det alle slags varsler som kreves for å holde sjåføren engasjert eller for å varsle den ikke-engasjerte sjåføren om ting som skjer rundt dem."

"Og det som gjør det mer utfordrende," injiserer Adam Levenson, markedssjef i DSP Concepts, "er alle tingene som håndteres samtidig i bilen: telefoni, oppslukende eller romlig lyd, motorstøy, veistøy, akustiske kjøretøyvarslingssystemer, stemmesystemer osv. Vi liker å si at det mest komplekse lydproduktet er bilen.»

Tenk deg for eksempel scenariet der en sjåfør har aktivert autonom kjøremodus på motorveien, har skrudd opp tonene og er behagelig uvitende om et utrykningskjøretøy som nærmer seg. Ved hvilken nøyaktighet (og avstand) av sirenedeteksjon ved hjelp av kjøretøyets mikrofon(er) varsler bilen sin kvasi-distraherte sjåfør? Hvordan må denne varslingen presenteres for å overvinne omgivelsesstøy, gi tilstrekkelig oppmerksomhet, men ikke unødvendig skremme sjåføren? Alt dette kan tunes via forhåndsutviklede modeller, forhåndstrening med forskjellige sirener og påfølgende skybasert tuning. "Det er her den generelle orkestreringen blir veldig viktig," forklarer Morris. «Vi kan ta utdataene fra [AIs deteksjon]-modellen og dirigere den til forskjellige steder i bilen. Kanskje du skrur ned lyden, utløser et lydsignal og blinker noe på dashbordet for at sjåføren skal være oppmerksom.»

Det samme gjelder for eksterne varsler. For eksempel kan stille elektriske kjøretøy ha innstilt alarmer for fotgjengere. Og slik kan nye kalibreringer opprettes offline og lastes ned til kjøretøy som programvareoppdateringer basert på den aktiverte innovasjonen.

Innovasjon overalt. Og kunstig intelligens nærer den utopiske opplevelsen i stedet for å skape Hollywoods dystopiske verden.

Forfatterens spådom

Her er spådommen min for uken (og det er bare tirsdag, folkens): den neste lydutviklingen skal inkludere en full, øyeblikkelig tilbakemeldingssløyfe inkludert den subtile sanntidsbrukernes glede. Ja, mye av den nåværende designen forbedrer sannsynligvis opplevelsen, men en pågående kalibrering av User-Centered Design (UCD) kan i tillegg forbedres basert på passasjerenes uttrykk, kroppsspråk og kommentarer, og dermed tilpasse tilfredsheten individuelt i sanntid. Alle aktivatorene er der: kamera, AI, prosessorer og en adaptiv plattform.

Ja, vi har hørt om tidligere adaptiv stemningsbelysning og fjerndeteksjon av kjedsomhet, stress osv. for å forbedre sikkerheten, men ingenting som forbedrer den kombinerte opplevelsen basert på sanntidslæringsalgoritmer for alle brukerpekede sensorer.

Kanskje jeg ekstrapolerer for mye. Men akkurat som Robin Williams karakter, har jeg over to århundrer … så kanskje jeg også bare er følsom for hva mennesker kanskje vil ha.

Kilde: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/