Datamaskinlyder og bruker – funksjon og påvirkning

Semesteroppgave musikkvitenskap storfag, Oktober 2000

Sammendrag

Artikkelen starter med å gjøre rede for de forskjellige lydene som kommer fra en datamaskin. Hovedfokuset rettes deretter mot de systemvarestyrte audiolydene, videre kalt systemlyder. Tre forskjellige sett med systemlyder fra Microsoft analyseres med tanke på fysiske og musiske aspekter, før forfatteren forsøker å forklare hvorfor fremveksten av slike lyder har vært så stor de siste årene. Deretter presenteres tre fiktive personers forhold til systemlyder. Artikkelen konkluderes med at systemlyder i dagens form forhåpentligvis er en forbigående trend og at produsentene heller bør konsentrere seg om lydapplikasjoner hvor lydkommunikasjon står sentralt.

Innledning

Datamaskiner lager lyder. Bevisst og ubevisst. Det begynte med små enkle pip og i dag får man avspilt de merkeligste melodier. Jeg vet ikke helt hvorfor, men det virker som det er en allmenn oppfatning blant produsentene at maskinener må kunne lydlegge seg. Hvis man ser på film er det enda verre, der lager selv moderne datamaskiner de merkeligste lyder. Kanskje har også fremtidsfilmene vært med på å bygge opp under folks ideer om at maskiner skal blinke, lage rare lyder og snakke.

Jeg har helt siden jeg begynte å interessere meg for datamaskiner undret meg over lydene fra maskinene. Sant nok husker jeg at det også var svært morsomt å ha forskjellige lyder knyttet til hendelser, men man blir fort lei. Med de nyeste versjonene av Windows har lydbildet rundt en datamaskin økt ytterligere. Nå kan man velge mellom forskjellige lydsett som skal representere forskjellige stemninger. Men dette er ikke et eget Windows-fenomen, fordi også Unix, Linux og Mac-verdenen har systemlyder. Etterhvert har vi lært oss å leve med det og de fleste synes vel det er naturlig at datamaskiner lager lyder. Egentlig er det ikke noen bedre grunn til at datamaskinen din piper og spiller søppelkasselyder enn at for eksempel kjøleskapet eller komfyren stort sett holder seg i ro.

Ettersom dette ser ut til å være en generell trend i dataverdenen, har jeg ønsket å se litt nærmere på temaet datamaskinlyder. Først og fremst gjelder det å definere hva vi kan kalle systemlyder, hva som er støy osv. Kilden for lydene samt motivet bak lydhendelsen er også viktig å kartlegge før vi kan gå inn på en analyse av lydene. Jeg har valgt å se på både de fysiske og de musikalske elementene rundt lydene og forsøkt å forstå hvordan de virker på brukeren. Hvilken funksjon har egentlig en froskelyd når man sitter og forsøker å skrive et brev, eller hvorfor skal absolutt en søppelbøtte høres ut som en søppelbøtte?

Jeg er generelt glad i gode lyder og har hatt en viss glede av systemlyder. De siste årene har jeg allikevel valgt å skru dem av fordi jeg i stor grad bruker datamaskinen til å arbeide med brukerstyrte lydhendelser: CD/DVD-avspilling, lydredigering, MIDI-notasjon osv. Når man allerede arbeider med lyd eller musikk på maskinen, kan små systemlyder være svært forvirrende og plagsomme. I arbeidet med denne oppgaven synte jeg det var interessant å undersøke hvordan andre reagerer på disse lydene og om noen i det hele tatt ønsker en slik mulighet. Jeg har derfor snakket med en rekke personer og om deres forhold til datamaskinlyder. Dette har på ingen måte vært ment som en grundig, statistisk analyse, men snarere et lite forsøk på å kartlegge forskjellige brukeres tanker og behov.

Gjennom hele oppgaven henviser jeg til lytteeksempler i lydfigurene. Numereringen henviser til sporene på den medfølgende CD-platen.  Jeg har valgt å ta med en rekke lydeksempler, fordi jeg tror dette er viktig i forståelsen av temaet datamaskinlyder. Ettersom jeg selv arbeider hovedsakelig på en Windows-plattform, vil hovedvekten av eksemplene være fra lydsettene fra Windows, men jeg vil også komme med noen eksempler fra andre plattformer.

Datamaskinlyder – en sammensatt affære

Det totale lydbildet som en datamaskin tilfører et rom, er sammensatt av en rekke forskjellige lydelementer. Alle lydene kan deles inn i grupper avhengig av lydkilden og motivet bak lydhendelsen. Hvis vi først tar for oss lydkilden, så kan vi gruppere disse i tre hovedkategorier:

  • Maskinlyder
  • PC-speaker (maskinvarestyrte lyder)
  • Lydkort (systemvarestyrte lyder)

Maskinlyderer de lydene som kommer fra selve maskinen: viftestøy, harddisk-aktivitet, printer og CD-spiller. I tillegg kommer de høyfrekvente signalene fra skjermen og suset fra høyttalerne. Disse lydene er stort sett alle konstante når maskinen er på, og i det totale lydbildet kaller vi disse for bakgrunnsstøy. Mange brukere klager over denne støyen fra maskinene, men produsentene har ikke gjort særlig store fremskritt de siste årene. Allikevel er ingen av disse lydene på langt nær så intense og fremtredende i lydbildet som lyden av mus og tastatur. Grunnen til at de fleste likevel henger seg opp i bakgrunnsstøyen er fordi tastaturlydene sammenfaller med en fysisk aktivitet fra brukeren. Det har blitt slik at man forventer en lyd, en tilbakemelding, når man trykker ned en av tastene. I Lydfigur 1 har jeg samlet en del standard maskinlyder som man møter ved datamaskinen: På-knapp, viftesus, diskettstasjon, harddiskstøy, CD-spiller, museklikking, tastaturskriving, utskrift og avslutning. Det er lett å kjenne igjen disse lydene og tenke på en datamaskin. Når vi isolerer lydene fra maskinen er det også enklere å legge merke til hvor mye bakgrunnsstøy vi egentlig påføres.

De maskinvarestyrte lydene genereres derimot fra den interne PC-speakeren på maskinens hovedkort. Dette er en primitiv bølgegenerator, som lager en ren sinusbølge, med en bestemt tone. De første datamaskinene hadde ikke noe annet lydkort og da ble denne lydkilden også brukt til å spille av melodier. Dette hørtes aldri bra ut. Det var faktisk først et godt stykke inn på 1990-tallet at de fleste PCer ble levert med et eget lydkort. Det er interessant å legge merke til at alle maskiner fremdeles har en intern PC-speaker, og at den fremdeles brukes ved oppstart og når maskinen har låst seg. Fordi det ikke kreves noe eget program for å kunne spille av lyd over PC-speakeren, kaller vi det for maskinvarestyrte lydhendelser. Lydfigur 2 er et eksempel på hvordan en slik lyd høres ut.

De lydene som kommer fra maskinens lydkort har jeg valgt å kalle systemvarestyrte lyder. Et program i datamaskinen sender signaler til maskinens lydkort, som deretter omformer det digitale signalet til analogt og sender det til enten hodetelefoner eller eksterne høyttalere. Det er viktig å huske på at det kan lages to forskjellige typer lyder på et lydkort: MIDI og Audio. MIDI-lyd er definisjoner av lydhendelser som spilles av gjennom den innebyggete synthesizeren eller wavelets-chipen som sitter på lydkortet. Resultatet er derfor helt avhengig av lydkortets kvalitet. Audiolyd er derimot en direkte avspilling av et lydopptak, på samme måte som fra for eksempel en CD-plate. Det er altså systemvarestyrt audiolyd som best ivaretar den opprinnelige lyddesignerens lydidé, og det er denne lydgruppen jeg skal drøfte videre i oppgaven.

En systemvarestyrt audiolyd blir sendt av et program til lydkortet. Men forut for denne maskinaktiviteten ligger det en kommando, sendt fra brukeren enten aktivt eller passivt. Vi skiller her mellom

  • Brukerstyrte lydhendelser: Så som avspilling av en CD-plate som man setter i maskinen, MP3- eller RealAudio-filer eller lyd til en video eller multimediapresentasjon. Her gjør brukeren et aktivt valg for å sette igang en lydhendelse, på samme måte som hvis man skrur på radioen. I disse tilfellene forventer faktisk brukeren at det skal komme lyd.
  • Programstyrte lydhendelser: Dette er lyder som maskinen selv avspiller som en reaksjon på brukerens aktivitet eller som et varselsignal. For eksempel kommer det ofte en lyd sammen med en melding om at man må huske å lagre et dokument, en annen lyd når man tømmer søppelkassen, eller et kjenningssignal når det kommer ny mail. Lydene styres av forskjellige programmer som brukeren kan satt igang aktivt eller passivt.

Resten av denne oppgaven vil dreie seg om disse programstyrte audiolydhendelsene. For enkelhets skyld vil jeg fra nå av referere til disse som systemlyder, eventuelt bare lyder. Jeg tar utgangspunkt i at leseren kjenner til grunnleggende begreper innen digital lydbehandling, men det skal være mulig å følge argumentene uansett.

Vi har sett på hvordan forskjellige datamaskinlyder blir til, og hva som utløser en lydreaksjon. Det er interessant å se at de retningslinjene jeg har trukket over, stemmer godt med de fleste plattformene. Etter å ha sjekket forskjellige systemer både gamle og nye, har jeg kommet til at absolutt alle har både maskinlyder, maskin- og systemvarestyrte lyder: Atari, Amiga, Dos, OS/2, Unix, Linux, BeOS, Windows og Mac.

Apple og MacOs var en av de første produsentene til å tilby et grafisk brukergrensesnitt, samt tilby lydredigering ved hjelp av datamaskiner. Helt fra starten har det også vært naturlig med lydvarsling. De fleste kjenner vel til den etterhvert ganske plagsomme froskelyden som til stadighet dukker opp på Mac-maskiner. Til forskjell fra de andre plattformene har Mac i all hovedsak satset på å bruke bare en lyd, som brukes til alle varselmeldinger og beskjeder. I kontrollpanelet ligger det noen forskjellige lyder man kan velge mellom eller det er mulig å spille inn sin egen lyd ved hjelp av mikrofon.

Unix/Linux og Windows har også operert med systemlyder i lang tid, men det er først de siste årene dette virkelig har blitt mye. Dette henger nok nøye sammen med oppblomstringen av et større marked for hjemmemaskiner. Produsentene lager nå ferdige pakker, kalt themes, som inneholder skjermbakgrunn, farver og en hel familie av sammenhørende systemlyder. Microsoft har til og med solgt disse separat gjennom sine Plus-pakker. På samme måte som for Unix og Linux, argumenteres det med at dette skal kunne gi brukeren en variert og unik arbeidsplass.

For å gi leseren en forståelse av hvordan systemlyder kan høres ut, har jeg i Tabell 1 samlet noen lydsett fra forskjellige plattformer. Hver av lydfigurene representerer et helt sett, hvor de forskjellige systemlydene ligger adskilt med 1 sekunds mellomrom.

LydfigurPlattformSettKvalitet
Lydfigur 3 MS Windows Standard 22 kHz, 16-bit, stereo
Lydfigur 4 MS Windows Jungle 22 kHz, 16-bit, stereo
Lydfigur 5 MS Windows Utopia 22 kHz, 16-bit, mono
Lydfigur 6 Unix/Linux KDE 22 kHz, 16-bit, mono
Lydfigur 7 Linux Enlighentment 22 kHz, 16-bit, mono
Lydfigur 8 Atari/Linux Ganymede 11 kHz, 8-bit, mono
Tabell 1: Oversikt over lydsett fra forskjellige plattformer

Teknisk analyse av lydene

Det er en rekke tekniske problemer knyttet til bruk av systemlyder på datamaskiner. Det største er at digital lyd krever svært mye lagringsplass. Alternativet er å komprimere filene, men dette krever igjen prosessorkraft som vil gjøre systemet tregere. Både produsent og bruker er opptatt av at operativsystemet skal ta liten plass og kreve små ressurser, slik at mesteparten av maskinkreftene kan brukes til brukerens nytteprogrammer. Dette lar seg vanskelig forene med et ønske om å ha høykvalitets systemlyder som spilles av umiddelbart sammen med en skjermhendelse. Produsentene har derfor valgt å kutte i kvaliteten og lengden på systemlydene.

For noen år siden ble alle systemlyder konsekvent lagret med 8-bit oppløsning, 11 kHz samplingsfrekvens og mono-signal. Etterhvert som maskinene har blitt kraftigere har de fleste gått over til å bruke 16-bit, 22 kHz og ofte stereo. Lyden lagret på en vanlig CD-plate er derimot på 16-bit, 44,1 kHz, stereo, men vi må huske på at dette er en gammel oppfinnelse og på langt nær ideell fra et musikkteknologisk ståsted. Med DVD-Audio som nå begynner å komme på markedet kan vi få lyd med 24-bit, 192 kHz. og seks kanaler. Kvaliteten på systemlydene ligger med zndre ord langt etter det som idag er realiteten innen høykvalitets lyd.

Dette leder oss over til et viktig spørsmål: legger man egentlig merke til dette? De fleste mennesker vil nok ikke tenke over at denne lyden ikke har så høy oppløsning, men det gir seg helt klart utslag i lytteropplevelsen. Det er stor forskjell på 22 kHz og 44,1 kHz, og de fleste vil oppleve en tydelig forringelse i kvalitet. Dette gir seg blant annet utslag i oppløsningen og dybden i lyden. Det hørbare frekvensomfanget kan være maksimalt halvparten av samplingsfrekvensen, og det betyr at for en lyd med 22 kHz vil man ikke kunne høre lyder over 11 kHz(Jensenius, 1999). Siden mennesket kan høre lyder opp til 20 kHz vil man derfor miste en rekke overtoner hvis frekvensområdet innsnevres. Det har senere vist seg at selv lyder man ikke kan høre er med på å forme lydbildet og i tillegg vil alle transienter avtegnes tydeligere når samplingsfrekvensen heves (Ruud, 2000: 87). I tillegg til at systemlydene er av en begrenset kvalitet, er også ofte avspillingsmediet relativt dårlig. De fleste datamaskiner spiller av lyd gjennom små datahøyttalere. Disse har også et sterkt avgrenset frekvensomfang og dårlig dynamikk.

For å kompensere for et tynt frekvensomfang, må lyddesignerne mikse lyden spesielt tilpasset for datahøyttalere. Figur 1 viser tidsdomenet til høyrekanalen av åpningslyden i Windows. Legg spesielt merke til hvordan et stort tidsområde av lyden ligger på et maksimalt utslag, og at det ser ut som mange av toppene kuttes. Dette kan kalles en form for over-normalisering, og det ser ut som lyden har blitt normalisert etter en maksverdi som ligger et stykke lavere enn de høyeste verdiene. Kombinert med en voldsom bruk av fading inn og ut, gjør dette at lyden høres ut som den blir kraftigere enn den er før den synker tilbake. På små datahøyttalere er det ganske virkningsfullt, mens når man spiller det på et ordentlig anlegg så hører man hvor presset lyden høres ut. Legg også merke til de lyse tonene i lyden og hvordan det er bevegelse i toppen. Dette er kanskje for å kompensere for hele spekteret av overtoner som ikke finnes, og gjør at lytteren opplever et spekter med lyd både i topp og bunn.

Figur 1: Tid-amplitude representasjon av høyrekanalen av lyden “Windows-start” fra Standard-settet. Hør på lyden i Lydfigur 9.

En annen interessant ting er å legge merke til hvor mye kompressor det er brukt på lydene. En kompresjon “trykker” amplituden i signalet sammen, ved å forsterke de svake signalene og dempe de sterke. Igjen er dette med på å skape mer liv i små høyttalere, og man sikrer at alle små detaljer faktisk blir hørbare. Bruk av kompressor er svært vanlig i digital lydbehandling, og brukes mye på vokalopptak for å skape et jevnere lydbilde. Det spesielle med alle systemlydene er at det er brukt så mye kompresjon. Dette er spesielt tydelig i Lydfigur 10 og Figur 2. Legg merke til hvordan bakgrunnssuset i jungelen trekkes så voldsomt frem i lydbildet. Vi ser dette visuelt ved at bakgrunssnivået i lydbildet dekker godt over halvparten av det totale utslaget. Legg også merke til hvordan de lyse insektene høres metalliske ut, fordi det mangler en rekke overtoner.

Figur 2: Tid-amplitude representasjon av høyrekanalen av lyden “Windows-start” fra Jungle-settet. Hør på lyden i Lydfigur 10.

I tillegg til oppløsningen og kvaliteten, er det lengden på lydene som er avgjørende for å spare harddiskplass. Når man hører på de forskjellige settene legger man fort merke til at hver enkelt lyd ofte bare varer i ett sekund, maksimalt to. Figur 3 viser alle lydene i et sett, adskilt med ett sekunds stillhet. Her ser vi tydelig hvordan innfyllingslydene er små og korte, mens det er noe lengre lydertil oppstart og avslutning. Legg også merke til at alle innfyllingslydene har et lydnivå som er omtrent halvparten av den kraftige introen og outroen. Dette passer godt til lydenes formål, ettersom innfyllingslydene må være korte, ikke for kraftige og spille umiddelbart mens brukeren arbeider. Derimot mener produsentene utvilsomt at brukeren har godt av å vente noen sekunder ekstra ved oppstart og avslutning, ettersom disse lydene er lengre og krever mer ressurser. Sett fra et musikkestetisk synspunkt er det selvfølgelig uheldig at alle lydene kuttes så brått. Selv om en lydhendelse er kort, kreves det atskillig mer tid til blant annet gjenklang for at lyden skal virke naturlig. Nå blir alle lydene fadet ut svært raskt. Ikke bare er dette med på å fjerne noe av realismen, men det avkorter også gleden over en fin lyd.

Figur 3: Tid-amplitude representasjon av høyrekanalen av hele lydsettet “Windows-standard”. Hør på lydene i Lydfigur 11.

Datamaskinlyder fra et musisk perspektiv

En fysisk synsvinkel oppklarer mange problemer, men sier lite om innholdet i lydene og hvilken effekt de har på oss. Hva minner lydene oss om? Hvordan er de bygget opp? Hvorfor er de samlet i forskjellige sett? Hva slags tonalt plan ligger de på? Hvorfor er de knyttet opp mot en bestemt handling. Siden alle produsenter bruker lyder, må det jo ligge en klar bevisst tankegang bak. Det har vært forsket mye rundt kognisjon og persepsjon, og hvordan lyder er med på å påvirke menneskene

I boken Det musiske menneske beskriver Jon Roar Bjørkvold hvordan lyd og musikk er et viktig verktøy i menneskets tilnærming til verden. Etter studier av forskjellige barnekulturer beskriver han hvordan allerede små barn knytter lyd og musikk til handlinger og kommunikasjon. Begrepet sikia introduseres som en beskrivelse for helhetssansningen. Denne inkluderer blant annet bevegelse, syn, følelse og hørsel og utløser helhetsbegrepet ngoma hos mennesket (Bjørkvold, 1999: 61-64). Tanken med å knytte lyder til spesifikke hendelser i en datamaskin følger altså naturlig fra menneskets tradisjon for læring og forståelse. Dette er interessant å tenke på når vi nå skal se litt nærmere på noen av systemlydene.

Innenfor filmverdenen er det vanlig å dele lydbruk i inn i tre kategorier: tale, musikk og lydeffekter, hvor lydeffektene videre kan deles inn i Foley-effekter og spesialeffekter . Foley-effektene dekker menneskelige ikke-vokale lyder som for eksempel fotskritt og klapping, mens spesialeffektene er for eksempel pistolskudd og søppelkasselyder (Moorer 1982: 599). Fra dette kan vi slå fast at de aller fleste systemlydene passer inn under kategorien spesialeffekter. Kun ett av settene presentert i Tabell 1, bruker gjennomgående tale. For de litt lengre åpnings- og avslutningslydene er bruken av melodier og musikk vanlig. Tabell 2 viser noen utvalgte lyder fra tre forskjellige lydsett satt opp i forhold til hvilken hendelse de skal følge.

Hendelse Standard Jungle Utopia
Åpningslyd Lydfigur 12 Lydfigur 13 Lydfigur 14
Maksimere program Lydfigur 15 Lydfigur 16 Lydfigur 17
Minimere program Lydfigur 18 Lydfigur 19 Lydfigur 20
Varselsignal Lydfigur 21 Lydfigur 22 Lydfigur 23
Søppelkasselyd Lydfigur 24 Lydfigur 25 Lydfigur 26
Avslutningslyd Lydfigur 27 Lydfigur 28 Lydfigur 29

Tabell 2: Oversikt over hendelsesspesifikke lyder.

La oss starte med åpningslyden, eller som man sier i satslæren: introen. Musikkstudenter lærer at en intro skal angi tempo og toneart, vise stemningen og den skal være spennende. Hvis vi ser på de tre åpningslydene fra Tabell 2, kan vi ihvertfall fastslå at alle fører oss inn i en stemning og de er også ganske spennende. Jungle-lyden er en ren lydeffekt, mens introene til Standard og Utopia er tonale (C-dur). Legg også merke til tersstablingen i Utopia-lyden (tonene c-e-g-a-c). Til å vare i bare fem sekunder, har lyddesignerne klart å putte inn en rekke forskjellige elementer, og dette er nok med på å gjøre introene fengende. I tillegg er lydene ganske hyggelige og snille, noe som burde blidgjøre brukeren som skal arbeide med maskinen. Med litt godvilje kan altså alle disse åpningslydene bli godkjent som en klassisk intro.

Hvis vi ser på lydene for å starte eller maksimere et program så følger alle tre et ganske likt mønster. De er korte, mikset lavere enn åpningslyden og i tillegg har de en tonal bevegelse oppover. Tilsvarende virker det som lydene for å minimere et program starter på en lavere tone og har en tonal beveger nedover. Dette er ikke like tydelig for alle, men det ligger nok allikevel en bevisst tanke bak dette. Bjørkvold (1999: 80) påpeker hvordan barnets tegning også går opp og ned med lydene som barnet lager. En tonal bevegelse oppover vil derfor automatisk forsterke det visuelle vi opplever på skjermen, et program som åpner seg. Tilsvarende vil den nedadgående lyden være med på å forsterke følelsen av at programmet lukkes og dette til bakken. Dette er effektive virkemidler og noe komponister og musikere til alle tider har visst å verdsette.

Varselsignalet bør helst bryte med de andre lydene, og det gjør det også ganske tydelig i disse eksemplene. Lyden i Standard-settet er en kort treklang med G som grunntone. Lyden er noe forvrengt og selv om den ikke er så fryktelig dissonerende, høres den allikevel markant og tydelig. Jungle-lyden høres litt ut som et brøl fra et neshorn og bærer også bud om at ikke alt er like rolig og fredelig i skogen. Utopia-settet har en kort, mørk og pulserende G. Også fra de andre settene jeg har hørt på viser det seg at varsel-lyden er dypere, har et hardere attack og er kortere enn mange av de andre lydene. Dette er også helt i tråd med standardene i klassisk musikk, hvor mørke toner og dissonerende intervaller (spesielt tritonus) skaper en mer dyster stemning.

Visualiseringen er enda mer tydelig når det gjelder søppelkasselyden. I Standard-settet hører vi lyden av papir som krølles sammen (i Windows 95 var det til og med lyden av at papiret ble kastet i en søppelkasse). I Jungle-settet hører vi at noe blir kastet i vannet, mens lyden i Utopia er en tonalt fallende skalabevegelse. Igjen er disse lydene med på å underbygge et klassisk programmusikalsk verk.

For å avslutte den lille konserten, kan vi lytte til de forskjellige avslutningslydene, outroen. Her er det interessant å høre hvordan Standard-lyden er en tonal kadens til F-dur. Jungle-lyden bærer preg av at det er blitt kveld, det tordner litt og bakgrunnslyden av yrende smådyr har avtatt. Jeg synes ikke at Utopia-lyden i samme grad klarer å gi følelsen av at noe er slutt, men elementer av barnelatter kan være med på å vri tankene ut av vinduet og mot resten av verden. Legg merke til at også Utopia-lyden havner på F-planet i avslutsningslyden.

Når vi ser på settene som helhet, er det svært interessant å se at både Standard-settet og Utopia starter i C, ligger på G på varselsignalet og havner på en F i avslutningen. Hvorfor har man valgt å gjøre det slik? Hvorfor kan ikke arbeidsøkten slutte i samme toneart som den begynte? Det er ihvertfall tydelig at dette er godt gjennomtenkt fra Microsoft sin side. Av de seks Microsoft-lydsettene jeg har tilgang til, er det ingen som begynner og slutter på samme tonale plan, og over halvparten slutter i F. At åpnings- og avslutningslydene er på forskjellig tonalt plan er faktisk ganske likt for sett fra andre produsenter også. Kanskje mener lyddesignerne det er viktig at man har en annen tonal følelse når man begynner enn når man avslutter. Her ligger det åpenbart mange spennende musikkpsykologiske spørsmål.

Det er nærliggende å trekke en parallell mellom systemlydene og en klassisk komposisjon. Finner vi ikke både intro og outro, eksposisjoner, gjennomspill og lydmalende elementer, kadenser og modulasjoner? Kan vi si at brukeren er med på fremføringen av et musikkstykke ved en økt foran maskinen? Det er ihvertfall tydelige elementer av en form for hypertekstualitet? Hypertekst er et begrep som beskriver hvordan tilsynelatende separate tekstblokker kan kobles sammen ved hjelp av pekere, akkurat slik Internett fungerer. Petter Dyndahl har vært opptatt av om man på samme måte kan snakke om en form for musikalsk hypertekstualitet.

“Musikkens strukturelle plan konstitueres interrelasjonelt av samtidige lag eller sjikt, ikke av suksessive gester og fraseringer. […] I vertikal musikk dominerer ikkelinearitet. På den måten er det den musikken som bryter mest radikalt med den vestlige tradisjonen. […] Hvis vi betrakter de teknikkene som brukes i kreeringen av techno, ser vi at hovedmaterialet ofte er basert på sampling av enhver tenkelig lydkilde i tid og rom, og at dette mikses på forskjellige måter i den utøvende formidlingen. […] Ved å betrakte denne aktiviteten i det metaforiske skinnet fra hypertekst, får vi øye på en skrivbar, ikkelineær virksomhet som på en fundamental måte er intertekstuell.” (Dyndahl, 1998: 75-76)

Selv om noen timer foran datamaskinen kanskje ikke oppleves på samme måte som å høre på en plate med techno-musikk, så ser vi helt tydelig at det er likhetstrekk med bruken av systemlyder. De er jo også korte samplinger som spilles, avhengig av brukerens valg. Forskjellen er at det foregår over lengre tid og at brukeren bare passivt avspiller lydene, de kommer som reaksjoner på brukerens aktivitet, og ofte uventet. Uansett kan vi si at systemlydene er en del av brukerens helhetsopplevelse, ngoma, ved datamaskinen.

Hvilken funksjon har systemlydene?

Dette leder oss over på en interessant problemstilling: Hvorfor ønsker man i det hele tatt lyder? Har de egentlig noen funksjon? Har det noe med å ufarliggjøre datamaskinen? Få maskinen til å virke mer virkelighetstro? Et ønske om en mer human og tiltrekkende maskin? Er det bare for gøy? En rekke spørsmål og det er ikke lett å gi noe svar. Jeg har forgjeves forsøkt å finne artikler eller bøker som tar opp disse problemene, og produsentene selv har ikke lyst til å uttale seg om lydsettene.

Systemlydene på de første datamaskinene var ment som varseltoner og beskjeder om pålogging og lignende hendelser. Da hadde lydene en praktisk betydning for brukeren i forhold til datamaskinen. Etter å ha skrudd på datamaskinen visste man at boot-prosessen var igang når maskinen hadde gitt fra seg et pip. Tilsvarende kunne man få et lite signal når maskinen var ferdig med for eksempel en beregning. Noe av dette har vi også i dag. Slik jeg nevnte innledningsvis, har også dagens maskiner en innebygget PC-speaker som lager et par lyder. Dette er altså hjelpelyder som har en praktisk funksjon, de er ment for å lette brukerens arbeid med maskinen.

Den moderne maskins forskjellige lydsett kan kanskje ikke sies å ha den samme praktiske betydningen. Selv om man til en viss grad kan hevde at noen av disse har en rent praktisk betydning, er ikke dette god nok forklaring til å tilby fem forskjellige søppelkasselyder. Jeg tror mye av tanken bak forskjellige lydunivers ligger i å ufarliggjøre maskinen. Ved å bruke kjente eller mer eksotiske lyder blir maskinen levendegjort på en helt ny måte. Datamaskinen har gått fra å være en regnemaskin til å bli et multimedie-verktøy for hele familien. Det grafiske brukergrensesnittet har stått sentralt i arbeidet med å tilrettelegge datamaskinbruk for alle. Først med MacOS og senere Windows kunne brukerne orientere seg på et skrivebord og åpne vinduer og mapper . Det sentrale har vært å bruke familiære bilder på de forskjellige dataverktøyene. Brukeren skal tenkte i virkeligheten og utføre på maskinen. Da skjønner vi også hvorfor det har vært viktig å kunne ha lyder som forsterket denne opplevelsen. Søppelkasselyder, krøllet papir og stigende og synkende lyder er med på å gjenskape en kunstig arbeidsplass. Det virtuelle skrivebordet og gjenkjennelige lyder har lært folk at datamaskinen er for alle.

Etterhvert som flere og flere har fått maskiner, og den generelle data-skrekken har sluppet taket hos de fleste, har produsentene sett hvordan selve dataopplevelsen kan styrkes. Fra å være et praktisk verktøy og deretter en ufarliggjører går systemlydene over i en opplevelsessfære. Som tidligere nevnt produseres det i dag en mengde themes. Hvis man for eksempel velger å bruke Microsofts Jungle Theme, vil skrivebordsbakgrunnen fylles av et eksotisk dyr og alle farver på menyer og knapper vil justeres etter bildet. Istedenfor den vanlige pilen vil et helt nytt sett med kursorer dukke opp. For å komplementere stemningen er også alle lydeffektene basert på typiske jungellyder. Det er her altså snakk om å få en totalopplevelse. Den kjedelige hverdagen skal byttes ut med en spennende reise. Mange av de vanligste themesene til Windows og Linux baserer seg på nettopp dette, reiser, verdensrommet og eksotiske kulturer.

Som et siste punkt, tror jeg produsentene ønsker å få folk til å velge themes avhengig av identitet. Tanken er at forskjellige menneskegrupper vil velge forskjellige oppsett avhengig av smak og erfaring. Man kan få en datamaskinverden omkranset av jungel, Star Wars, hippie-tiden eller rett og et slett et vanlig skrivebord: “hvis meg ditt maskinoppsett og jeg skal si deg hvem du er”. Microsoft har varslet at dette skal kunne utvikles enda lenger de nærmeste årene ved at man skal kunne lagre alle sine personlige innstillinger på nettet. Da kan alle de personlige opplysningene bli hentet opp fra hvilken som helst maskin man logger inn på i hele verden. Dokumenter, bakgrunn og lyder vil kunne følge brukeren rundt omkring i verden og passe på at man beholder sin identitet og tilhørighet.

Påvirkning på brukeren

Alt dette høres vel og bra ut, men fungerer det egentlig slik? Hvordan oppfatter vanlige brukere disse mulighetene? Er det effektivt? Er det underholdende? I arbeidet med denne oppgaven har jeg snakket med både unge og gamle mennesker, i forskjellig livssituasjon og med forskjellige behov. Jeg har spurt dem om hvordan de arbeider med datamaskinen og i hvilken grad de bruker systemlyder. Gjennomgående har svarene vært at de fleste irriterer seg over datamaskinlydene og mange har også sørget for å skru de av. Jeg har sammenfattet svarene jeg har fått og presenterer disse ved hjelp av tre fiktive personer, som jeg tror er representative.

Lars, 20 år, informatikkstudent
Lars er god på data og bruker mye tid ved maskinen sin. Han kjører både Linux og Windows og har en rekke forskjellige themes til begge systemene. Tidligere syntes han det var morsomt å kunne veksle mellom forskjellige skjerm- og lydoppsett, og vise det til venner. Etterhvert har han blitt lei og sier at han blir sliten av at det hele tiden kommer forstyrrende lyder. Dessuten spiller han stort sett MP3-filer hele tiden og lydene ville ha kommet i bakgrunnen og hatt liten praktisk effekt. Han har nå skrudd av alle systemlydene på maskinen, men har satt på et maskinvarepip hver gang det kommer ny mail.

Monica, 40 år, salgssjef
Monica bruker flere forskjellige datamaskiner på jobben og har gått på kurs for å lære mer effektiv bruk av disse maskinene. Der fikk hun vite at det kunne være lurt å bruke lydene aktivt for å få mer ut av datamaskinen. Hun har skrudd på en spesiell “brevduelyd” som varsler når det kommer inn e-post. I tillegg er hun glad for at det kommer en kraftig fanfare når hun glemmer å lagre dokumenter før hun skal slå av maskinen. Mange av arbeidsoppgavene er basert på kjente rutiner og like innslag på maskinen og det kan være lett å gjøre en slurvefeil når arbeidet skal gå raskt. Da er det greit at det kommer en kraftig varsellyd som minner om at ikke alt er fylt ut riktig. Alle betalingskassene i butikken har også hver sin datamaskin tilknyttet håndscanner. Ekspeditøren holder strekkoden på et produkt opp til laseren og koden leses inn og lagres i maskinen. Når produktet er gjenkjent gir maskinen fra seg et kraftig “pip” og ekspeditøren vet at hun kan gå videre til neste vare. Dette sparer mye tid og unødvendige bevegelser ved å slippe å se på skjermen hele tiden. Monica er derfor godt fornøyd med at datamaskinene kan lage lyder, men bryr seg mindre om hvordan lydene høres ut. Hun synes det er hyggelig å høre brevduen når det kommer e-post, men det er ikke av noen spesiell betydning.

Kåre, 80 år, pensjonist
Kåre har nylig kjøpt en bærbar datamaskin med internettoppkobling. Han ønsker å skrive brev og artikler samt sende e-post til sine barnebarn. Maskinen kom ferdig innstallert med Windows 98 og Kåre har ikke forandret noe på oppsettet. Det er derfor de vanlige systemlydene til Windows som til stadighet dukker opp. Kåre sier at han egentlig ikke tenker noe særlig over dette, han trodde det var slik maskinen var. Lydene plager ham egentlig ikke så mye for han hører litt dårlig. Ikke vet han hvordan han skal fjerne dem, så han lar det bare være. Han har blitt forklart hvordan han kan surfe på nettet, høre MP3-filer og spille av DVDer på maskinen, men bryr seg ikke så mye om dette. Dataen er i utgangspunktet en skrivemaskin.

Jeg vil tro at disse tre eksempelpersonene er svært representative for de fleste datamaskinbrukere. En gruppe mennesker er bevisst lydene, har til en viss grad brukt og eksperimentert med dem, men har valgt å koble dem av. En annen gruppe har ikke tenkt noe særlig over lydene og lever passivt sammen med dem. Den siste gruppen er de eneste brukerne som har et bevisst forhold til systemlydene. Dette er gjerne i jobbsammenheng og lydhendelsene brukes aktivt som en effektivt verktøy. For disse menneskene er imidlertid det musikalske aspektet ved selve lyden svært lite viktig. Hovedpoenget er at det kommer en lyd til riktig tid. Ingen av de nærmere 15 menneskene jeg har snakket med sier at de liker eller har bruk for alle de forskjellige lydsettene. Det er nærliggende å undre seg over hvorfor produsentene faktisk lager alle disse lydsettene?

Veien videre

Det er en rekke gode argumenter for å bruke systemlyder på en datamaskin. Det kan være praktisk og effektiviserende, levendegjørende, opplevelsesfullt og identitetsskapende. Det passer inn i tanken om helhetssansing, opplevelse, og en musikalsk hverdag. Allikevel kan jeg ikke fri meg fra følelsen av å rett og slett bli plaget når  maskinen for tiende gang sier “plong” eller spiller fanfarer. Det er morsomt å høre på jungel-lyder en gang iblant, men irritasjonen ligger ikke langt under overflaten. Jeg tror noe av hovedpoenget med en datamaskin forsvinner hvis man overgir seg helt til effektenes verden. For meg og de fleste andre brukere er datamaskinen et arbeidsverktøy, som i tillegg kan underholde. Når man arbeider en god del med lydbehandling og musikkskriving på maskinen blir det desto mer forstyrrende at det dukker opp tilfeldige lydelementer. Når disse lydene i tillegg er korte og høres anstrengt ut over anlegget, så forsvinner også det musikkestetiske elementet. Det som i utgangspunktet skulle være til glede og hjelp har blitt til et spillende mareritt og auditiv voldtekt. Enda verre blir det når flere maskiner er i samme rom. Jeg husker enda med gru hva slags intenst lydbilde nærmere femti datamaskiner klarte å lage på en datalab. Da er det ikke bare plagsomt, men det går på arbeidsmiljøet og helsen løs.

Det er ikke tvil om at fremtidens datamaskiner også kommer til å lage lyd, men jeg tror at brukerne snart er lei av muligheten til å forandre skjermbakgrunn og forskjellige lyder hele tiden. Forhåpentligvis vil markedet vende seg mot mer praktisk anvendbare systemer. Stemmegjenkjenning og stemmestyrte kommandoer har vært tilgjengelig i lang tid, men det er først med dagens raske maskiner og programmer at dette virkelig kan bli utviklet til praktisk og rask databruk. Et annet spennende felt er hvordan stadig flere forskjellige former for medier samles i datamaskinen, blant annet lyd og bilde. Med fremveksten av mindre og kraftigere lommemaskiner, vil dette være med på å forandre hverdagen. Da blir ikke målet først og fremst at maskinene skal lage lyder, men at de skal oppfatte lydene rundt seg og reagere på stemmestyrte kommandoer. Det hele handler om at menneskene tar kontrollen, ikke motsatt.

Litteraturliste

  • Bjørkvold, Jon Roar (1999): Det musiske menneske, Oslo: Freidig forlag
  • Dyndahl, Petter (1998): IT-relatert musikkundervisning mellom moderne utopi og postmoderne ironi. Artikkel i (Red.) Dyndahl, Petter (1998): IT og musikk i allmennlærerutdanningen. Rapport 2, Høgskolen i Hedmark
  • Hammer, Øyvind (1997): Digital lydbehandling, Oslo: NOTAM
  • Jensenius, Alexander Refsum (1999): Digitalisering av pianolyd: Noen problemområder, med vekt på fysisk signal og menneskelig oppfatning, Semesteroppgave i grunnfag Musikkvitenskap, Universitetet i Oslo
  • Jensenius, Alexander Refsum (2000): MP3: Friend of the Youth or Enemy of the Sound? A discussion of different sound formats and problems with sound compression, Semesteroppgave i mellomfag Musikkvitenskap, Universitetet i Oslo
  • Moorer, James A. (1982): The Lucasfilm Audio Signal Processor. Artikkel i (Red.) Roads, Curtis (1989): The Music Machine, Selected Readings from Computer Music Journal, Cambridge, Massachussets: The MIT Press
  • Ruud, Even (1997): Musikk og identitet, Oslo: Kunnskapsforlaget
  • Ruud, Øyvind (2000): Den nye verden: DVD audio, Artikkel i Lyd og Bilde nr. 10/00
  • Vistnes, Arnt Inge og Bugge, Lars (1993): FYS 115 øvelse 12 Digitalisering av lyd, Labintroduksjon Fysisk institutt, Oslo

Published by

alexarje

Alexander Refsum Jensenius is a music researcher and research musician living in Oslo, Norway.