Ljudupptagning

7 min

Ljud är ganska knepigt att spela in till skillnad från bilden. På bilden ser man direkt om någonting är fel, t.ex. färgerna, ljuset, skakig kamera etc. Fel i ljudet måste man lyssna sig till noggrant och det är betydligt svårare än att hitta bildtekniska fel. En bra inspelningmiljö för ljud måste därför vara fri från buller och eko, samtidigt som man måste välja rätt mikrofon och rätt mikrofonavstånd.

En bra ljudinspelning

Vad är egentligen en bra ljudinspelning? En bra ljudinspelning har en hög teknisk kvalitet fri från störningar och brum, samtidigt som det ger dialog och karaktärsljud tydlighet och "fyllighet". Absolut viktigast är tydligheten. I efterarbetet brukar man kunna korrigera små felaktigheter i ljudet och lägga på olika så kallade equalizer-filter som korrigerar bas, diskant och andra frekvensområden. Det är värre med bilden.

En ljudtekniker spelar in dialogljud
Foto: Nils Kim Gustafsson

Möbler och inredning

Alla möbler och saker påverkar ljudet. Generellt kan man säga att mjuka material och ytor (t.ex. mattor, fåtöljer, gardiner och soffor) tar upp ljudet och absorberar det, medan hårda ytor (t.ex. kakel, glas, metall och väggar) studsar tillbaka ljudet. För att få en bra ljudinspelning krävs det att man balanserar dessa material så att man inte får en miljö som har för mycket "dött" ljud eller för mycket eko. Det är därför man alltid lägger till eko och andra ljudeffekter i efterhand, så att man får kontroll över ljudet.

Eko på plats låter oftast "burkigt" och konstigt. Det är dessutom väldigt svårt att få tydlighet i ljudet. Andra typer av störande ljud är bl.a. vindbummel som uppstår när svaga vindpustar når mikrofonen. Detta motverkas lättast genom att sätta en stickad vante på mikrofonen.

I ett rum med mycket "hårt" rum kan man mjuka upp ljudet med mattor, tyger, fördragna gardiner och draperier eller äggkartonger! Äggkartonger har den fördelen att ytan är ojämn, vilket gör att ljudet som inte absorberas, "studsar" i olika riktningar och fördelas jämnt över rummet. Se dock till att inte ljudisolera för mycket, då ljudet kan bli väldigt livlöst och till och med låta "dött".

I ett "mjukt" rum däremot kan hårda material som träfiberskivor, speglar, kakel eller metall underlätta för ljudinspelning.

Absorberande material

 • Plast
 • Trä
 • Mjuka möbler
 • Mattor
 • Gips

Reflekterande material

 • Metall
 • Kakel
 • Glas
 • Speglar
 • Träfiberskivor

Mikrofonavstånd

Det enda man egentligen behöver veta är att ju kortare avstånd mellan mikrofonen och ljudet desto bättre blir ljudet. Ett avstånd på 50 cm är att rekommendera vid en inspelningsplats med "normal" inredning eller miljöljud. Ju mer eko desto kortare måste avståndet vara, t.ex. från 30 cm eller nästan inpå ljudkällan. Undvik dock att gå allt för nära ljudkällan. Då kan så kallade puffljud lätt uppstå, t.ex. ljud med bokstaven "p" som "slår i" mikrofonmembranet.

Arbetar man med myggor, dvs små mikrofoner som kan fästas på exempelvis en slips, är det nödvändigt att placera den på rätt sida om slipsen. Om "offret" vänder huvudet uteslutande åt höger (som t.ex. vid en TV intervju) bör även myggan vara placerad på höger slipskant så att man får bästa täckning på ljudet.

Det är även viktigt att videokameran eller ljudinspelningsutrustningen är inställd på manuell volymreglering. Använder man den automatiska volymregleringen kommer ljudet att "pumpa" när ljudet förändras. Så fort någon pratar sänks ljudet för att inte bli överstyrt. När talaren sedan tystnar ökar ljudnivån till följd av att även bakgrundsljudet ökar.

Innan man startar den riktiga ljudinspelningen måste man alltid göra ett röstprov för att ställa in ljudnivåerna (se dock till så att skådespelarna eller liknande inte höjer rösten inför röstprovet).

Handhållen mikrofon

En mikrofon som hålls i handen är vanligt vid intervjuer och möjliggör en "närbild" av ljudet. Det kräver å andra sidan att man håller den i ett stadigt grepp, för annars kan oljud uppstå när man byter grepp. Håll mikrofonsladen i en ögla runt fingrarna så att det inte uppstår oljud och störningar på grund av glappkontakt, speciellt när man använder amatörkontakter såsom minitele.

Försök även att undvika allt för häftiga vinklingar med mikrofonen mellan dig och den du intervjuar, det blir väldigt irreterande för den som tittar plus att vindljud kan uppstå i riktade mikrofoner. Håll mikrofonen upprätt så att både du och intervjuoffret talar rätt ner i den. Ännu bättre vore att använda en så kallad åtta-kopplad mikrofon, vilken tar upp ljud från två riktningar samtidigt.

Mikrofonbom

Med mikrofonen fäst på en lång bom kan man komma ljudkällan närmare och få ett ganska störningsfritt ljud. Håll mikrofonbommen i ett brett grepp så att du får bra stabilitet och håll bommen under bildkanten i den mån du kan, det är lättare än att hålla den ovanför motivet.

Mikrofonsladden tejpas noga vid bommen i utfällt läge för att inte ge störningar eller fastna i ljudteknikerns armar eller händer. Om man behöver dra in "spöet", dvs göra det kortare, är det bara att snurra bommen så snurras och späns även sladden.

Flera mikrofoner

Två eller fler mikrofoner är användbart när t.ex. två personer pratar med varandra. Med två riktade mikrofoner på var sin mikrofonbom kommer båda mikrofonerna nära ljudkällan. Ljuden läggs ihop i en ljudmixer med en kanal för varje ljudkälla.

I ljudmixern bestämmer man även hur hög ljudnivå varje enskilt ljud skall få. Pratar den ene lite svagare än den andre måste ändå ljudnivån ställas in så att signalen spelas in lika högt. Detta görs för att "trycka undan" alla andra ljud och få en störningsfri ljudinspelning. Under efterarbetet ställs sedan alla ljudnivåer in för att passa varje litet ljud.

Professionella videokameror har oftast en egen nivåkontroll för ljudet vilket eliminerar användandet av en ljudmixer. De flesta mikrofoner är dessutom i mono, vilket gör att man kan använda videobandets stereokanaler för varje mikrofon, men då är det svårt att samtidigt filma som man ska ställa in ljudnivån.

Separat ljudinspelning

Om man vill kan man spela in ljudet separat istället för att med videokameran fånga ljudet. Det är ingenting att rekommendera om man jobbar med video - videobandet har ju ett ljudspår som duger väl, såvida man inte har höga krav på ljudet. Men om man spelar in på 35 mm film eller dylikt så finns det inga ljudspår i kameran (det finns visserligen på vissa filmtyper, men det används ej). Istället så spelar man in på exempelvis en DAT-bandspelare (Digital Audio Tape) som en B-ljudtekniker springer runt med.

Nackdelen med den här tekniken är att man måste synkronisera ihop bilden och ljudet vid redigeringen. Till detta behövs därför en klappa, med vilken man synkar antingen med den smäll som klappan ger när man slår ihop den, eller med hjälp av en visuell tidkod på klappan. Dessutom måste man identifiera varje ljudband väl genom att säga och skriva ner varje scen- och tagningsnummer.

Fördelarna däremot, är att man kan röra sig fritt med ljudutrustningen. Man är ju inte begränsad till de rörelser som fotografen gör. Dessutom är man heller inte begränsad till videoformatets ljudspår som man spelar in på, utan kan välja ett betydligt bättre (eller sämre om man nu vill det av någon anledning).

Ljudreglering

Alla videokameror har någon form utav automatisk nivåkontroll (så kallad Automatic Gain/Level Control eller AGC/ALC) som justerar ljudnivån varefter ljudet förändras. Fördelen med dessa är att man själv slipper tänka på hur ljudet spelas in, men dessa är oftast inte tillräckligt intelligenta utan justerar volymen efter det starkaste ljudet. Det innebär att man kan få en "pumpande" effekt om någon pratar och sedan tystnar. Ljudvolymen ökas när talaren tystnar och bakgrundsljudet blir pinsamt hörbart. Istället bör man slå över till manuell ljudreglering vilket innebär att man själv ställer in volymen på ljudet.

VU-meter För att veta hur hög ljudvolymen är när man spelar in ljudet maneullt, använder man olika typer av utstyrningsinstrument. Den vanligaste formen av dessa instrument är en så kallad Peak-mätare. Det är en pelare med lampor som reagerar blixsnabbt på ljudets förändringar och visar det som grönt, gult och rött. Det röda fälten visar de högsta ljuden. Ett annat utstyrningsinstrument är en så kallad VU-meter (Volume Units), vilket är en analog mätare som är relativt långsam i sin ljudregistrering och visar därför bara ett medelvädre på nivån.

När man styr ut ljudnivån bör den ligga kring en så kallad 0-nivåreferens, eller rättare sagt vid 0 dB (decibel), för optimal ljudinspelning. De högsta ljuden, bör inte gå upp högre än till +3 dB (A). Tal bör ligga mellan -3 dB och 0 dB.

Om man har för hög ljudnivå (så kallad överstyrning) blir ljudet förvrängt och fenomenet distorsion uppstår. Man brukar då säga att ljudet peakar eller clippar. Ställer man däremot in ljudnivån för lågt försvinner ljudet bland bakgrundsbruset.

Normalt används också hörlurar för kontrollysning, där man hör ljudet som mikrofonen fångar in. Att inte använda hörlurar är detsamma som att inte titta i sökaren när man filmar - man har ju praktiskt taget ingen uppfattning om vad som spelas in. Hörlurarna bör omsluta öronen helt så att alla andra ljud stängs ute. Amatörkameror har dock oftast inget uttag för hörlurar och även om de har det, så brukar volymen vara alldeles för låg i dem.

Ljudregistrering

Det finns tre olika sätt att spela in ljud på en videokamera:

Separat ljudspår

På bland annat VHS-band finns ett längsgående analogt spår som ljudet spelas in på.

FM-ljud

Frekvensmodulerat (FM) ljud, eller HD-ljud som det tidigare kallades, innebär att ljudet "bakas ihop" med bilden. Fördelen med detta är att ljudet blir så kallat HiFi-ljud (High Fidelity, hög naturtrogenhet), dvs betydligt bättre än "vanligt" ljud. Nackdelen med HiFi-ljudet är att det alltid hör ihop med bilden. Det går därmed inte att ta bort eller lägga en ny bild utan att ljudet påverkas.

En VHS eller S-VHS kamera med HiFi-ljud har alltid ett seperat ljudspår vid sidan om HiFi-ljudet, varför ljuddubbning är möjlig på dessa kameror. Detta görs för att man även i en vanlig video ska kunna höra ljudet. Ett Hi8 system som spelats in med FM-ljud, har däremot bara detta ljud.

PCM-ljud

PCM-ljud är ett digitalt ljud och betyder Pulse Code Modulation, som spelas in vid sidan om videosignalen. PCM-ljudet finns på vissa avancerade amatörkameror, samt på alla professionella. Ljudkvalite upp till 96 kHz samplingsfrekvens och 32 bitars upplösning (vilket i stort sett är det högsta man kan ha).


Vad tycker du om artikeln?
20
Lär dig mer om film

Vill du hålla koll på det senaste inom film? Gör som tusentals andra och prenumerera på vårt nyhetsbrev om filmskapande. Det skickas måndagar på förmiddagen.

7 kommentarer

 1. Johan Mickels
  Det var en jätte bra artikel, men det jag reflekterade över var kontroll av ljudnivåerna. I artckeln står det att tal ska ligga mellan minus 3 och 0 när man ställer in manuellt. Det är ju jätte högt, jag jobbar inom tvbranchen och då får inte ljudet överstiga -12 med anledning att talaren kanske pratar lite högre på ett ställe. Går de över noll är ljudet förstört. Jag har även hört att SVT vill inte ha högre än -15.
  H. Mickels
 2. Lucas Nilsson
  Håller med om förra kommentaren att mellan -3 och 0 är otroligt vågat när det gäller digital inspelning.
  En annan grej jag reagera på var att du skrev att PCM ljudet spelar in på upp till 96Khz, vilket jag är med på. Men INTE 32 bitar...24 bitar är lyx att spela in på idag :)
 3. gcs
  Hi 8 kameror kunde ha både FM ljud och digitalt 12bitar/32Khz. Sedan som någon tidigare sagt så kan man bara spela in med högst 24 bitar. Högsta samplingfrekvensen är 192Khz. När det gäller nivåerna
  så bör den nominela nivån ligga på -18dBf vilket motsvarar 0,775 millivolt eller Test på en nordiskskala.
  När det gäller toppnivåer i radio(SR) och tv(SVT/TV4)så bör topparna aldrig överstiga -9dBf vilket bettyder 9 dB över Test(0.775 mV). Om någon vill fråga mer så kan ni skriva till mig.
 4. gcs
  En sak till som gäller digital inspelning. När man spelar in musik i en kommersiell studio vill man att topparna ska ligga så nära 0dBf som möjligt eftersom man strävar att uppnå fulldynamik om den nu är stor, dessutom minskar också distorsionen ju närmare 0:an man kommer. Modern popmusik brukar som regel inte ha någon större dynamik.(Kanske inte mer än 15, 20dB)
 5. gcs
  PCM betyder Pulse Code Modulation
 6. gcs
  När det gäller mikrofoner så talas det om cardioid(njure) och åtta-formad(bi-directional):e mikrofoner.
  Det är en viss skillnad på känslighet mellan dessa två typer av mikrofoner. Om man vill ha samma närhets-känsla med dessa två typer av mickar så måste man låta åttan stå närmare. Detta gäller om båda har samma känslighet. Förhållandet blir enligt detta 1:1,4.
  Det finns fler kommentare jag kan göra men jag stannar här.
 7. Niklas
  Denna artikel är väldigt gammal och tyvärr förlegad när de gäller de tekniska aspekterna.
  Ang. inspelningsnivå antar jag att författar utgår från VU och alltså inte tar hänsyn till digital inspelning där man, som det redan nämnts i kommentarerna, inte bör överstiga -10dBfs.
  Vid studioinspelningar (av musik) finns det inte heller någon anledning att spela in nära den digital nollan. Ett mixerbord är normalt sett kalibrerat att motsvara -18dBfs vid 0VU, där bör man även hålla sina inspelningsnivåer.

  För mer info om olika Decibel-skalor, se:
  http://en.wikipedia.org/wiki/Decibel#Common_reference_levels_and_corresponding_units

  ----

  Ang. bitdjup och samplingsfrekvens har vi idag upp till 192kHz samplingsfrekvens och 24-bitars bitdjup. Berwardhallen är en av de få platser där det går att spela in i 28-bitar men en del musikprogram jobbar upp mot 32-bitar, detta är i princip obrukbart överallt annars.

  Vid filminspelning bör du spela in i 48kHz och 16 bitar som minst, helst använder du 24 bitar eftersom du ökar det dynamiska omfånget med 48dB. Mindre än 48kHz gör att du måste sampla upp för att synka med videofilerna och högre än 48kHz gör att den som ska synka och/eller klippa materialet oftast får problem eftersom de har dålig koll på ljudbiten.

  Mvh Niklas
  www.aldenaudio.se
Skriv kommentar