Trenden för Sveriges miljömål är i flera fall nedåtgående, och ett av de områdensom visar negativ trend är målet ”Ett rikt växt- och djurliv”. Sveriges uppföljning avhabitat- och fågeldirektivet påvisar ett utsatt läge för den biologiska mångfalden.Det är idag svårt och kostsamt att övervaka om de svenska miljömålen uppfylls.Insamling av ljud- och bilddata sker redan idag i en stor omfattning, men detfinns en stor och outnyttjad potential att förenkla miljöövervakningen genom nyabilliga datainsamlingsenheter och framför allt genom nya automatiska AI-baseradeanalyssystem. Manuell provtagning och datainsamling är tidskrävande och kostsam,vilket gör autonom ljud- och bilddatainsamling attraktivt, särskilt på otillgängligaplatser som till exempel under vatten. I flera fall skulle allmänheten kunna anlitasför att hjälpa till med detektering av invasiva främmande arter med hjälp av enmobiltelefonapplikation som använder artificiell intelligens för artidentifiering.I denna rapport granskas state of the art, det vill säga resultat och tekniki forskningsfronten, när det gäller användning av ljud- och bilddata för bullerövervakningoch bullerkartläggning, för artidentifiering av djur och växter ochför övervakning av invasiva främmande arter. Rapporten granskar och analyserarnuvarande och framväxande teknik och metoder och bedömer deras mognad,tillgänglighet och tillförlitlighet. Denna rapport syftar till att redovisa möjligheter och utmaningar kopplade till: System för att samla in bullerdata för att modellera bullerpåverkan i de terrestraoch akvatiska domänerna och möjliggöra bullerkartläggning. System för autonom ljud- och bildbaserad artidentifiering, uppskattning avpopulation och övervakning av biologisk mångfald. System för detektion av invasiva främmande arter, till exempel medmobiltelefonapp. Ekoakustisk bullerdatainsamling Biologiska tillämpningar inom akustik kallas bioakustik eller ekoakustik. De mestutforskade områdena med passiv akustisk övervakning eller PAM, är djurläteni ultraljudsområdet (exempel är fladder-möss och valar), eftersom traditionellaanalysmetoder kan användas i de fallen. PAM kan till exempel realiseras med ljudboxar,enskilda eller i matriser, eller med halsband eller inopererade enheter påenskilda djurindivider. Akustiskt aktiva djur inrättar sig efter varandra och övrigaljud, varför ljudlandskap anses ge information om biosystemets hälsa.Det viktigt att adressera hela mätkedjan i PAM-teknik. Rapportens översikt avhårdvara fokuseras mot ljud, eftersom kamerateknik är etablerat i svensk viltvård.De flesta hårdvarukomponenter i mätkedjan behöver väljas från praktisk synvinkelför att fungera bra i mätsystem, till exempel batteritid, minneshantering elleruppkopplingsmöjligheter,och låg kostnad om många insamlingsenheter behövs. Rapporten innehåller även en översikt av autonoma system eller integrerade enhetersom täcker hela mätkedjan vid insamling av ljuddata. Möjligheterna att kombineraljud- och bilddata för analys används sällan idag, och det kan finnas stora vinsteratt göra inom detta fält.Framgångsrika AI-baserade analysmetoder har inte slagit igenom i kommersiellamjukvaruprogram. Det är ett stort tryck inom forskarvärlden på att tillgängliggöraanalysresultat, analysverktyg och insamlade data, för att kunna återanvända dataoch resultat av resursskäl, och erbjuda större datatäckning. Även standardiseradeformat på metadata efterfrågas, syftande mot internationell forskningspraxis.Framgångarna inom medborgarforskning kan delvis tillskrivas nya verktygimplementerade i mobilappar, men det finns en stor utvecklingspotential attskräddarsy verktyg och metoder efter verksamheter och faktiska behov. AI inom bioakustik –State of the art De AI-baserade metoder som används mest inom bioakustik är djupinlärningsmetoder,framför allt olika former av neurala nätverk som lämpar sig för resurskrävandelyssning och bildgranskande. Det största området är fågelklassificering.Den vanligaste typen av neuralt nätverk inom bioakustik är CNN (convolutionalneural network), vilken är viktig inom bild- och ljudanalys, men nya varianterutvecklas ständigt. Ofta används spektrogram (en bildrepresentation av ljud) somindata till djupinlärningsmodeller, men många varianter har visats fungera. Melspektrogramär det som funkat bäst i bioakustiska sammanhang, på grund av attfrekvensskalningen avbildar läten likadant oavsett tonhöjd, vilket passar nätverkav CNN-typ. Observera att samma rådata kan ligga till grund för olika typer avträningsindata,om de har tillräckligt bra kvalitet och upplösning. Kraven på högupplöstdata väntas öka, vilket är viktigt om insamlade rådata ska kunna användasi framtiden, liksom kraven att metadata ska kopplas till konstaterade observationer.För maskinlyssning har en femtonfaldig ökning skett av antalet publikationeri området mellan 1998–2018. Skattning av populationstäthet hos fåglar med hjälpav maskinlyssning har visat sig ge lika bra resultat som manuell punkträkning,med avseende på nyckelparametrar som antal noterade fågelarter.Metoder som inte kräver manuell klassificering av upplärningsdata är en lovandeframåt för bullerreducering och källseparering. Vid brist på annoterade indata förträning av modeller kan ”embedding functions” användas. Från området stadsbullerfinns metoder för att realtidsströmma data med hjälp av distribuerade nät. Aktiva inlärningsmetoder, det vill säga metoder där experter aktivt deltar iinlärningsprocessen,ger snabbt kraftfulla resultat. En intressant variant på detta äratt träna djur för att göra val som blir annoteringar av indata. Detta ger en modell somrepresenterar djurens egen perception, vilket dock får användas med försiktighet.Sammanfattningsvis ses inte en omfattande satsning på bullerdatainsamlingutanför Sveriges bebyggda områden eller runt Sveriges kustersom realistisk i dagensläge, men det finns stora möjligheter att integrera autonom artidentifiering i depågående övervakningsaktiviteter som bedrivs i svensk natur eller som ett proof-of concept.
Stockholm: Naturvårdsverket , 2022. , s. 89