Change search
Link to record
Permanent link

Direct link
Publications (4 of 4) Show all publications
Willbo, M., Grahn, T., Ekblad, L., Pirinen, A., Fagerblom, N. & Vikberg, T. (2025). Automatisk mätning av timmer med NIR och AI/visionteknik – steg 2: Slutrapport. Träcentrum Norr
Open this publication in new window or tab >>Automatisk mätning av timmer med NIR och AI/visionteknik – steg 2: Slutrapport
Show others...
2025 (Swedish)Report (Other academic)
Abstract [sv]

Detta projekt kretsade kring två huvudspår för automatisk timmermätning. Den första delen handlade om att använda AI för automatisk objektdetektion vid stockmätning i sågverk. Bilder erhölls från två kameravinklar i sågverket Bygdsiljum, en vy som visar ändytor och en annan som visar mantelytor på stockarna. Dessa bilder hade sedan tidigare annoterats med märkningar som anger träslag (t.ex. gran eller tall), och även ett mycket litet antal andra typer av egenskaper (såsom vissa sällanfel). Målet var att förbättra en befintlig AI-baserad objektdeteksionsmodell (YOLOv7) genom att anpassa den bättre till sågverkets specifika miljö. Genom att experimentera med bland annat utökad träningstid och så kallad ” mosaic-augmentering” förbättrades modellens precision avsevärt relativt de experiment som tidigare gjorts inom ramen för detta ändamål, särskilt när det kommer till att skilja mellan gran och tall. Även tester med varierande mängder träningsdata visade att mer data kan förbättra resultaten, men att effekten avtar efter en viss punkt. Projektet testade också en unifierad modell som kan hantera båda kameravinklar samtidigt. Denna modell presterade stabilt och visade att det är möjligt att effektivt kombinera data från olika perspektiv. Modellen visade sig främst fungera i sågverksmiljön, men presterade sämre i en mer generell “skogsmiljö” (utomhus), vilket inte är förvånande. En av de huvudsakliga slutsatserna utifrån resultaten är att AI kan användas som ett hjälpmedel för att underlätta och snabba upp ytterligare annoteringsarbete i framtiden, vilket i sin tur kan ge upphov till modeller som presterar tillräckligt bra för sökta ändamål.

Den andra delen handlade om att undersöka användningen av hyperspektral avbildning med NIR för att upptäcka defekter (skogsröta och blånad) och klassificera träslag. Modeller utvecklades för att förutsäga olika typer av defekter. Gran- och tallprover, med olika grader av skogsröta samt blånad, samlades in från sågverk för att skannas och analyseras.

Proverna skannades med två kamerasystem, SWIR och VIS-NIR, men det är ännu oklart om de resulterande modellerna är tillräckligt bra för att implementeras i sågverksmiljö. SWIR-kameran har sannolikt mycket goda möjligheter att detektera träslag och barkförekomst. Även detektion av defekt respektive frisk ved kan sannolikt genomföras, men möjligheten att klassa defekterna som skogsröta och blånad är sämre.

De flesta testerna har genomförts på en renkapad yta, vilket är en brist. Hur bra systemet fungerar på smutsiga ytor behöver utredas ytterligare. De prediktioner som gjorts på smutsiga ytor är i nuläget inte tillräckligt bra, vilket till viss del är naturligt. Om stockänden är täckt med ett lager jord/lera så är det svårt att hitta defekterna. Man kan ev göra det om inträngningsdjupet är tillräckligt, men det är tveksamt om det är det.

Om resultaten är tillräckligt bra för att gå vidare och implementera en pilotuppställning beror också på kraven på systemet. Om det räcker med att defekter hittas utan att behöva klassificera dem i skogsröta och blånad, samt att kraven på hur stor del av ytan som är angripen är rimliga, så är det troligen fullt möjligt att ta ett steg till och skapa ytterligare ett projekt där systemet praktiskt testas i sågverksmiljö. I ett sådant projekt kan man dels få svar på praktiska svårigheter med mätmiljön, men det ger också en plattform för att samla mer data och bygga robustare modeller. I så fall måste det finnas enkla och effektiva stöd för annotering av defekter. På så sätt kan mer data samlas in, praktiska omständigheter testas och det kan eventuellt leda till ett fungerande system.

Place, publisher, year, edition, pages
Träcentrum Norr, 2025
Series
Träcentrum Norr
National Category
Computer and Information Sciences
Identifiers
urn:nbn:se:ri:diva-78521 (URN)
Available from: 2025-05-18 Created: 2025-05-18 Last updated: 2025-09-23Bibliographically approved
Zec, E. L., Ekblom, E., Willbo, M., Mogren, O. & Girdzijauskas, S. (2022). Decentralized adaptive clustering of deep nets is beneficial for client collaboration. In: : . Paper presented at International Workshop on Trustworthy Federated Learning 2022.
Open this publication in new window or tab >>Decentralized adaptive clustering of deep nets is beneficial for client collaboration
Show others...
2022 (English)Conference paper, Published paper (Refereed)
Abstract [en]

We study the problem of training personalized deep learning models in a decentralized peer-to-peer setting, focusing on the setting where data distributions differ between the clients and where different clients have different local learning tasks. We study both covariate and label shift, and our contribution is an algorithm which for each client finds beneficial collaborations based on a similarity estimate for the local task. Our method does not rely on hyperparameters which are hard to estimate, such as the number of client clusters, but rather continuously adapts to the network topology using soft cluster assignment based on a novel adaptive gossip algorithm. We test the proposed method in various settings where data is not independent and identically distributed among the clients. The experimental evaluation shows that the proposed method performs better than previous state-of-the-art algorithms for this problem setting, and handles situations well where previous methods fail

National Category
Computer Sciences
Identifiers
urn:nbn:se:ri:diva-62529 (URN)
Conference
International Workshop on Trustworthy Federated Learning 2022
Available from: 2023-01-13 Created: 2023-01-13 Last updated: 2025-09-23Bibliographically approved
Martinsson, J., Willbo, M., Pirinen, A., Mogren, O. & Sandsten, M. (2022). Few-shot bioacoustic event detection using a prototypical network ensemble with adaptive embedding functions. In: : . Paper presented at Detection and Classification of Acoustic Scenes and Events 2022, DCASE 2022.
Open this publication in new window or tab >>Few-shot bioacoustic event detection using a prototypical network ensemble with adaptive embedding functions
Show others...
2022 (English)Conference paper, Published paper (Refereed)
Abstract [en]

In this report we present our method for the DCASE 2022 challenge on few-shot bioacoustic event detection. We use an ensemble of prototypical neural networks with adaptive embedding functions and show that both ensemble and adaptive embedding functions can be used to improve results from an average F-score of 41.3% to an average F-score of 60.0% on the validation dataset.

Keywords
Machine listening, bioacoustics, few-shot learning, ensemble
National Category
Natural Language Processing
Identifiers
urn:nbn:se:ri:diva-62530 (URN)
Conference
Detection and Classification of Acoustic Scenes and Events 2022, DCASE 2022
Available from: 2023-01-13 Created: 2023-01-13 Last updated: 2025-09-23Bibliographically approved
Martinsson, J., Willbo, M., Pirinen, A., Mogren, O. & Sandsten, M. (2022). FEW-SHOT BIOACOUSTIC EVENT DETECTION USING AN EVENT-LENGTH ADAPTED ENSEMBLE OF PROTOTYPICAL NETWORKS. In: : . Paper presented at Detection and Classification of Acoustic Scenes and Events 2022. 3–4 November 2022, Nancy, France.
Open this publication in new window or tab >>FEW-SHOT BIOACOUSTIC EVENT DETECTION USING AN EVENT-LENGTH ADAPTED ENSEMBLE OF PROTOTYPICAL NETWORKS
Show others...
2022 (English)Conference paper, Published paper (Refereed)
Abstract [en]

In this paper we study two major challenges in few-shot bioacoustic event detection: variable event lengths and false-positives. We use prototypical networks where the embedding function is trained using a multi-label sound event detection model instead of using episodic training as the proxy task on the provided training dataset. This is motivated by polyphonic sound events being present in the base training data. We propose a method to choose the embedding function based on the average event length of the few-shot examples and show that this makes the method more robust towards variable event lengths. Further, we show that an ensemble of prototypical neural networks trained on different training and validation splits of time-frequency images with different loudness normalizations reduces false-positives. In addition, we present an analysis on the effect that the studied loudness normalization techniques have on the performance of the prototypical network ensemble. Overall, per-channel energy normalization (PCEN) outperforms the standard log transform for this task. The method uses no data augmentation and no external data. The proposed approach achieves a F-score of 48.0% when evaluated on the hidden test set of the Detection and Classification of Acoustic Scenes and Events (DCASE) task 5

Keywords
Machine listening, bioacoustics, few-shot learning, ensemble
National Category
Computer Sciences
Identifiers
urn:nbn:se:ri:diva-62540 (URN)
Conference
Detection and Classification of Acoustic Scenes and Events 2022. 3–4 November 2022, Nancy, France
Available from: 2023-01-16 Created: 2023-01-16 Last updated: 2025-09-23Bibliographically approved
Organisations
Identifiers
ORCID iD: ORCID iD iconorcid.org/0009-0004-1803-4193

Search in DiVA

Show all publications