Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Evaluating Speech-to-Text Systems and AR-glasses: A study to develop a potential assistive device for people with hearing impairments
RISE Research Institutes of Sweden, Digital Systems, Industrial Systems.
RISE Research Institutes of Sweden, Digital Systems, Industrial Systems.
RISE Research Institutes of Sweden, Digital Systems, Industrial Systems. (Handledare)ORCID iD: 0000-0001-5060-9402
RISE Research Institutes of Sweden, Digital Systems, Industrial Systems. (Handledare)ORCID iD: 0000-0002-2586-9437
Show others and affiliations
2021 (English)Report (Other academic)
Abstract [sv]

Att ha en hörselskada eller att vara döv har flera konsekvenser på individens livskvalité. Det påverkar vardagen i stor utsträckning och gör det svårt att delta i konversationer. Det finns redan flera hjälpmedel för att underlätta vardagen för individer med hörselskador, exempelvis  hörapparater. Dock finns vissa utmaningar och problem med dessa. En möjlig lösning skulle kunna vara att använda Augmented Reality, eller förstärkt verklighet tillsammans med ett tal-till-text-system, där tal skulle kunna konverteras til text som exempelvis presenteras i AR-glasögon. Augmented Reality (AR) är en teknik som möjliggör att förstärka verkligheten genom att  datorgenerande information, till exempel visuella objekt, presenteras ovanpå verkligheten. En variant av en AR-teknologi är AR-glasögon, vilket innebär att datorgenerade objekt presenteras i glasögonen och sedermera förstärker användarens verklighet. Olika varianter av AR och AR-glasögon har studerats länge, men det inte förrän under den senaste tiden som kvalitén blivit tillräckligt bra för att kunna användas i vardagen. Idag finns flera olika AR-glasögon, med olika tekniska, ergonomiska, visuella och optiska egenskaper, där vissa glasögon kan vara mer eller mindre lämpade inom ett visst användningsområde. Glasögonens egenskaper påverkar även användarens upplevelse. Även om tekniken redan finns på marknaden kvarstår vissa problem, exempelvis belysning, bakgrund och att synligheten av de datorgenerade objekten påverkas av förhållanden i omgivningen. Då målet är att presentera text i AR-glasögonen är det viktiga att texten är synlig, läslig1 och läsbar2 under flera olika förhållanden, som varierande belysning och bakgrund. Dessutom bör hänsyn tas till hur texten presenteras, där faktorer som storlek, textfärg, bakgrundsfärg bakom text samt antal rader bör beaktas. Tal-till-text-system är också en teknik som fått genomslag under de senaste åren. Bland annat tack vare de stora framsteg som gjorts inom taligenkänning. På den engelskspråkiga marknaden är tekniken utbredd och det finns flera befintliga system, som Google Cloud Speech API, IBM Watson och Microsoft Azure. På den svenska marknaden finns dock få system och utvärderingar av dessa. Vid utvärderingar av tal-till-text-system bör man ta hänsyn till faktorer som korrekthet, fördröjning och robusthet under olika ljudnivåer, talhastigheter och dialekter. Således bör man utvärdera vilket svenskt tal-till-text-system som är lämpligast att använda för att översätta tal till text med hänsyn till ovannämnda aspekter. I detta examensarbete undersöks hur egenskaperna i två olika AR-glasögon påverkar användarupplevelsen med fokus på komfort, design, samt glasögonens optiska och visuella egenskaper. Vidare undersöks hur belysning och bakgrund påverkar läsligheten och läsbarheten av text, samt hur texten ska presenteras för att resultera i bäst läslighet och läsbarhet. Detta studeras genom användartester, där olika formateringar på texten presenteras under olika belysningar och med olika bakgrund. Detta följs av en kort enkät där deltagarna får besvara frågor gällande textformateringarna. Enkäten innehåller även frågor relaterade till glasögonens egenskaper och hur dessa påverkar användarupplevelsen för att kunna undersöka vilka glasögon som skulle vara mest lämpade för detföreslagna systemet. Avslutande genomförs en marknadsundersökning och litteraturundersökning över befintliga tal-till-text-system på den svenska marknaden. Resultatet från studien visar att belysning och bakgrund påverkar synligheten och sedermera läsligheten av texten som presenteras i glasögonen. Vidare påvisas det att textens formatering, med avseende på textfärg, textbakgrund, antal rader och storlek påverkar läsligheten. Resultatet visar även att AR-glasögonens egenskaper påverkar användarupplevelsen, läsligheten och läsbarheten. Vilka glasögon som är bäst lämpade tycks dock bero på individuella preferenser. Gällande tal-till-text-system, indentifieras fyra stycken som finns tillgängliga på den svenska marknaden. Utifrån utvärderingen av tillgängliga tal-till-text-system rekommenderas Google Cloud Speech API, baserat på tekniska egenskaper, robusthet och tillgänglighet.

Place, publisher, year, edition, pages
2021. , p. 111
Series
RISE Rapport ; 2021:31
National Category
Engineering and Technology
Identifiers
URN: urn:nbn:se:ri:diva-52579DOI: 10.23699/yedh-qn68ISBN: 978-91-89385-16-0 (electronic)OAI: oai:DiVA.org:ri-52579DiVA, id: diva2:1535453
Note

Uppsala Univerity.Master Sci Thesis, Teknisk- naturvetenskaplig fakultet, UTH-enheten. 

Available from: 2021-03-09 Created: 2021-03-09 Last updated: 2024-09-02Bibliographically approved

Open Access in DiVA

fulltext(16042 kB)312 downloads
File information
File name FULLTEXT01.pdfFile size 16042 kBChecksum SHA-512
0438868a4699d635987f528374cc5b5d058a122d91f592a830e50f70444349d838089fd6ccc0eea98adbe7783d4797f5950650d4f62859fa7a0feb936faab2fc
Type fulltextMimetype application/pdf

Other links

Publisher's full text

Authority records

Brunnström, KjellSchenkman, BoAndrén, Börje

Search in DiVA

By author/editor
Brunnström, KjellSchenkman, BoAndrén, Börje
By organisation
Industrial Systems
Engineering and Technology

Search outside of DiVA

GoogleGoogle Scholar
Total: 312 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

doi
isbn
urn-nbn

Altmetric score

doi
isbn
urn-nbn
Total: 451 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf