Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Uncertainty Detection as Approximate Max-Margin Sequence Labelling
RISE., Swedish ICT, SICS.
RISE., Swedish ICT, SICS.ORCID-id: 0000-0001-6949-6380
Visa övriga samt affilieringar
2010 (Engelska)Ingår i: Proceedings of the Fourteenth Conference on Computational Natural Language Learning, 2010, 12Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

This paper reports experiments for the CoNLL 2010 shared task on learning to detect hedges and their scope in natural language text. We have addressed the experimental tasks as supervised linear maximum margin prediction problems. For sentence level hedge detection in the biological domain we use an L1-regularised binary support vector machine, while for sentence level weasel detection in the Wikipedia domain, we use an L2-regularised approach. We model the in-sentence uncertainty cue and scope detection task as an L2-regularised approximate maximum margin sequence labelling problem, using the BIO-encoding. In addition to surface level features, we use a variety of linguistic features based on a functional dependency analysis. A greedy forward selection strategy is used in exploring the large set of potential features. Our official results for Task 1 for the biological domain are 85.2 F1-score, for the Wikipedia set 55.4 F1-score. For Task 2, our official results are 2.1 for the entire task with a score of 62.5 for cue detection. After resolving errors and final bugs, our final results are for Task 1, biological: 86.0, Wikipedia: 58.2; Task 2, scopes: 39.6 and cues: 78.5.

Ort, förlag, år, upplaga, sidor
2010, 12.
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:ri:diva-23722OAI: oai:DiVA.org:ri-23722DiVA, id: diva2:1042799
Konferens
CoNLL 2010, July 2010, Uppsala, Sweden
Projekt
DISTRESS
Forskningsfinansiär
VetenskapsrådetTillgänglig från: 2016-10-31 Skapad: 2016-10-31 Senast uppdaterad: 2025-09-23Bibliografiskt granskad

Open Access i DiVA

fulltext(170 kB)83 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 170 kBChecksumma SHA-512
761787015325a85b3fa4436373427a9b17f468e63922c8921247ab9e29d8fcbf521bdb66890941338250c1b3280512898984a102b2514e2a906ca659700a9505
Typ fulltextMimetyp application/pdf

Sök vidare i DiVA

Av författaren/redaktören
Eriksson, GunnarKarlgren, Jussi
Av organisationen
SICS
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 84 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 70 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf