Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Automatic bilingual lexicon acquisition using random indexing of aligned bilingual data
RISE - Research Institutes of Sweden, ICT, SICS.ORCID-id: 0000-0001-5100-0535
2004 (Engelska)Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

This paper presents a very simple and effective approach to automatic bilingual lexicon acquisition. The approach is cooccurrence-based, and uses the Random Indexing vector space methodology applied to aligned bilingual data. The approach is simple, efficient and scalable, and generate promising results when compared to a manually compiled lexicon. The paper also discusses some of the methodological problems with the prefered evaluation procedure.

Ort, förlag, år, upplaga, sidor
2004, 1.
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:ri:diva-22357OAI: oai:DiVA.org:ri-22357DiVA, id: diva2:1041902
Konferens
Fourth International conference on Language Resources and Evaluation (LREC 2004), 26-28 May 2004, Lisbon, Portugal
Tillgänglig från: 2016-10-31 Skapad: 2016-10-31 Senast uppdaterad: 2018-08-21Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Person

Sahlgren, Magnus

Sök vidare i DiVA

Av författaren/redaktören
Sahlgren, Magnus
Av organisationen
SICS
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 31 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf