Ontology-supported Text Classification based on Cross-lingual Word Sense Disambiguation

Domenii publicaţii > Ştiinţe informatice + Tipuri publicaţii > Articol în volumul unei conferinţe

Autori: Dan Tufiş, Svetla Koeva

Editorial: F. Masulli, S. Mitra, and G. Pasi, Springer-Verlag Berlin Heidelberg, WILF 2007, LNAI 4578, p.447–, 2007.

Rezumat:

The paper reports on recent experiments in cross-lingual document processing (with a case study for Bulgarian-English-Romanian language pairs) and brings evidence on the benefits of using linguistic ontologies for achieving, with a high level of accuracy, difficult tasks in NLP such as word alignment, word sense disambiguation, document classification, cross-language information retrieval, etc. We provide brief descriptions of the parallel corpus we used, the multilingual lexical ontology which supports our research, the word alignment and word sense disambiguation systems we developed and a preliminary report on an ongoing development of a system for cross-lingual text-classification which takes advantage of these multilingual technologies. Unlike the keyword-based methods in document processing, the concept-based methods are supposed to better exploit the semantic information contained in a particular document and thus to provide more accurate results.

Cuvinte cheie: cross-lingual document classification - multilingual lexical ontology - parallel corpora - word alignment - word sense disambiguation // text classification, cross-lingual sense disambiguation, aligned ontologies

URL: http://www.springerlink.com/content/r95407541831834l/?p=cad9593346e84a0ca2768317f7db1719&pi=55

Dan Tufis
octombrie 3, 2007
Niciun comentariu

Staff Login

Login Id

Password

Dobandirea calitatii de autor prin abuz de autoritate—solicitare de clarificare a exonerarii de la initiatorii legilor

Comunicat Ad-Astra: evoluția publicațiilor științifice ale României (2020–2025) și schimbările structurale ale canalelor editoriale

Comunicat Ad-Astra: Blocajul sistemic al cercetării din România – bilanț CDI 2025.

Inscriere cercetatori

Premii Ad Astra

Ontology-supported Text Classification based on Cross-lingual Word Sense Disambiguation

Întrebări frecvente

Contacteaza-ne

Ajută-ne!

Staff Login

Login Id

Password

Search

Dobandirea calitatii de autor prin abuz de autoritate—solicitare de clarificare a exonerarii de la initiatorii legilor

Comunicat Ad-Astra: evoluția publicațiilor științifice ale României (2020–2025) și schimbările structurale ale canalelor editoriale

Comunicat Ad-Astra: Blocajul sistemic al cercetării din România – bilanț CDI 2025.

Inscriere cercetatori

Premii Ad Astra

Ontology-supported Text Classification based on Cross-lingual Word Sense Disambiguation

Share

Întrebări frecvente

Contacteaza-ne

Ajută-ne!