IceWordNet



IceWordNet er íslensk útgáfa af Princeton Core WordNet. Það samanstendur af tæplega fimmþúsund íslenskum þýðingum á orðunum úr kjarnalista Princeton ásamt íslenskum samheitum orðanna.


NOTA ICEWORDNET

• Hægt er að sækja IceWordNet hér. Með CC BY 3.0 leyfi.

Um IceWordNet
IceWordNet er byggt á kjarnalista Princeton WordNet (Princeton Core WordNet).

Princeton WordNet

Princeton WordNet er stór, gagnagrunnur um ensk orð. Nafnorð, sagnir, lýsingarorð og atviksorð eru flokkuð í nokkurs konar samheitamengi sem hvert um sig tjáir ákveðna hugsun. Samheitamengin eru síðan tengd hvert öðru eftir hugtakslegum, merkingarlegum og orðbundnum venslum. WordNet er ekki ósvipað samheitaorðabók en þó er munur þarna á. Fullgert tengir WordNet ekki bara saman orðmyndir heldur einræðir svipuð orð og sýnir að auki hvers konar vensl eru á milli orðanna.

Í kjarnalista WordNet eru ríflega 5000 algengustu orðin úr Princeton-listanum. Hér má nálgast þann lista. Íslenska orðanetið, IceWordNet, er íslensk þýðing á orðunum í kjarnalistanum auk íslenskra samheita orðanna. Enn sem komið er eru eingöngu gefin samheiti en önnur vensl ekki sýnd.

Hvernig var IceWordNet unnið Kjarnalisti Princeton WordNet var sóttur á netið. Síðan voru ensku orðin þýdd yfir á íslensku. Því næst voru samheiti íslensku orðanna skráð eftir bestu getu með hjálp Samheitaorðabókarinnar (Svavar Sigmundsson 1985) og snöru.is. Verkið var unnið af Kristínu M. Jóhannsdóttur.

Næsta skref Æskilegt væri að IceWordNet yrði síðar stækkað til muna og að auk samheita yrðu þarna flest þau vensl sem notuð eru í Princeton WordNet.


Hafið samband
Eiríkur Rögnvaldsson
prófessor í íslenskri málfræði
Íslensku- og menningardeild
Háskóla Íslands, Hugvísindasviði
Skrifstofa: Árnagarði, 415
Vinnusími: +354-525-4403
Fax: +354-525-4242
Netföng: eirikur@hi.is
eirikur.rognvaldsson@gmail.com

Heimildir
Íslensk samheitaorðabók. 1985. Ritstjóri Svavar Sigmundsson. Styrktarsjóður Þórbergs Þórðarsonar og Margrétar Jónsdóttur. Háskóli Íslands, Reykjavík.

Princeton University "About WordNet." WordNet. Princeton University. 2010.