Orðskipting



Orðskiptingar er pakki með þremur skrám með upplýsingum um hvernig á að skipta íslenskum orðum milli lína.



NOTA ORÐSKIPTINGAR

• Sækja Orðskiptingar hér. Með CC BY 4.0 leyfi.


Um Orðskiptingar


Þessi síða er í vinnslu

Yfirlit

Í pakkanum eru þrjár skrár: (1) skipti.listi hefur 203.964 orð í stafrófsröð, eitt orð í línu. Sýnt er með bandstriki hvar í orðinu mega vera skil milli lína; (2) hyphen.is er mynsturskrá sem er búin til upp úr orðalistanum. Mynsturskráin er notuð í orðskiptiforriti fyrir TeX, groff, OpenOffice og LibreOffice; 3) hyph_is-1.0.oxt er skrá sem má sækja á http://extensions.openoffice.org/en/project/icelandic-hyphenation-dictionary. Endingin .oxt stendur fyrir "OpenOffice Extension". Ef skrá með endinguna .oxt er opnuð í OpenOffice eða LibreOffice er hún sett inn sem viðbót í viðkomandi forrit.


Efnisöflun og úrvinnsla

Orðalistinn byggist á uppflettiorðum úr Íslensk-danskri orðabók Sigfúsar Blöndals. Orðin voru tölvuskráð Íslenskri málstöð á miðjum 9. áratug síðustu aldar. Einnig eru í listanum orð úr stafrænum textum (skáldsögum, blaðagreinum o.þ.h.) sem Baldur Jónsson prófessor (1930-2009) hafði safnað. Byrjað var á að skipta um 10.000 orðum með sérstöku forriti og orðskiptingar síðan leiðréttar handvirkt. Niðurstaða þeirrar vinnu var notuð til þess að búa til reglur til þess að skipta næsta skammti sem síðan var leiðréttur handvirkt. Þannig var haldið áfram uns öllum orðum hafði verið skipt. Ýmsir unnu við yfirferð vélrænu skiptingarinnar en Baldur átti sjálfur síðasta orðið um það hvernig hverju orði væri skipt milli lína og fór yfir allan orðalistann í lokin.

Magnús Gíslason sá um alla forritun. Magnús bjó til orðskiptiforrit sem notaði gögnin og algrím sem byggist á doktorsritgerð Frank M. Liang, Word Hy-phen-a-tion by Com-put-er. Forritið var upphaflega gert til þess að nota með TeX-umbrotsforritinu. Magnús gerði einnig forrit fyrir DOS-stýrikerfið sem fór yfir skrár frá WordPerfect-ritvinnsluforritinu. Árið 2009 gerði Magnús íauka fyrir OpenOffice og LibreOffice sem má sækja á http://extensions.openoffice.org/en/project/icelandic-hyphenation-dictionary.

Aðstandendur og fjármögnun

Verkið var unnið á miðjum 9. áratug 20. aldar í Íslenskri málstöð (sem nú er hluti af Stofnun Árna Magnússonar í íslenskum fræðum). Magnús Gíslason og Baldur Jónsson höfðu veg og vanda af verkefninu en ýmsir tóku þátt í að fara yfir orðskiptingar.





Hafið samband
Sigrún Helgadóttir
Verkefnisstjóri
Stofnun Árna Magnússonar í íslenskum fræðum
Skrifstofa: Neshaga 16
Vinnusími: 525 4434
Fax: +354-562-7242
Netfang: sigruhel [hjá] hi.is
Veffang: http://www3.hi.is/~sigruhel/