Bloggfærslur mánaðarins, október 2012
1.10.2012 | 09:33
Íslenskan, talgervilinn og við
Íslenska kemur næstverst út í könnun á stuðningi við máltækni í þrjátíu evrópskum tungumálum. Íslenskan gæti verið að deyja út eða verða að tungumáli sem einungis er notað á takmörkuðum sviðum. Það mun ekki verða hægt að nota íslensku á mörgum sviðum tölvutækninnar á komandi árum ef stuðningur við máltækni verður ekki bættur. Þetta kemur fram í viðamikilli hvítbók sem birt var á Degi evrópskra tungumála 26 september. Könnunina má nálgast á http://www.meta-net.eu /whitepapers
Íslenskan í næstneðsta sæti
Megintilgangurinn með könnuninni var að komast að því hvernig þessi tungumál væru búin undir notkun í tölvu og upplýsingatækni, hvað væri til af til dæmis vélrænum þýðingum, talgervlum, talgreinum, leiðréttingaforritum, orðasöfnum og slíku. Niðurstöðurnar sýna að ekki er nægjanlega mikið gert fyrir bróðurpart tungumálanna. "Íslenska er með þeim verstu, hún var í næstneðsta sæti", var haft eftir Eiríki Rögnvaldssyni, prófessor í íslensku við HÍ sem vann að íslenska hluta skýrslunnar.
Í ljós kom að lítill sem enginn stuðningur er við vélþýðingar í íslensku. Einnig að lítið væri til af orða- og hljóðsöfnum, leiðréttingaforritum og talvinnslu. Staða talvinnslunnar hefur þó batnað lítillega á síðustu vikum með tilkomu nýja íslenska Google-talgreinisins og talgervils Blindrafélagsins.
Vitundarvakningar er þörf
Stjórnvöld, viðskiptalífið og almenningur þurfa að vakna til vitundar um þessa stöðu. Íslenskan er okkar dýrmætasta sameign og við berum öll ábyrgð þegar kemur að því að verja móðurmálið okkar. Þeir tímar eru að renna upp að við notum tölvur til þess að stjórna öllum tækjum, tölvur eru í öllu, farsímum, heimilistækjum, bílum og svo framvegis. Mikið af tölvubúnaði er í dag stjórnað með töluðu máli og sú þróun mun aukast hratt í nánustu framtíð. Ef við getum ekki talað íslensku við tölvubúnað sem við notum á hverjum degi, hvaða tungumál munum við þá nota og hvaða áhrif mun það hafa á stöðu íslenskunnar á næstu 10-20 árum?
Vegna þess hversu fáir tala íslensku munu máltækniverkfæri ekki verða framleidd fyrir íslensku nema til komi frumkvæði aðila sem láta sig málið varða og taka á því fjárhagslega ábyrgð. Í tilvikum tungumála sem fáir tala verða máltækniverkfæri og lausnir aldrei samkeppnisvara á markaði. Vegna ríkra hagsmuna félagsmanna þá ákvað Blindrafélagið að taka frumkvæði og fjármagnaði smíði á nýjum íslenskum talgervli. Kostnaðurinn var 85 milljónir íslenskra króna. Margir aðilar komu að verkefninu með félaginu, aðilar sem lögðu til faglega þekkingu og mikilvæg gögn, svo sem eins og Máltæknisetur, og aðilar sem lögðu til fjármagn, eins og Lions-hreyfingin á Íslandi og hið opinbera, svo dæmi séu tekin. Frekari upplýsingar um verkefnið: http://www.blind.is/verkefni/talgervlaverkefnid/
Mikilvægi sjálfbærni og áframhaldandi þróunar
Til að stuðla að því að nýi íslenski talgervillinn verði þróaður áfram, bæði hvað varðar framburð, hlustunargæði og að hann geti í framtíðinni unnið á þeim tölvubúnaði og stýrikerfum sem eru í notkun á hverjum tíma, þá þarf að tryggja sjálfbærni talgervilsverkefnisins. Það verður einungis gert með því að greitt verði fyrir notkun á verkfærum talgervilsins, eins og veflesarans, hraðbankaradda, símsvörunarradda og annarra verkfæra sem tilheyra talgervlinum. Hið opinbera og stofnanir þess, netmiðlar, fyrirtæki og félagasamtök munu ráða úrslitum um það hvort nýi íslenski talgervillinn muni geta þjónað íslenskunni sem mikilvægt máltækniverkfæri á næstu árum, eða hvort þessi nýi talgervill muni daga uppi sem úrelt máltækniverkfæri, eins og gerðist með forvera hans. Tómlæti í þessum efnum er ekki valkostur ef íslenskan á að lifa af í því tæknivædda upplýsingasamfélagi sem hefur hafið innreið sína.
Íslenskan í næstneðsta sæti
Megintilgangurinn með könnuninni var að komast að því hvernig þessi tungumál væru búin undir notkun í tölvu og upplýsingatækni, hvað væri til af til dæmis vélrænum þýðingum, talgervlum, talgreinum, leiðréttingaforritum, orðasöfnum og slíku. Niðurstöðurnar sýna að ekki er nægjanlega mikið gert fyrir bróðurpart tungumálanna. "Íslenska er með þeim verstu, hún var í næstneðsta sæti", var haft eftir Eiríki Rögnvaldssyni, prófessor í íslensku við HÍ sem vann að íslenska hluta skýrslunnar.
Í ljós kom að lítill sem enginn stuðningur er við vélþýðingar í íslensku. Einnig að lítið væri til af orða- og hljóðsöfnum, leiðréttingaforritum og talvinnslu. Staða talvinnslunnar hefur þó batnað lítillega á síðustu vikum með tilkomu nýja íslenska Google-talgreinisins og talgervils Blindrafélagsins.
Vitundarvakningar er þörf
Stjórnvöld, viðskiptalífið og almenningur þurfa að vakna til vitundar um þessa stöðu. Íslenskan er okkar dýrmætasta sameign og við berum öll ábyrgð þegar kemur að því að verja móðurmálið okkar. Þeir tímar eru að renna upp að við notum tölvur til þess að stjórna öllum tækjum, tölvur eru í öllu, farsímum, heimilistækjum, bílum og svo framvegis. Mikið af tölvubúnaði er í dag stjórnað með töluðu máli og sú þróun mun aukast hratt í nánustu framtíð. Ef við getum ekki talað íslensku við tölvubúnað sem við notum á hverjum degi, hvaða tungumál munum við þá nota og hvaða áhrif mun það hafa á stöðu íslenskunnar á næstu 10-20 árum?
Vegna þess hversu fáir tala íslensku munu máltækniverkfæri ekki verða framleidd fyrir íslensku nema til komi frumkvæði aðila sem láta sig málið varða og taka á því fjárhagslega ábyrgð. Í tilvikum tungumála sem fáir tala verða máltækniverkfæri og lausnir aldrei samkeppnisvara á markaði. Vegna ríkra hagsmuna félagsmanna þá ákvað Blindrafélagið að taka frumkvæði og fjármagnaði smíði á nýjum íslenskum talgervli. Kostnaðurinn var 85 milljónir íslenskra króna. Margir aðilar komu að verkefninu með félaginu, aðilar sem lögðu til faglega þekkingu og mikilvæg gögn, svo sem eins og Máltæknisetur, og aðilar sem lögðu til fjármagn, eins og Lions-hreyfingin á Íslandi og hið opinbera, svo dæmi séu tekin. Frekari upplýsingar um verkefnið: http://www.blind.is/verkefni/talgervlaverkefnid/
Mikilvægi sjálfbærni og áframhaldandi þróunar
Til að stuðla að því að nýi íslenski talgervillinn verði þróaður áfram, bæði hvað varðar framburð, hlustunargæði og að hann geti í framtíðinni unnið á þeim tölvubúnaði og stýrikerfum sem eru í notkun á hverjum tíma, þá þarf að tryggja sjálfbærni talgervilsverkefnisins. Það verður einungis gert með því að greitt verði fyrir notkun á verkfærum talgervilsins, eins og veflesarans, hraðbankaradda, símsvörunarradda og annarra verkfæra sem tilheyra talgervlinum. Hið opinbera og stofnanir þess, netmiðlar, fyrirtæki og félagasamtök munu ráða úrslitum um það hvort nýi íslenski talgervillinn muni geta þjónað íslenskunni sem mikilvægt máltækniverkfæri á næstu árum, eða hvort þessi nýi talgervill muni daga uppi sem úrelt máltækniverkfæri, eins og gerðist með forvera hans. Tómlæti í þessum efnum er ekki valkostur ef íslenskan á að lifa af í því tæknivædda upplýsingasamfélagi sem hefur hafið innreið sína.