Две трети от езиците изчезват в интернет
Две трети от езиците в ЕС рискуват да изчезнат от интернет, твърди италианско научно изследване.
Изследването под надслов "Италианският език в цифровата епоха" е дело на Института по компютърна лингвистика към Националния съвет за научни изследвания в Пиза и на фондацията "Бруно Кеслер".
В него са участвали над 200 специалисти, които работят по проекта Meta-Net, като постигнатите от тях резултати до момента са събрани в 30 "бели книги".
От общо 30 анализирани езици 21 са класирани на най-ниско ниво с "липсваща или слаба" поддръжка с програмни продукти в поне една от изследваните области - правописни и граматични коректори, персонални асистенти в смартфоните, системи за автоматичен превод, търсачки и пр.
Исландският, литовският, латвийският и малтийският са на най-ниското ниво във всички области. Сред езиците с висока степен на риск поради "епизодична програмна поддръжка" се нареждат баският, българският, каталонският, гръцкият, унгарският и полският.
Най-високо в класацията стои английският, следван от холандският, френският, немският, италианският и испанският, които са със "скромна програмна поддръжка". Нито един от изследваните езици не попада в категорията "отлична поддръжка".
Италианският е сред застрашените езици, макар че още през 2004 г. са регистрирани онлайн 30.4 милиона души, които ползват този език, предава БТА. Извън пределите на ЕС италиански говорещи са 520 хиляди американци, 200 хиляди швейцарци и 100 хиляди австралийци.
Броят на италианоезичните интернавти обаче остава непроменен за последните пет години, докато значително са се увеличили тези от развиващите се страни, което превръща италианският в пропорционално слабо представен, в сравнение с английския.
Данните са тревожни, защото езиковите технологии, които се използват в интернет, се основават върху статистически подходи и, ако величините за даден език са ниски, веднага се затваря "омагьосаният кръг" - слаби показатели, нискокачествени технологии, растящо ограничаване на употребата на съответния език.
По-голямата част от европейските езици не разполага с достатъчни ресурси, а някои са напълно пренебрегнати. Много от тях нямат бъдеще в интернет, заключава изследването