Все новости от 22 января 2008 г. ЕС предлагает разработчикам ресурсы по машинному переводу
Европейская Комиссия предложила разработчикам ПО перевода бесплатный доступ почти к миллиону переведенных предложений на 22 из 23 официальных языков Евросоюза. ЕК надеется, что эти данные помогут повысить качество разнообразных языковых инструментов, включая программы проверки грамматики и орфографии, онлайновые словари и автоматические переводчики — особенно на менее распространенных языках, таких как Латвийский или Румынский.
Предложения взяты главным образом из Acquis Communautaire, свода законов, который должен быть принят всеми новыми членами ЕС и включает договоры, директивы и постановления ЕС, а также решения Европейского суда.
Эти документы, переведенные профессиональными переводчиками, охватывают такие темы, как информационные технологии, телекоммуникации, трудовой кодекс, сельское хозяйство и право рыбной ловли.
Переводы этих предложений образуют часть «памяти переводов», используемой 1750 штатными переводчиками Комиссии, снабжены признаками предметной классификации и в точности совпадают для каждого из 22 языков. Это делает их особенно полезными для разработчиков ПО статистического машинного перевода, которым нужно собрать корпус из тысяч совпадающих фраз на разных языках, чтобы затем можно было найти наиболее вероятный перевод любой заданной фразы. Так как предложения уже совпадают, разработчики сэкономят массу времени — а гигантский размер Acquis Communautaire поможет им получать более точные результаты вычислений.
До сих пор разработчики обычно разыскивали в вебе тексты, переведенные на несколько языков, и пользовались другими программными инструментами, чтобы определять начало и конец предложений и совмещать их.
Предоставляя эти данные в распоряжение разработчиков, Комиссия не совсем бескорыстна: она надеется, что доступность лучшего и более дешевого ПО машинного перевода откроет людям, говорящим на «малых» языках ЕС, доступ к онлайновой информации, которая сейчас доступна только носителям широко распространенных языков.
Заинтересованные разработчики могут загрузить тексты с веб-сайта Дирекции по переводу Европейской Комиссии. Им понадобится также программа для извлечения текста и ее библиотека.
Предыдущие публикации:
| ast - tron84mail.ru 23 Jan 2008 2:18 AM |
Ссылка на софт должна быть http://wt.jrc.it/lt/Acquis/DGT_TU_1.0/ExtractionTool/ |
|
|