О проекте
История
ЯРП разрабатывается с 2006 года Вадимом Смоленским на основе японско-русского
компьютерного словаря иероглифов ЯРКСИ. Из ЯРКСИ взята словарная база,
расширенная и оптимизированная для узких задач машинного перевода, и некоторые программные процедуры. В 2008
году к проекту подключился Всеволод Алексеев, изготовивший для переводчика сетевую оболочку. С 1-го февраля
2009 года сайт http://www.yarp-online.ru открыт для посетителей.
Идеология
В основе проекта лежит та простая идея, что машинный перевод – покуда не наступила эра победившего искусственного
интеллекта – не может соревноваться по качеству с переводом, выполненным человеком. Серьезные искажения смысла
неизбежны, тем более при переводе с такого сложного языка, как японский. Тем не менее, надлежащая организация
сервиса может и должна максимально скомпенсировать искажающий эффект, позволяя недостаточно знакомому (или вовсе
незнакомому) с японским языком человеку пробиваться к смыслу даже тогда, когда предлагаемая русская фраза
изначального смысла не передает. Этой цели служит грамматический разбор, словарные гиперссылки и другие дополнительные
функции, которые постоянно будут добавляться.
Реализация
В своем программном ядре ЯРП следует наиболее распространенной схеме машинного перевода: сначала (на этапе
анализа) программа строит внутреннее представление исходной японской фразы: делит ее на лексемы, для каждой
определяет грамматические характеристики и берет из словарной базы русский эквивалент. Затем (на этапе синтеза)
по русским синтаксическим моделям строится выходная фраза.
К собственно переводу ЯРП прилагает подробный грамматический разбор японского текста. Эта функция предназначена,
во-первых, для помощи изучающим японский язык, а во-вторых, для анализа возможных искажений смысла.
ЯРП развивается в тесной связи с сетевой версией ЯРКСИ. С версии 022,
для слов и отдельных иероглифов, встреченных во входном тексте и включенных в разбор, можно выводить их
полные толкования и словарные статьи.
Планы
Проект продолжает интенсивно развиваться. Помимо наполнения словарной базы и совершенствования программного ядра,
большое внимание будет уделяться дополнительным интерактивным функциям. В их числе:
- Альтернативные разбиения текстовых блоков
- Генерация возможных прочтений нераспознанной катаканы
- Опции пользовательской разметки для повторного перевода
- Дополнительные словарные базы, наполняемые самими пользователями
- Задание контекста
Доступ
ЯРП задуман как коммерческий проект. Выручаемые от него средства должны помочь авторам продолжать
работу над ЯРКСИ (база данных которого служит основой для словарной базы ЯРПа), а также совершенствовать
алгоритмы перевода и функции сетевого сервиса.
С 9-го марта бесплатный доступ к сервису предоставляется с ограничениями. Подробности -
на странице "Условия".
