О проекте
История
ЯРП разрабатывается с 2006 года Вадимом Смоленским на основе японско-русского компьютерного словаря иероглифов ЯРКСИ. Из ЯРКСИ взята словарная база, расширенная и оптимизированная для узких задач машинного перевода, и некоторые программные процедуры. В 2008 году к проекту подключился Всеволод Алексеев, изготовивший для переводчика сетевую оболочку. С 1-го февраля 2009 года сайт http://www.yarp-online.ru открыт для посетителей.
Идеология
В основе проекта лежит та простая идея, что машинный перевод – покуда не наступила эра победившего искусственного интеллекта – не может соревноваться по качеству с переводом, выполненным человеком. Серьезные искажения смысла неизбежны, тем более при переводе с такого сложного языка, как японский. Тем не менее, надлежащая организация сервиса может и должна максимально скомпенсировать искажающий эффект, позволяя недостаточно знакомому (или вовсе незнакомому) с японским языком человеку пробиваться к смыслу даже тогда, когда предлагаемая русская фраза изначального смысла не передает. Этой цели служит грамматический разбор, словарные гиперссылки и другие дополнительные функции, которые постоянно будут добавляться.
Реализация
В своем программном ядре ЯРП следует наиболее распространенной схеме машинного перевода: сначала (на этапе анализа) программа строит внутреннее представление исходной японской фразы: делит ее на лексемы, для каждой определяет грамматические характеристики и берет из словарной базы русский эквивалент. Затем (на этапе синтеза) по русским синтаксическим моделям строится выходная фраза.
ЯРП развивается в тесной связи с сетевой версией ЯРКСИ. С версии 022, для слов и отдельных иероглифов, встреченных во входном тексте и включенных в разбор, можно выводить их полные толкования и словарные статьи.
Планы
Проект продолжает интенсивно развиваться. Помимо наполнения словарной базы и совершенствования программного ядра, большое внимание будет уделяться дополнительным интерактивным функциям. В их числе:
- Альтернативные разбиения текстовых блоков
- Генерация возможных прочтений нераспознанной катаканы
- Опции пользовательской разметки для повторного перевода
- Дополнительные словарные базы, наполняемые самими пользователями
- Задание контекста
Доступ
ЯРП задуман как коммерческий проект. Выручаемые от него средства должны помочь авторам продолжать работу над ЯРКСИ (база данных которого служит основой для словарной базы ЯРПа), а также совершенствовать алгоритмы перевода и функции сетевого сервиса.
С 9-го марта бесплатный доступ к сервису предоставляется с ограничениями. Подробности -
на странице "Условия".
