Системы анализа и обработки данных

СИСТЕМЫ АНАЛИЗА И ОБРАБОТКИ ДАННЫХ

ISSN (печатн.): 2782-2001          ISSN (онлайн): 2782-215X
English | Русский

Последний выпуск
№2(94) Апрель - Июнь 2024

Разработка предикатной модели выбора лексических значений при переводе на русский жестовый язык на основе семантического словаря В.А. Тузова и системы автоматической обработки текста «Диалинг»

Выпуск № 1 (74) Январь - Март 2019
Авторы:

Кагиров Ильдар Амирович,
Мануева Юлия Сергеевна
DOI: http://dx.doi.org/10.17212/1814-1196-2019-1-41-60
Аннотация

Рассмотрены существующие системы семантического анализа русского языка: многоцелевой лингвистический процессор «ЭТАП-3», технология ABBYY Compreno, технология Texterra, статистические и нейросетевые подходы в «Яндекс Переводчике» и «Google Переводчике». На основе анализа преимуществ и недостатков рассмотренных систем сделан вывод о необходимости разработки системы семантического анализа для повышения качества перевода и внедрения в систему перевода со звучащего русского языка на русский жестовый язык «Сурдофон». Целью данной статьи является описание разработанной предикатной модели семантического анализа системы компьютерного сурдоперевода русского языка на основе семантического словаря В.А. Тузова. Для определения корректного значения многозначного слова и омонима в предложении применяются система «Диалинг», словарь В.А. Тузова и список жестов русского жестового языка. Рассмотрена модель выбора значения многозначного слова и омонима, основанная на логике предикатов первого порядка. При выполнении семантического анализа предложения значение trueMeaning слова word считается корректным, если предикат P (word, trueMeaning) имеет значение «истина». Для повышения качества перевода и разрешения ситуаций, в которых отсутствует возможность однозначного определения значения многозначного слова, предложен статистический алгоритм на базе корпуса русского языка. Определен критерий оценки корректности найденного значения многозначного слова. Проведен сравнительный анализ разработанного модуля семантического анализа с существующими системами «Яндекс Переводчик» и «Google Переводчик». Сделан вывод, что разработанная система семантического анализа проводит более точный перевод при наличии лексической неоднозначности. Разработанная предикатная модель с учетом статистического алгоритма позволяет в сравнении с семантическим словарем В.А. Тузова решить проблему выбора лексического значения в случае, когда истинны условия для двух и более альтернативных значений. В данной ситуации определяется лучшее сочетание лексических значений по критерию близости к корпусу русского языка.


Ключевые слова: русский жестовый язык, компьютерный сурдоперевод, семантический анализ, предикатная модель, омонимы, статистический анализ

Список литературы

1. Veale T., Conway A. Cross modal comprehension in ZARDOZ an English to sign-language translation system // Proceedings of the Seventh International Workshop on Natural Language Generation. – Kennebunkport, Maine, 1994. – P. 249–252.



2. Andre E. The generation of multimedia presentations // Handbook of Natural Language Processing. – New York: Marcel Dekker, 2000. – Ch. 12. – P. 305–328.



3. Wakefield M. VisiCAST Milestone: final report N IST-1999-10500 / Information Societies Technology. – [S. l.], 10 December 2002. – 97 p.



4. Многоцелевой лингвиcтический процессор ЭТАП-3 [Электронный ресурс]. – URL: http://iitp.ru/ru/ru/researchlabs/922.htm (дата обращения: 22.03.2019).



5. ABBYY Intelligent Search SDK [Электронный ресурс]. – URL: https://www.abbyy.com/ru-ru/isearch/compreno/ (дата обращения: 22.03.2019).



6. TEXTERRA. Технология автоматического построения онтологий и семантического анализа текста [Электронный ресурс]. – URL: http://www.ispras.ru/technologies/texterra/ (дата обращения: 22.03.2019).



7. Яндекс Переводчик. О сервисе [Электронный ресурс]. – URL: https://translate.yandex.ru/about (дата обращения: 22.03.2019).



8. Яндекс. Технологии. Машинный перевод [Электронный ресурс]. – URL: https://yandex.ru/company/technologies/translation/ (дата обращения: 22.03.2019).



9. About Google Translate [Electronic resource]. – URL: https://translate.google.com/intl/en/about/ (accessed: 22.03.2019).



10. Baldwin R. Google introduces Google Translate Chrome Extension for inline translations of text [Electronic resource] // The Next Web. – October 16, 2014. – URL: https://thenextweb.com/google/2014/10/16/google-introduces-google-translate-chrome-extension-inline-translations-text/ (accessed: 22.03.2019).



11. Franz Och, Ph.D., expert in machine learning and machine translation: press release. – La Jolla, CA: Human Longevity, 2014. – 2 p.



12. Och F. Statistical machine translation: foundations and recent advances: tutorial at MT Summit 2005 Phuket, Thailand, September 12, 2005 / Google. – Phuket, 2005. – P. 1–4.



13. Tanner A. Google seeks world of instant translations [Electronic resource] // Thomson Reuters. – 2007. – March 28. – URL: https://www.reuters.com/article/us-google-translate/google-seeks-world-of-instant-translations-idUSN1921881520070328 (accessed: 22.03.2019).



14. Le Q., Schuster M. A neural network for machine translation, at production scale [Electronic resource] // Google Research Blog. – 2016. – September 27. – URL: https://research.googleblog.com/2016/09/a-neural-network-for-machine.html (accessed: 22.03.2019).



15. MT on and for the Web / C. Boitet, H. Blanchon, M. Seligman, V. Bellynck // Proceedings of the 6th International Conference on Natural Language Processing and Knowledge Engineering (NLPKE-2010). – IEEE, 2010. – P. 1–10.



16. Разработка словаря сибирского диалекта русского жестового языка: учебное пособие / А.А. Бертик, М.Г. Гриф, С.В. Елфимова, О.О. Королькова. – Новосибирск: Изд-во НГТУ, 2013. – 63 с.



17. Сокирко А.В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ): дис. … канд. техн. наук: 05.12.17. – М., 2001. – 88 с.



18. Ткачева Т.А., Ахмедышева Н.А. Жестовый язык глухих как особая знаковая коммуникативная система (на материале русского и французского жестовых языков) // Приоритеты и интересы современного общества: материалы Международной научно-практической конференции. – Астрахань, 2010. – С. 361–365.



19. Тузов В.А. Компьютерная семантика русского языка: учебное пособие. – СПб.: СПбГУ, 2003. – 391 c.



20. Гриф М.Г., Мануева Ю.С., Козлов А.Н. Построение системы компьютерного сурдоперевода русского языка // Труды СПИИРАН. – 2014. – Вып. 6 (37). – С. 170–183. – doi: http://dx.doi.org/10.15622/sp.37.11.



21. Гриф М.Г., Тимофеева М.К. Проблема автоматизации сурдоперевода с позиции прикладной лингвистики // Сибирский филологический журнал. – 2012. – № 1. – С. 211–219.



22. Гриф М.Г. Методы и технологии компьютерного сурдоперевода: учебное пособие. – Новосибирск: Изд-во НГТУ, 2012. – 71 с.



23. Гриф М.Г., Королькова О.О., Мануева Ю.С. Разработка алгоритмического и программного обеспечения выбора значения многозначного слова и омонима в системе компьютерного сурдоперевода русского языка на основе семантической модели // Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. – 2018. – Т. 16, № 3. – С. 32–44.



24. Воскресенский А.Л. Сопоставительное лексикографическое описание слов русского языка и жестов языка глухих России в словаре RuSLED // Компьютерная лингвистика и интеллектуальные технологии. – 2008. – № 7 (14). – С. 91–96.



25. Мельчук И.А. Русский язык в модели Смысл <=> Tекст: учебное пособие. – М.: Языки русской культуры, 1995. – 682 с.

Для цитирования:

Кагиров И.А., Мануева Ю.С. Разработка предикатной модели выбора лексических значений при переводе на русский жестовый язык на основе семантического словаря В.А. Тузова и системы автоматической обработки текста «Диалинг» // Научный вестник НГТУ. – 2019. – № 1 (74). – С. 41–60. – DOI: 10.17212/1814-1196-2019-1-41-60.

 

For citation:

Kagirov I.A., Manueva Yu.S. Razrabotka predikatnoi modeli vybora leksicheskikh znachenii pri perevode na russkii zhestovyi yazyk na osnove semanticheskogo slovarya V.A. Tuzova i sistemy avtomaticheskoi obrabotki teksta "Dialing" [Development of the predicate model for choosing lexical meanings when translating into Russian sign language based on V.А.Tuzov’s semantic dictionary and text processing systems "Dialing"]. Nauchnyi vestnik Novosibirskogo gosudarstvennogo tekhnicheskogo universitetaScience bulletin of the Novosibirsk state technical university, 2019, no. 1 (74), pp. 41–60. DOI: 10.17212/1814-1196-2019-1-41-60.

Просмотров: 2374