Open Access BASE2018

Chinese-Russian Parallel Discourse Corpus: Alignment of Clauses and Statistical Analysis ; Китайско-русский параллельный дискурсивный корпус: выравнивание на уровне клаузы и статистический анализ

Abstract

This paper considers the alignment and annotation of Chinese-Russian parallel texts at the level of clauses. For the purpose of the article, the author creates a Chinese-Russian Parallel Discourse Corpus. As its pilot material, the author chooses an official Chinese document, namely, the 2017 Report on the work of the government of the PRC and its Russian translation. The article consists of three parts, in which the author 1) provides a description of the principles of alignment; 2) determines the annotation principles of the units selected and creates a parallel corpus with alignment at the level of clauses; 3) draws a statistic of the types of Russian syntactic analogues of Chinese clauses (RSACCs), and interprets the information received. The first part considers the way in which texts are divided into clauses in the parallel corpus; the author starts with the segmentation of clauses in the Chinese text, and then singles out elements in the Russian translation that are considered RSACCs. In the second part, the author describes the principles of analysis and classification of the Russian syntactic analogues. Overall, there are 9 types of RSACCs: simple sentences, complex sentences, groups of sentences, fragments of simple sentences, fragments of sentences with homogeneous predicates, fragments of complex sentences, parts of asyndetic complex sentences, and parts of complex and compound sentences. In the third part, the author concludes that in the majority of cases, Chinese clauses correspond to single-predicate constructions in the Russian translation; in other cases, Chinese clauses can be translated by means of non-predicative phrases, semi-predicative phrases, and poly-predicative complex sentences and groups of sentences. ; Статья посвящена способам корпусного выравнивания и аннотирования параллельных текстов на уровне клаузы. Работа строится на основе создания китайско-русского дискурсивного параллельного корпуса. В качестве пилотного материала был выбран китайский официальный документ «Доклад о работе правительства КНР 2017» и его перевод на русский язык. Данная работа состоит из трех общих частей: 1) характеристика принципов выравнивания двух текстов; 2) установление принципов аннотирования выделяемых единиц и создание параллельного корпуса, в котором выравнивание осуществляется на уровне клаузы; 3) статистика по разным типам русских синтаксических аналогов китайских клауз и интерпретация полученной информации. В первой части рассматривается, как в параллельном корпусе производится деление текстов на клаузы: сначала сегментация осуществляется в китайском тексте, затем в переводном русском тексте выделяются соответствующие элементы, называемые русскими синтаксическими аналогами (РСА) китайских клауз. Во второй части представлены принципы анализа и классификации РСА. В изученном материале разметки представлены 9 типов РСА китайских клауз: простые предложения, сложные предложения, группы предложений, фрагменты простых предложений, предложений с однородными сказуемыми, сложных предложений, части бессоюзных сложных предложений, сложносочиненных предложений и сложноподчиненных предложений. В третьей части сделаны выводы о том, что в большинстве случаев китайской клаузе может соответствовать монопредикативная конструкция в русском переводе. В других ситуациях китайские клаузы переводятся непредикативными словосочетаниями, полупредикативными причастными и деепричастными оборотами, полипредикативными сложными предложениями и группами предложений.

Problem melden

Wenn Sie Probleme mit dem Zugriff auf einen gefundenen Titel haben, können Sie sich über dieses Formular gern an uns wenden. Schreiben Sie uns hierüber auch gern, wenn Ihnen Fehler in der Titelanzeige aufgefallen sind.