Понедельник, 9 мартаИнститут «Высшая школа журналистики и массовых коммуникаций» СПбГУ
Shadow

Фактор дискурса в семантической неопределенности обратного машинного перевода медиатекстов

Постановка проблемы

В насто­я­щее вре­мя одним из акту­аль­ных вопро­сов явля­ет­ся про­бле­ма обрат­но­го машин­но­го пере­во­да меди­а­тек­стов с уче­том дис­кур­сив­но­го фак­то­ра. Объектом дан­но­го иссле­до­ва­ния явля­ют­ся семан­ти­че­ская неопре­де­лен­ность и зона напря­жен­но­сти как кон­флик­то­ген­ные фак­то­ры. Как отме­ча­ет в сво­ем дис­сер­та­ци­он­ном иссле­до­ва­нии Н. В. Обелюнас: «…мно­же­ствен­ность и вари­а­тив­ность интер­пре­та­ции в медиа­сфе­ре явля­ют­ся след­стви­ем не толь­ко есте­ствен­ной кон­фликт­но­сти язы­ка, но и осо­бой, диа­ло­гич­ной, струк­ту­ры массово-коммуникационной сфе­ры, кото­рая все­гда пред­по­ла­га­ет нали­чие несколь­ких ком­му­ни­кан­тов: жур­на­ли­ста, созда­ю­ще­го текст и направ­ля­ю­ще­го его на неопре­де­лен­ный круг лиц, и ауди­то­рии, интер­пре­ти­ру­ю­щей создан­ное про­из­ве­де­ние» [Обелюнас 2012: 7]. В пред­ла­га­е­мой ста­тье пред­при­ни­ма­ет­ся попыт­ка выявить вли­я­ние дис­кур­сив­но­го пара­мет­ра на вос­при­я­тие тек­ста чита­те­лем, уста­но­вить пред­по­сыл­ки потен­ци­аль­ных кон­фликт­ных ситу­а­ций на осно­ве свя­зи неопре­де­лен­но­сти и напря­жен­но­сти при машин­ном переводе.

Проблема непо­сред­ствен­но­го про­яв­ле­ния кон­флик­та пред­став­ля­ет собой мате­ри­ал для дру­гой ста­тьи, напи­са­ние кото­рой вклю­ча­ет­ся в пер­спек­ти­вы изу­че­ния фено­ме­на смыс­ло­вой неопре­де­лен­но­сти. Вопросы пони­ма­ния раз­но­об­раз­ных тек­стов при про­яв­ле­нии линг­ви­сти­че­ской дву­смыс­лен­но­сти в машин­ном пере­во­де — это миро­вая тен­ден­ция [Oakhill et al. 2019; Ferreira, Yang 2019], кото­рая явля­ет­ся одной из наи­бо­лее зна­чи­мых для широ­ко­го спек­тра таких меж­дис­ци­пли­нар­ных направ­ле­ний, как медиа­лингвистика [Bigne et al. 2020], юри­слинг­ви­сти­ка [Carney 2023] и т. п. Новизна рабо­ты заклю­ча­ет­ся в сопо­став­ле­нии пра­во­во­го и реклам­но­го дискурсов.

В ходе наших иссле­до­ва­ний рас­смат­ри­ва­ет­ся весь­ма обшир­ный мас­сив пра­во­вых тек­стов при­ро­до­охран­ной тема­ти­ки (в объ­е­ме более 50 тек­стов), а так­же изу­ча­ют­ся меди­а­тек­сты по про­бле­мам эко­ло­гии (в объ­е­ме более 30 тек­стов). В дан­ной ста­тье для апро­ба­ции мето­ди­ки иссле­до­ва­ния пред­став­лен ана­лиз шести тек­стов эко­ло­ги­че­ской направ­лен­но­сти (два тек­ста — зако­но­да­тель­ные, четы­ре — реклам­ные). Правовой дис­курс более кон­сер­ва­ти­вен, тяго­те­ет к одно­знач­но­сти, а реклам­ные тек­сты мно­го­знач­ны и вари­а­тив­ны. При машин­ном пере­во­де семан­ти­че­ская напря­жен­ность меж­ду фор­мой и содер­жа­ни­ем в про­цес­се пони­ма­ния при­во­дит к неяс­но­сти, дву­смыс­лен­но­сти, воз­ник­но­ве­нию потен­ци­аль­ной кон­фликт­ной ситу­а­ции. В этом плане обрат­ный машин­ный пере­вод (ОМП) и срав­не­ние тек­стов на сход­ство явля­ют­ся теми тех­но­ло­ги­я­ми, с помо­щью кото­рых мож­но опре­де­лить фраг­мен­ты смыс­ло­вой неопре­де­лен­но­сти тек­ста как фак­то­ра потен­ци­аль­но­го раз­ви­тия кон­флик­та интерпретаций.

В научно-лингвистическом кон­тек­сте на сего­дняш­ний день осо­бен­но ост­ро вста­ют вопро­сы ком­му­ни­ка­тив­ных неудач при недо­по­ни­ма­нии или интер­пре­та­ции [Muneer, Fati 2020; Isoaho et al. 2021] вви­ду когни­тив­ных, социально-культурных, пси­хо­со­ци­аль­ных или язы­ко­вых раз­ли­чий. Конфликт интер­пре­та­ций пред­став­ля­ет собой зна­чи­мый уро­вень пони­ма­ния (и/или непо­ни­ма­ния, недо­по­ни­ма­ния), кото­рый свя­зан с интен­ци­я­ми авто­ра и адре­са­та. Для изу­че­ния это­го про­цес­са обрат­ный машин­ный пере­вод (ОМП) слу­жит сред­ством для пер­вич­но­го уста­нов­ле­ния зоны кон­флик­та [Голев, Иркова 2023; Иркова 2023].

В ста­тье акцен­ти­ру­ет­ся вни­ма­ние на том, что пере­вод явля­ет­ся позна­ва­тель­ным про­цес­сом, посколь­ку «пере­вод как про­цесс — это созда­ние осо­бо­го вида вто­рич­но­го тек­ста, пред­став­ля­ю­ще­го собой резуль­тат интер­пре­та­ции пере­вод­чи­ком тек­ста на исход­ном язы­ке, кото­рый, в свою оче­редь, явля­ет­ся резуль­та­том про­цес­са язы­ко­вой дея­тель­но­сти авто­ра ори­ги­на­ла, осу­ществ­ля­е­мой в опре­де­лен­ной соци­аль­ной сре­де и в опре­де­лен­ной ком­му­ни­ка­тив­ной ситу­а­ции, т. е. дея­тель­но­сти дис­кур­сив­ной, и отра­жа­ет опре­де­лен­ную интер­пре­та­цию мира» [Петрова 2018: 137]. При этом пози­тив­ная интер­пре­та­ция счи­та­ет­ся эта­пом пони­ма­ния, а нега­тив­ная интер­пре­та­ция может послу­жить пред­по­сыл­кой воз­ник­но­ве­ния кон­флик­та [Рикёр 2008].

В послед­ние годы тех­но­ло­гии искус­ствен­но­го интел­лек­та повсе­мест­но при­ме­ня­ют­ся в фун­да­мен­таль­ной нау­ке, социально-гуманитарных иссле­до­ва­ни­ях [AlThanyyan, Azmi 2021]. В фоку­се наше­го вни­ма­ния нахо­дит­ся спе­ци­фи­ка язы­ко­вой при­ро­ды смыс­ло­вой неопре­де­лен­но­сти медий­но­го1 эко­ло­ги­че­ско­го и при­ро­до­охран­но­го тек­стов. Выбор четы­рех реклам­ных ста­тей о туриз­ме и двух зако­но­да­тель­ных ста­тей в обла­сти осо­бо охра­ня­е­мых при­род­ных тер­ри­то­рий Российской Федерации опре­де­лен их смыс­ло­вой соот­не­сен­но­стью, так как реклам­ный дис­курс не дол­жен про­ти­во­ре­чить эко­ло­ги­че­ско­му [Иванова 2015]. В очер­чен­ном плане дис­кур­сив­ный (функ­ци­о­наль­ный) ана­лиз тек­стов поз­во­ля­ет наи­бо­лее глу­бо­ко оце­нить дина­ми­че­ский про­цесс смыс­ло­об­ра­зо­ва­ния с точ­ки зре­ния нали­чия и (или) отсут­ствия в них мно­го­знач­ных рече­вых еди­ниц, а так­же рас­смот­реть усло­вия порож­де­ния семан­ти­че­ской двой­ствен­но­сти с исполь­зо­ва­ни­ем совре­мен­ных циф­ро­вых тех­но­ло­гий. Данная область иссле­до­ва­ния, на наш взгляд, изу­че­на недо­ста­точ­но. В ста­тье ана­ли­зи­ру­ют­ся тек­сты раз­ных сти­лей и жан­ров (зако­но­да­тель­ная ста­тья и меди­а­тек­сты), кото­рые демон­стри­ру­ют раз­ные сте­пе­ни пере­во­ди­мо­сти при обрат­ном машин­ном переводе.

Представленная тема­ти­ка акту­аль­на, так как свя­за­на с исполь­зо­ва­ни­ем искус­ствен­но­го интел­лек­та в жур­на­лист­ском обра­зо­ва­нии и может быть при­ме­не­на в мето­ди­ке пре­по­да­ва­ния рус­ско­го язы­ка как иностранного.

Цель насто­я­ще­го иссле­до­ва­ния — оцен­ка про­блем­ных зон машин­но­го пере­во­да меди­а­тек­стов с уче­том лек­си­че­ской поли­се­мии. Ключевой зада­чей ста­тьи явля­ет­ся опи­са­ние пред­по­сы­лок воз­мож­ных кон­фликт­ных ситу­а­ций на осно­ве свя­зи неопре­де­лен­но­сти и напря­жен­но­сти при ревер­сив­ном переводе.

История вопроса

В рус­ле науч­ной тра­ди­ции суще­ству­ет широ­кий спектр раз­лич­ных под­хо­дов к фено­ме­ну неопре­де­лен­но­сти и кон­фликт­но­сти. Неопределенность и кон­фликт­ность име­ют раз­ную при­ро­ду. Разнообразные аспек­ты, тема­ти­ки изу­ча­ют­ся мате­ма­ти­ка­ми, фило­со­фа­ми, физи­ка­ми, социо­ло­га­ми, пси­хо­ло­га­ми, юри­ста­ми, линг­ви­ста­ми и мно­ги­ми другими.

Истоки очер­чен­ной про­бле­ма­ти­ки смыс­ло­вой неопре­де­лен­но­сти вос­хо­дят к иссле­до­ва­ни­ям в обла­сти логи­ки и фило­со­фии (тру­ды Л. Витгенштейна [Витгенштейн 1958], Б. Рассела [Рассел 1999], Г. Фреге [Фреге 2008] и мн. др.). В фило­со­фии Платона «неопре­де­лен­ность оли­це­тво­ря­ет измен­чи­вость, несо­вер­шен­ство, хао­тич­ность мате­ри­аль­но­го мира» [Визир, Урсул 1976: 13]. Пути раз­ви­тия фило­соф­ско­го зна­ния рас­кры­ва­ют совре­мен­ные под­хо­ды к пони­ма­нию кон­цеп­та неопре­де­лен­но­сти [Дорожкин, Соколова 2015; Соколова 2018]. Так, напри­мер, в рабо­те [Карабанов 2017] опи­сы­ва­ют­ся иссле­до­ва­ния, в кото­рых неопре­де­лен­ность может высту­пать пара­мет­ром ситу­а­ции, пере­жи­ва­ни­ем, детер­ми­ни­ро­ван­ным лич­ност­ны­ми характеристиками.

В рус­ле том­ской фило­соф­ской шко­лы и тра­ди­ции В. В. Оглезнев и В. А. Суровцев фор­му­ли­ру­ют тезис о неопре­де­лен­но­сти и кон­тек­сту­аль­но­сти содер­жа­ния юри­ди­че­ских поня­тий: «Мы не вла­де­ем изна­чаль­но неко­то­рым общим содер­жа­ни­ем поня­тия, при­ме­ня­е­мо­го затем к раз­ным слу­ча­ям. Как раз наобо­рот, слу­чаи при­ме­не­ния тер­ми­на, в кото­ром выра­же­но поня­тие, долж­ны опре­де­лять его содер­жа­ние» [Оглезнев, Суровцев 2016: 98]. Разноплановые аспек­ты изу­че­ния семан­ти­че­ской диф­фу­зии еще не под­вер­га­лись систем­но­му ана­ли­зу и тре­бу­ют ком­плекс­но­го подхода.

В рам­ках зару­беж­ной линг­ви­сти­че­ской нау­ки пред­став­ле­ны раз­лич­ные направ­ле­ния иссле­до­ва­ний неопре­де­лен­но­сти, кото­рые охва­ты­ва­ют с теоретико-исторической точ­ки зре­ния вопро­сы семан­ти­че­ской неод­но­знач­но­сти, рас­кры­ва­ют логи­че­ские под­хо­ды к свер­хо­це­ноч­но­сти, кон­тек­сту­а­лиз­му, эпи­сте­ми­че­ским тео­ри­ям, вскры­ва­ют осо­бен­но­сти линг­ви­сти­че­ской и семан­ти­че­ской тео­рии [Devos 2003; Shapiro, Snyder 2016; Feinmann 2021; Oyelade et al. 2022]. Широкая направ­лен­ность кон­флик­та интер­пре­та­ций свя­за­на с тру­да­ми уче­ных в рам­ках гер­ме­нев­ти­че­ской мето­до­ло­гии (рабо­ты Ф. Шлейермахера [Schleiermacher 2007]). Исследуется неопре­де­лен­ность как на уровне раз­но­об­раз­ных дис­кур­сов и тек­стов (медий­ных, юри­ди­че­ских, худо­же­ствен­ных, рели­ги­оз­ных и мно­гих дру­гих), так и на уровне отдель­ных рече­вых еди­ниц [Friedman 2017; Khan, Satti 2021]. В ста­тье [Leffel et al. 2019], а так­же в дру­гих пуб­ли­ка­ци­ях пред­став­лен обзор науч­ных кон­цеп­ций, раз­ра­бо­тан­ных зару­беж­ны­ми иссле­до­ва­те­ля­ми. Изучаются интер­пре­та­ции при­ла­га­тель­ных, вза­и­мо­дей­ствия меж­ду неопре­де­лен­но­стью и раз­го­вор­ной импли­ка­ту­рой. Результаты экс­пе­ри­мен­та пока­зы­ва­ют, что исполь­зо­ва­ние при­ла­га­тель­ных с рас­плыв­ча­ты­ми зна­че­ни­я­ми при­во­дит к более про­ти­во­ре­чи­вой интер­пре­та­ции текста.

Неопределенность в зару­беж­ном и оте­че­ствен­ном зако­но­да­тель­стве, поли­ти­че­ская интер­пре­та­ция неод­но­знач­но­сти не оста­ют­ся без вни­ма­ния иссле­до­ва­те­лей. Ученые при­во­дят при­ме­ры того, что счи­та­ет­ся неопре­де­лен­ным в лите­ра­ту­ре; раз­ра­ба­ты­ва­ют мето­ды и кри­те­рии для опре­де­ле­ния пре­ди­ка­тов, тер­ми­нов в пра­ве; опре­де­ля­ют усло­вия воз­ник­но­ве­ния неопре­де­лен­но­сти и ста­ра­ют­ся отли­чить ее от зна­ко­мых семан­ти­че­ских явле­ний [Binder, Fissell 2019; Escher 2019; Bosworth 2020]. Так, напри­мер, в рабо­те [Dowding, Bosworth 2021] пред­ме­том иссле­до­ва­ния авто­ров ста­но­вят­ся дву­смыс­лен­ность и неопре­де­лен­ность юри­ди­че­ско­го язы­ка. Авторами рас­смот­ре­ны спо­со­бы упро­ще­ния поли­ти­че­ско­го тек­ста, в том чис­ле устра­не­ние тер­ми­нов в опре­де­лен­ных контекстах.

Особого вни­ма­ния заслу­жи­ва­ют рабо­ты, посвя­щен­ные неопре­де­лен­но­сти в медий­ных реклам­ных текстах по туриз­му [Nematovna 2023; Chang, Wang 2019]. В них под­чер­ки­ва­ет­ся, что мно­гие вопро­сы, каса­ю­щи­е­ся моде­ли­ро­ва­ния про­цес­са неопре­де­лен­но­сти, оста­ют­ся откры­ты­ми для обсуждения.

Таким обра­зом, сфе­ру инте­ре­сов язы­ко­ве­дов в рам­ках совре­мен­ной зару­беж­ной линг­ви­сти­ки состав­ля­ет изу­че­ние дву­смыс­лен­но­сти в язы­ке и речи (тео­ре­ти­че­ские и при­клад­ные иссле­до­ва­ния неод­но­знач­но­сти в тех или иных дис­кур­сах, машин­ный ана­лиз есте­ствен­но­го язы­ка; учеб­ные раз­ра­бот­ки, содер­жа­щие реко­мен­да­ции по устра­не­нию неопре­де­лен­но­сти в текстах раз­лич­ных сти­лей и жан­ров) [Блинова, Белов 2020: 778]. Обозначенное направ­ле­ние работ уче­ных акцен­ти­ру­ет вни­ма­ние на том, что смыс­ло­вая неопре­де­лен­ность, как пра­ви­ло, счи­та­ет­ся ком­му­ни­ка­тив­ным пре­пят­стви­ем. Вместе с тем для ана­ли­за неяс­ной семан­ти­ки исполь­зу­ют­ся как тра­ди­ци­он­ные спо­со­бы (сема­сио­ло­ги­че­ский ана­лиз, экс­пе­ри­мент, анке­ти­ро­ва­ние, интер­пре­та­ция тек­стов), так и совре­мен­ные линг­во­сти­ли­сти­че­ские, линг­во­куль­ту­ро­ло­ги­че­ские и дис­кур­со­ло­ги­че­ские под­хо­ды. В зару­беж­ных иссле­до­ва­ни­ях обна­ру­жи­ва­ет­ся ори­ен­та­ция на кри­те­рии того, что счи­тать неоднозначным.

Сложная мно­го­цвет­ная палит­ра иссле­до­ва­ний на изу­ча­е­мую тему рас­кры­ва­ет­ся и в оте­че­ствен­ной линг­ви­сти­ке, в част­но­сти в тео­рии ком­му­ни­ка­ции, рефе­рен­ции, ком­му­ни­ка­тив­но­го син­так­си­са, функ­ци­о­наль­ной грам­ма­ти­ки и т. п. Семантическая неопре­де­лен­ность так­же иссле­ду­ет­ся как при помо­щи тра­ди­ци­он­ных спо­со­бов, так и при исполь­зо­ва­нии совре­мен­ных тех­но­ло­гий [Золотова и др. 1998; Циманов-Сосин и др. 2022; Куличенко, Курченкова 2023]. Особо при­сталь­ный инте­рес вызы­ва­ет рас­смот­ре­ние про­бле­мы семан­ти­че­ской диф­фу­зии в кон­тек­сте язы­ко­вой кар­ти­ны мира или обра­за мира [Васильева 1989; Васильев, Васильева 2013]. Как отме­ча­ет Е. В. Падучева [Падучева 1996], в рус­ской язы­ко­вой кар­тине мира неопре­де­лен­ность свя­за­на с субъ­ек­том. Это обсто­я­тель­ство при­во­дит к необ­хо­ди­мо­сти выяв­ле­ния и объ­яс­не­ния семан­ти­че­ской роли как субъ­ек­та речи, так и жан­ра созда­ва­е­мо­го текста.

Таким обра­зом, в дан­ной рабо­те пред­став­лен вари­ант под­хо­да к изу­че­нию смыс­ло­вой неопре­де­лен­но­сти как фак­то­ра потен­ци­аль­ной кон­флик­то­ген­но­сти [Рикёр 2008]. Практическая целе­со­об­раз­ность иссле­до­ва­ния заклю­ча­ет­ся в том, что ревер­сив­ный пере­вод спо­соб­ству­ет обна­ру­же­нию семан­ти­че­ской неод­но­знач­но­сти лек­си­ки в рам­ках кон­крет­но­го тек­ста. Считаем важ­ным под­черк­нуть, что в науч­ной шко­ле «Социально-когнитивное функ­ци­о­ни­ро­ва­ние язы­ка» (руко­во­ди­тель — док­тор фило­ло­ги­че­ских наук, про­фес­сор Н. Д. Голев), кон­цеп­цию кото­рой раз­ви­ва­ет насто­я­щая ста­тья, актив­но раз­ра­ба­ты­ва­ют­ся идеи мно­же­ствен­но­сти интер­пре­та­ций, транс­ля­тив­ной линг­ви­сти­ки в аспек­те фор­ми­ро­ва­ния меха­низ­ма сни­же­ния рис­ков кон­флик­то­ген­но­сти, недо­по­ни­ма­ний и т. п. [Голев 2018; Голев 2022; Голев, Ким 2023].

В дан­ной пуб­ли­ка­ции смыс­ло­вая неопре­де­лен­ность вслед за тео­ри­я­ми Н. Д. Голева [Голев 2022; Голев, Иркова 2023] рас­смат­ри­ва­ет­ся как зна­чи­мая сти­хий­ная часть есте­ствен­но­го язы­ка, кото­рая в той или иной сте­пе­ни пред­став­ле­на в юри­ди­че­ских, реклам­ных, худо­же­ствен­ных и мно­гих дру­гих текстах.

Описание методики исследования

При иссле­до­ва­нии язы­ко­во­го мате­ри­а­ла был исполь­зо­ван ком­плекс мето­дов: пред­ва­ри­тель­ная оцен­ка тек­ста на нали­чие семан­ти­че­ской диф­фу­зии, дис­кур­сив­ный ана­лиз, обрат­ный машин­ный пере­вод, срав­не­ние тек­стов по схо­же­сти. Материалом для иссле­до­ва­ния высту­пи­ли при­ро­до­охран­ные и реклам­ные тек­сты, содер­жа­щие потен­ци­ал интер­пре­та­ци­он­но­го кон­флик­та [Леонтьева 2020]. Основной кор­пус ана­ли­зи­ру­е­мых мате­ри­а­лов состав­ля­ют два зако­но­да­тель­ных тек­ста при­ро­до­охран­ной тема­ти­ки и четы­ре медиатекста.

    1. Статья 1. «Основные поня­тия…» Закона Кемеровской обла­сти — Кузбасса от 6 фев­ра­ля 2009 г. № 5‑ОЗ «О турист­ской дея­тель­но­сти»2.
    2. Статья 2. «Категории осо­бо охра­ня­е­мых при­род­ных тер­ри­то­рий» Закона Новосибирской обла­сти от 26 сен­тяб­ря 2005 г. № 325-ОЗ «Об осо­бо охра­ня­е­мых при­род­ных тер­ри­то­ри­ях в Новосибирской обла­сти»3.
    3. «Шорский наци­о­наль­ный парк. Галерея при­род­ных экс­по­на­тов»4.
    4. «Зеленый Кузбасс: эко­ло­ги­че­ский туризм»5.
    5. «В Шерегеше созда­дут осо­бую эко­но­ми­че­скую зону с инве­сти­ци­я­ми более 40 млрд руб­лей»6.
    6. «Сергей Цивилев: в КуZбассе будет раз­ра­бо­тан уни­каль­ный для России тури­сти­че­ский марш­рут»7.

Также в каче­стве допол­ни­тель­но­го мате­ри­а­ла при­вле­ка­ют­ся кон­тек­сты из Национального кор­пу­са рус­ско­го язы­ка8, дан­ные Словаря рус­ско­го язы­ка (под ред. А. П. Евгеньевой)9, Толкового сло­ва­ря рус­ско­го язы­ка С. И. Ожегова, Н. Ю. Шведовой10.

Анализ материала и результаты исследования

Для реа­ли­за­ции постав­лен­ной цели нами были изу­че­ны в аспек­те пере­во­ди­мо­сти тек­сты при­ро­до­охран­но­го и медий­но­го дис­кур­сов. Выбранные шесть тек­стов были пере­ве­де­ны с исполь­зо­ва­ни­ем Google11 на китай­ский и англий­ский язы­ки. Следующим шагом в иссле­до­ва­нии было срав­не­ние обрат­ных машин­ных пере­во­дов с исход­ны­ми тек­ста­ми при помо­щи двух онлайн-программ. Первая про­грам­ма опре­де­ля­ет сход­ство двух тек­стов в про­цен­тах12 [Колесников, Баженов 2017]. Во вто­рой про­грам­ме13 отоб­ра­жа­ют­ся эле­мен­ты, кото­рые пока­зы­ва­ют бли­зость двух текстов.

Результаты наше­го иссле­до­ва­ния осно­ва­ны на дан­ных ком­пью­тер­ных про­грамм срав­не­ния изу­ча­е­мых тек­стов. При сопо­ста­ви­тель­ном ана­ли­зе учи­ты­ва­лись три параметра:

    1. общее коли­че­ство слов в текстах;
    2. сход­ство тек­стов в про­цент­ном отношении;
    3. нали­чие раз­ли­ча­ю­щих­ся фрагментов.

Итоги сопо­став­ле­ния тек­стов пред­став­ле­ны в табл. 1 и 2.

Следует отме­тить, что в акту­а­ли­зи­ро­ван­ных дан­ных воз­мож­но при­сут­ствие погреш­но­сти, кото­рая мог­ла быть вызва­на каче­ствен­ны­ми харак­те­ри­сти­ка­ми исполь­зу­е­мых про­грамм. Как пред­став­ля­ет­ся, этот фак­тор суще­ствен­но вли­я­ет на пред­по­ло­жи­тель­ный харак­тер выво­дов о полу­чен­ных резуль­та­тах исследования.

Как вид­но из при­ве­ден­ных дан­ных, наи­боль­шая бли­зость пере­ве­ден­но­го тек­ста к исход­но­му наблю­да­ет­ся у при­ро­до­охран­но­го тек­ста (Текст 1, 71,07 %) и меди­а­тек­ста (Текст 5, 73,63 %). Следовательно, они обла­да­ют высо­кой сте­пе­нью понят­но­сти, кото­рая изна­чаль­но была зада­на их жан­ром. Далее по сте­пе­ни пере­во­ди­мо­сти отме­ча­ют­ся Текст 2(63,22 %), Текст 3 (64,08 %), Текст 4 (70,74 %), Текст 6 (66,46 %). При про­ве­де­нии про­це­ду­ры обрат­но­го машин­но­го пере­во­да в каче­стве языка-посредника исполь­зо­вал­ся англий­ский (запад­но­гер­ман­ский язык индо­ев­ро­пей­ской язы­ко­вой семьи).

Таблица 1. Машинный пере­вод с рус­ско­го язы­ка на англий­ский и обрат­но, срав­не­ние тек­стов на схожесть

ТекстыОбщее коли­че­ство слов в текстахСходство тек­стов, %Наличие раз­ли­ча­ю­щих­ся фрагментов
119771,0751
232263,22120
364564,08202
463270,74176
522773,6367
622566,4663

 

Таблица 2. Машинный пере­вод с рус­ско­го язы­ка на китай­ский и обрат­но, срав­не­ние тек­стов на схожесть

ТекстыОбщее коли­че­ство слов в текстахСходство тек­стов, %  Наличие раз­ли­ча­ю­щих­ся фрагментов
118840,14105
229447,59160
368440,51320
462744,18282
521846,7282
622238,31104

 

Исходя из пред­став­лен­ных дан­ных, отме­ча­ет­ся наи­боль­шая бли­зость пере­ве­ден­но­го тек­ста с исход­ным у двух при­ро­до­охран­ных тек­стов (Текст 1 — 40,14 %; Текст 2 — 47,59 %) и у неко­то­рых медий­ных тек­стов (Текст 4 — 44,18 %;Текст 5 — 46,7 %.). Далее по сте­пе­ни пере­во­ди­мо­сти отоб­ра­жа­ют­ся Текст 3 (40,51 %), Текст 6 (38,31 %). В обрат­ном машин­ном пере­во­де в каче­стве языка-посредника исполь­зо­вал­ся китай­ский (ветвь китайско-тибетской язы­ко­вой семьи).

Таким обра­зом, по полу­чен­ным резуль­та­там обна­ру­жи­ва­ет­ся сни­же­ние сход­ства тек­стов в зави­си­мо­сти от языка-посредника, исполь­зу­е­мо­го в обрат­ном пере­во­де. На сте­пень пере­во­ди­мо­сти так­же весь­ма силь­но вли­я­ет вид дис­кур­сив­ной прак­ти­ки, кото­рый пере­да­ет­ся через машин­ный пере­вод­чик. В этой свя­зи медий­ный дис­курс обла­да­ет доста­точ­но весо­мым потен­ци­а­лом кон­флик­та интер­пре­та­ций по срав­не­нию с при­ро­до­охран­ным дискурсом.

В каче­стве при­ме­ра при­ме­не­ния онлайн-программ для сопо­став­ле­ния исход­но­го и пере­во­ди­мо­го тек­стов в рам­ках нашей мето­ди­ки мы огра­ни­чим­ся дву­мя текстами:

  • меди­а­текст «Зеленый Кузбасс: эко­ло­ги­че­ский туризм» (рис. 1, а);
  • юри­ди­че­ская ста­тья «2. Категории осо­бо охра­ня­е­мых при­род­ных тер­ри­то­рий» (Закон Новосибирской обла­сти № 325-ОЗ) (рис. 1, б).

 

Рис. 1. Сопоставление двух тек­стов при помо­щи онлайн-программ: 
а — машин­ный пере­вод меди­а­тек­ста на англий­ский язык и обрат­но на рус­ский; б — машин­ный пере­вод юри­ди­че­ско­го тек­ста на англий­ский язык и обрат­но на русский

 

Семантическая неопре­де­лен­ность лек­си­ки изу­ча­е­мых тек­стов рас­пре­де­ля­ет­ся сле­ду­ю­щим образом.

Слова, сло­во­со­че­та­ния и фра­зы с высо­кой сте­пе­нью потен­ци­аль­ной кон­флик­то­ген­но­сти: «опти­маль­ный», «луч­ший», «запо­вед­ник», «водо­ем», «резер­ву­ар», «водо­хра­ни­ли­ще», «гор­ные вер­ши­ны», «эко­ло­ги­че­ский туризм», «эко­ту­ризм» и т. д.

Слова, сло­во­со­че­та­ния и фра­зы с низ­кой сте­пе­нью потен­ци­аль­ной кон­флик­то­ген­но­сти: «Горная Шория», «В насто­я­щем законе», «инфра­с­тук­ту­ра», «озна­ком­ле­ние», «посе­ще­ние», «исполь­зу­е­мые» и т. д.

Обращение к сопо­ста­ви­тель­но­му аспек­ту при ана­ли­зе тек­стов, про­ве­ден­ных через обрат­ный машин­ный пере­вод, пред­став­ля­ет­ся важ­ным с точ­ки зре­ния фик­си­ро­ва­ния неод­но­знач­ных лек­сем, неко­то­рых грам­ма­ти­че­ских и син­так­си­че­ских кон­струк­ций, несов­па­да­ю­щих эле­мен­тов двух тек­стов. Следует уде­лить вни­ма­ние ана­ли­зу несколь­ких сло­вар­ных дефи­ни­ций и их кон­текст­ной реа­ли­за­ции («резер­ву­ар» — «водо­ем» — «водо­хра­ни­ли­ще») [Шикалева 2011]. В обрат­ном машин­ном пере­во­де эти лек­се­мы вполне могут слу­жить ком­по­нен­том, пре­пят­ству­ю­щим одно­знач­но­му тол­ко­ва­нию. Искусственный интел­лект не зна­ком с дис­кур­сом, поэто­му выби­ра­ет сло­во, выби­ва­ю­ще­е­ся из дис­кур­сив­но­го поля той или иной сферы.

Итак, резер­ву­ар — это «1. Вместилище для жид­ко­стей и газов. 2. перен. Источник чего‑л.»14.

Контекстная реа­ли­за­ция 1 (пра­во­вой дис­курс): Согласно Федеральному зако­ну от 30.12.2009 № 384-ФЗ «Технический регла­мент о без­опас­но­сти зда­ний и соору­же­ний» (далее — Федеральный закон № 384-ФЗ) резер­ву­а­ры явля­ют­ся соору­же­ни­я­ми, пред­став­ля­ю­щи­ми собой объ­ем­ную, плос­кост­ную или линей­ную стро­и­тель­ную систе­му, име­ю­щую назем­ную, над­зем­ную и (или) под­зем­ную части, состо­я­щую из несу­щих, а в отдель­ных слу­ча­ях и ограж­да­ю­щих стро­и­тель­ных кон­струк­ций и пред­на­зна­чен­ную для хра­не­ния про­дук­ции15. В пред­став­лен­ном кон­тек­сте лек­се­ма «резер­ву­ар» рас­кры­ва­ет­ся таким при­зна­ко­вым соста­вом, как «соору­же­ние»; «объ­ем­ная», «плос­кая» или «линей­ная» «стро­и­тель­ная систе­ма»; «пред­на­зна­чен­ная для хра­не­ния про­дук­ции» и т. п.

Контекстная реа­ли­за­ция 2 (газет­ный дис­курс): На тер­ри­то­рии ТЭЦ‑3 Норильско-Таймырской энер­ге­ти­че­ской ком­па­нии 29 мая 2020 про­изо­шла раз­гер­ме­ти­за­ция резер­ву­а­ра с дизель­ным топ­ли­вом, в резуль­та­те 21 163 тон­ны топ­ли­ва попа­ло в аква­то­рии рек Далдыкан и Амбарная16. В дан­ном кон­тек­сте реа­ли­зу­ет­ся смыс­ло­вой ком­плекс, свя­зан­ный с «резер­ву­а­ром» как опре­де­лен­ной емко­стью для раз­ме­ще­ния и хра­не­ния дизель­но­го топлива.

Водоем — «Место скоп­ле­ния или хра­не­ния воды (озе­ро, бас­сейн, пруд, водо­хра­ни­ли­ще)»17.

Контекстная реа­ли­за­ция 1 (пра­во­вой дис­курс): В соот­вет­ствии со ст. 1 Водного кодек­са Российской Федерации вод­ный объ­ект — это при­род­ный или искус­ствен­ный водо­ем, водо­ток либо иной объ­ект, посто­ян­ное или вре­мен­ное сосре­до­то­че­ние вод в кото­ром име­ет харак­тер­ные фор­мы и при­зна­ки вод­но­го режи­ма18. В акту­а­ли­зи­ро­ван­ном кон­тек­сте лек­се­ма «водо­ем» пред­ста­ет как есте­ствен­ный или искус­ствен­ный вод­ный объ­ект (широ­кое обо­зна­че­ние морей и океанов).

Контекстная реа­ли­за­ция 2 (газет­ный дис­курс): Вот толь­ко кис­ло­вод­ские ста­ро­жи­лы жалу­ют­ся, что в горо­де, где жар­кое лето, нет ни одно­го бла­го­устро­ен­но­го водо­е­ма для мас­со­во­го отды­ха19. В этом кон­тек­сте на пер­вый план выхо­дит зна­че­ние рекре­а­ци­он­ной зоны водо­е­мов для ока­за­ния услуг в сфе­ре туриз­ма, физи­че­ской куль­ту­ры и спор­та, орга­ни­за­ции отды­ха и оздо­ров­ле­ния граждан.

Водохранилище — «Искусственный водо­ем для накоп­ле­ния и хра­не­ния воды»20.

Контекстная реа­ли­за­ция 1 (пра­во­вой дис­курс): Водохранилища в соот­вет­ствии с поло­же­ни­я­ми Водного кодек­са РФ отно­сят­ся к поверх­ност­ным вод­ным объ­ек­там. В соот­вет­ствии с п. 1.1 Санитарных пра­вил про­ек­ти­ро­ва­ния, стро­и­тель­ства и экс­плу­а­та­ции водо­хра­ни­лищ, утвер­жден­ных глав­ным сани­тар­ным вра­чом СССР 01.07.1985, водо­хра­ни­ли­ще — это искус­ствен­ный водо­ем, обра­зо­ван­ный водо­под­пор­ным соору­же­ни­ем на водо­сто­ке с целью хра­не­ния воды и регу­ли­ро­ва­ния сто­ка21. В очер­чен­ном кон­тек­сте лек­се­ма «водо­хра­ни­ли­ще» высве­чи­ва­ет такой при­зна­ко­вый состав, как «поверх­ност­ный вод­ный объ­ект»; «искус­ствен­ный водо­ем»; «обра­зо­ван­ный водо­под­пор­ным соору­же­ни­ем»; «водо­сток»; «исполь­зу­ет­ся с целью хра­не­ния воды и регу­ли­ро­ва­ния стока».

Контекстная реа­ли­за­ция 2 (газет­ный дис­курс): Жаркое лето при­ве­ло к тому, что на юге, где важ­на роль гид­ро­энер­ге­ти­ки, она рабо­та­ет не на пол­ную мощ­ность — не до кон­ца запол­не­ны водо­хра­ни­ли­ща22. В пред­став­лен­ном кон­тек­сте рас­кры­ва­ет­ся зна­че­ние водо­хра­ни­ли­ща как круп­но­го резер­ву­а­ра воды (энер­ге­ти­че­ско­го «доно­ра»), кото­рый исполь­зу­ет­ся для выра­бот­ки электроэнергии.

Выводы

Методологический под­ход, пред­став­лен­ный нами в дан­ном иссле­до­ва­нии, поз­во­лил выявить сле­ду­ю­щие закономерности.

    1. Одним из акту­аль­ных вопро­сов при опи­са­нии про­блем­ных зон машин­но­го пере­во­да меди­а­тек­стов явля­ет­ся дис­кур­сив­ный фак­тор, кото­рый вли­я­ет на созда­ние и реа­ли­за­цию семан­ти­че­ской неопре­де­лен­но­сти. Дискурс ока­зы­ва­ет суще­ствен­ное воз­дей­ствие на вос­при­я­тие тек­ста чита­те­лем. Ввиду нали­чия в текстах смыс­ло­вой двой­ствен­но­сти и напря­жен­но­сти при пере­во­де фор­ми­ру­ют­ся пред­по­сыл­ки потен­ци­аль­ных кон­фликт­ных ситу­а­ций. Семантическая неопре­де­лен­ность и зона напря­жен­но­сти как кон­флик­то­ген­ные фак­то­ры во мно­гом зави­сят от каче­ства самих пере­вод­че­ских про­грамм и их несо­вер­шен­ства. Так, потен­ци­аль­но они спо­соб­ству­ют раз­вер­ты­ва­нию конфликта.
    2. Сопоставление двух дис­кур­сов пер­вич­но пока­за­ло зна­чи­мость кон­тек­ста (дис­кур­са) и языка-посредника. Природоохранный дис­курс с исполь­зо­ва­ни­ем англий­ско­го язы­ка для пере­во­да пред­став­ля­ет­ся более пере­во­ди­мым (71,07 %). При машин­ном пере­во­де медий­но­го тек­ста на китай­ский язык наблю­да­лась наи­боль­шая семан­ти­че­ская дистан­ция пере­ве­ден­ных тек­стов от ори­ги­на­ла (38,31 %), посколь­ку жан­ро­вая состав­ля­ю­щая меди­а­тек­стов свя­за­на с мно­го­знач­но­стью, яркой мета­фо­ри­кой, образностью.
    3. Технология обрат­но­го машин­но­го пере­во­да, срав­не­ния тек­стов по сход­ству пока­зы­ва­ет опре­де­лен­ные резуль­та­ты, кото­рые не пре­тен­ду­ют на исчер­пы­ва­ю­щий харак­тер, посколь­ку суще­ству­ет воз­мож­ная погреш­ность, свя­зан­ная с огра­ни­че­ни­я­ми исполь­зу­е­мых программ.
    4. К пер­спек­ти­вам изу­че­ния про­бле­мы обрат­но­го машин­но­го пере­во­да с уче­том дис­кур­сив­но­го фак­то­ра отно­сят­ся рас­ши­ре­ние источ­ни­ков эмпи­ри­че­ско­го мате­ри­а­ла, при­вле­че­ние дру­гих систем авто­ма­ти­зи­ро­ван­но­го пере­во­да, воз­мож­ность впи­сан­но­сти резуль­та­тов иссле­до­ва­ния в более широ­кую про­бле­ма­ти­ку («потен­ци­аль­ная конфликтогенность»).

1 Ввиду широ­ты исполь­зу­е­мых поня­тий отме­тим, что Е. А. Кожемякин выде­ля­ет такие виды медий­но­го дис­кур­са, как новост­ной, реклам­ный, про­мо­ций­ный (PR) дис­кур­сы; инфор­ма­ци­он­ные, ана­ли­ти­че­ские, жур­на­лист­ские дис­кур­сы; иден­ти­фи­ци­ру­ю­щий, репре­зен­ти­ру­ю­щий, идео­ло­ги­че­ский дис­кур­сы и мно­гие дру­гие [Кожемякин 2008].

2 Закон Кемеровской обла­сти — Кузбасса от 6 фев­ра­ля 2009 г. № 5‑ОЗ «О турист­ской дея­тель­но­сти» (при­нят Советом народ­ных депу­та­тов Кемеровской обла­сти 28 янва­ря 2009 г.). Электронный ресурс https://​docs​.cntd​.ru/​d​o​c​u​m​e​n​t​/​9​9​0​3​0​8​729.

3 Закон Новосибирской обла­сти от 26 сен­тяб­ря 2005 г. № 325-ОЗ «Об осо­бо охра­ня­е­мых при­род­ных тер­ри­то­ри­ях в Новосибирской обла­сти» (с изме­не­ни­я­ми и допол­не­ни­я­ми). Электронный ресурс https://​docs​.cntd​.ru/​d​o​c​u​m​e​n​t​/​5​4​1​9​7​4​7​?​m​a​r​ker.

4 Шорский наци­о­наль­ный парк. Галерея при­род­ных экс­по­на­тов. Туризм в Кузбассе. Электронный ресурс https://​visit​-kuzbass​.ru/​g​u​i​d​e​/​g​d​e​-​o​t​d​o​x​n​u​t​/​s​h​o​r​s​k​i​j​-​n​a​c​z​p​a​r​k​-​g​a​l​e​r​e​y​a​-​p​r​i​r​o​d​n​y​i​x​e​k​s​p​o​n​a​tov.

5 Зеленый Кузбасс: эко­ло­ги­че­ский туризм. Туризм в Кузбассе. Электронный ресурс https://​visitkuzbass​.ru/​b​l​o​g​/​z​e​l​e​n​y​i​j​-​k​u​z​b​a​s​s​-​e​k​o​l​o​g​i​c​h​e​s​k​i​j​-​t​u​r​i​z​m​-​v​-​r​e​g​i​one.

6 Ганьшин, П. (2023). В Шерегеше созда­дут осо­бую эко­но­ми­че­скую зону с инве­сти­ци­я­ми более 40 млрд руб­лей. Континент Сибирь. Электронный ресурс https://ksonline.ru/501485/v‑sheregeshesozdadut-osobuyu-ekonomicheskuyu-zonu-s-investitsiyami-bolee-40-mlrd-rublej/.

7 Сергей Цивилев: в КуZбассе будет раз­ра­бо­тан уни­каль­ный для России тури­сти­че­ский марш­рут (2022). Администрация Правительства Кузбасса. Электронный ресурс https://​ako​.ru/​n​e​w​s​/​d​e​t​a​i​l​/​s​e​r​g​e​y​-​t​s​i​v​i​l​e​v​-​v​-​k​u​z​b​a​s​s​e​-​b​u​d​e​t​-​r​a​z​r​a​b​o​t​a​n​-​u​n​i​k​a​l​n​y​y​-​d​l​y​a​-​r​o​s​s​i​i​-​t​u​r​i​s​t​i​c​h​e​s​k​i​y​-​m​a​r​s​h​rut.

8 Национальный кор­пус рус­ско­го язы­ка. Электронный ресурс http://​www​.ruscorpora​.ru.

9 Евгеньева, А. П. (Ред.) (1999). Словарь рус­ско­го язы­ка: В 4‑х т. Т. 1. А–Й. М.: Русский язык; Полиграфресурсы.

10 Ожегов, С. И., Шведова, Н. Ю. (1999). Толковый сло­варь рус­ско­го язы­ка: 80 000 слов и фра­зео­ло­ги­че­ских выра­же­ний. М.: Азбуковник.

11 Google Translate. Электронный ресурс https://​translate​.google​.ru.

12 Web-инструмент. Электронный ресурс https://​ciox​.ru.

13 Сравнение тек­стов онлайн. Электронный ресурс http://​text​.num2word​.ru/.

14 Евгеньева, А. П. (1999). Словарь рус­ско­го язы­ка: В 4‑х т. Т. 1.

15 Федеральный закон от 30 декаб­ря 2009 г. № 384-ФЗ «Технический регла­мент о без­опас­но­сти зда­ний и соору­же­ний». СПС «КонсультантПлюс». Электронный ресурс https://​www​.consultant​.ru/​d​o​c​u​m​e​n​t​/​c​o​n​s​_​d​o​c​_​L​A​W​_​9​5​7​20/.

16 Кабмин наме­рен выде­лить 20 млрд руб­лей на пере­се­ле­ние граж­дан из ава­рий­но­го жилья (2021). Парламентская газе­та. Электронный ресурс https://​www​.pnp​.ru/​e​c​o​n​o​m​i​c​s​/​k​a​b​m​i​n​-​n​a​m​e​r​e​n​v​y​d​e​l​i​t​-​2​0​-​m​l​r​d​-​r​u​b​l​e​y​-​n​a​-​p​e​r​e​s​e​l​e​n​i​e​-​g​r​a​z​h​d​a​n​-​i​z​-​a​v​a​r​i​y​n​o​g​o​-​z​h​i​l​y​a​.​h​tml.

17 Ожегов, С. И., Шведова, Н. Ю. (1999). Толковый сло­варь рус­ско­го язы­ка: 80 000 слов и фра­зео­ло­ги­че­ских выра­же­ний.

18 Статья 1. «Основные поня­тия…». Водный кодекс Российской Федерации от 3 июня 2006 г. № 74-ФЗ. СПС «КонсультантПлюс». Электронный ресурс https://​www​.consultant​.ru/​d​o​c​u​m​e​n​t​/​c​o​n​s​_​d​o​c​_​L​A​W​_​6​0​6​8​3​/​c​d​e​c​1​6​e​c​7​4​7​f​1​1​f​3​a​7​a​3​9​c​7​3​0​3​d​0​3​3​7​3​e​0​e​f​9​1​c4/.

19 Кисловодск дол­жен стать луч­шим курор­том Европы (2021). Парламентская газе­та. Электронный ресурс https://​www​.pnp​.ru/​s​o​c​i​a​l​/​k​i​s​l​o​v​o​d​s​k​-​d​o​l​z​h​e​n​-​s​t​a​t​-​l​u​c​h​s​h​i​m​-​k​u​r​o​r​t​o​m​-​e​v​r​o​p​y​.​h​tml.

20 Евгеньева, А. П. (1999). Словарь рус­ско­го язы­ка: В 4‑х т. Т. 1.

21 Статья 45. «Использование водо­хра­ни­лищ». Водный кодекс Российской Федерации от 3 июня 2006 г. № 74-ФЗ. СПС «КонсультантПлюс». Электронный ресурс https://​www​.consultant​.ru/​d​o​c​u​m​e​n​t​/​c​o​n​s​_​d​o​c​_​L​A​W​_​6​0​6​8​3​/​0​7​8​7​a​4​7​9​d​8​f​6​1​1​d​1​3​a​0​c​a​5​d​0​6​7​3​e​a​8​5​7​1​a​2​9​3​f​1d/.

22 Причины энер­го­кри­зи­са в Китае — борь­ба за сни­же­ние выбро­сов (2021). Ведомости. Электронный ресурс https://​www​.vedomosti​.ru/​e​c​o​n​o​m​i​c​s​/​a​r​t​i​c​l​e​s​/​2​0​2​1​/​1​0​/​1​1​/​8​9​0​7​1​2​-​e​n​e​r​g​o​k​r​i​z​i​s​a​-​k​i​tae.

Статья посту­пи­ла в редак­цию 11 сен­тяб­ря 2023 г.; реко­мен­до­ва­на к печа­ти 14 фев­ра­ля 2024 г.

© Санкт-Петербургский госу­дар­ствен­ный уни­вер­си­тет, 2024

Received: September 11, 2023
Accepted: February 14, 2024