Воскресенье, 3 мартаИнститут «Высшая школа журналистики и массовых коммуникаций» СПбГУ
Shadow

Проблема цифрового этикета в русских и английских медиатекстах: на материале миграционного дискурса

Постановка проблемы

Извест­но, что «сред­не­ста­ти­сти­че­ский житель пла­не­ты про­во­дит онлайн почти 7 ч еже­днев­но», а граж­дане Рос­сии вхо­дят в чис­ло людей, кото­рые наи­бо­лее актив­но исполь­зу­ют интер­нет, про­во­дя в онлайн-сре­де в сред­нем 7 ч 17 мин в день1.

Неуди­ви­тель­но, что иссле­до­ва­ния циф­ро­вой сре­ды и новых форм ком­му­ни­ка­ции с каж­дым днем ста­но­вят­ся все более актуальными.

Циф­ро­вые сети явля­ют­ся одним из основ­ных видов пере­да­чи инфор­ма­ции в совре­мен­ном обще­стве [Capurro 2009]. Они исполь­зу­ют­ся не толь­ко для меж­лич­ност­ной ком­му­ни­ка­ции и соци­а­ли­за­ции, но и для обме­на мне­ни­я­ми и выра­же­ния соб­ствен­но­го мне­ния, поли­ти­че­ской аги­та­ции, фор­ми­ро­ва­ния обще­ствен­но­го мне­ния, в обра­зо­ва­тель­ных целях и пр. Циф­ро­ви­за­ция про­ни­ка­ет во все сфе­ры соци­аль­ной жиз­ни, под­вер­гая моди­фи­ка­ции ком­му­ни­ка­ци­он­ную сре­ду и сами про­цес­сы ком­му­ни­ка­ции. Подоб­но­го рода циф­ро­вые ком­му­ни­ка­ции нахо­дят свое отра­же­ние в новых жан­рах обще­ния и новых моде­лях текста.

Поня­тие «меди­а­текст» ста­ло актив­но исполь­зо­вать­ся в науч­ной сре­де в 1990‑е годы, когда уче­ные нача­ли уде­лять осо­бое вни­ма­ние изу­че­нию спе­ци­фи­ки функ­ци­о­ни­ро­ва­ния язы­ка в сфе­ре мас­со­вой инфор­ма­ции и еди­ниц медиа­по­то­ка. Осо­бый вклад в раз­ви­тие тео­рии язы­ка СМИ внес­ли такие оте­че­ствен­ные уче­ные, как С. И. Берн­штейн, Г. Я. Солга­ник, Ю. В. Рож­де­ствен­ский, Д. Н. Шме­лев, В. Г. Косто­ма­ров, Б. В. Кри­вен­ко, И. П. Лыса­ко­ва и др., а так­же зару­беж­ные уче­ные, напри­мер Тён ван Дейк, Роберт Фау­лер, Нор­ман Фей­ерк­лаф, Алан Белл, Мар­тин Монт­го­ме­ри и др.

Прин­ци­пи­аль­ным отли­чи­ем муль­ти­мо­даль­но­го тек­ста от тра­ди­ци­он­но­го явля­ет­ся инте­гра­ция пись­мен­но­го тек­ста, визу­аль­ных изоб­ра­же­ний и зву­ко­во­го мате­ри­а­ла. В рам­ках тра­ди­ци­он­ной линг­ви­сти­ки текст опре­де­ля­ет­ся как «резуль­тат целе­на­прав­лен­но­го рече­во­го твор­че­ства, целост­ное рече­вое про­из­ве­де­ние», где основ­ные еди­ни­цы тек­ста — это вер­баль­ные зна­ки. В семи­о­ти­ке «текст — это осмыс­лен­ная после­до­ва­тель­ность зна­ков», т. е. еди­ни­ца­ми тек­ста могут быть не толь­ко вер­баль­ные зна­ки, но и любые дру­гие зна­ки, напри­мер видео­ряд, музы­каль­ный ряд, гра­фи­че­ские изоб­ра­же­ния и т. д. [Солга­ник 2005].

В дан­ной рабо­те вслед за М. А. Пиль­гун мы рас­смат­ри­ва­ем меди­а­текст как «син­кре­ти­че­ское един­ство вер­баль­ных и невер­баль­ных ком­по­нен­тов, обла­да­ю­щее связ­но­стью и цель­но­стью, име­ю­щее опре­де­лен­ную целе­на­прав­лен­ность и праг­ма­ти­че­скую уста­нов­ку» [Пиль­гун 2015].

Упо­мя­ну­тые семан­ти­ко-семи­о­ти­че­ские осо­бен­но­сти меди­а­тек­ста спо­соб­ству­ют изме­не­нию струк­ту­ры сооб­ще­ния, а так­же его вос­при­я­тия. Мас­со­вый харак­тер меди­а­тек­ста изме­ня­ет и инсти­тут автор­ства, тра­ди­ци­он­ный автор заме­ня­ет­ся твор­че­ским созна­ни­ем потре­би­те­ля. Вир­ту­а­ли­за­ция инфор­ма­ци­он­но­го про­стран­ства и инфор­ма­ци­он­но-ком­му­ни­ка­ци­он­ные тех­но­ло­гии обу­сло­ви­ли появ­ле­ние новых ком­му­ни­ка­тив­ных форм, кото­рые суще­ству­ют без­от­но­си­тель­но к аген­там и адре­сан­там [Пиль­гун 2015].

Оче­вид­но, что такая каче­ствен­но новая фор­ма соци­аль­но­го вза­и­мо­дей­ствия тре­бу­ет выра­бот­ки опре­де­лен­ных регу­ля­тив­ных норм и прин­ци­пов. Такую функ­цию при­зван осу­ществ­лять циф­ро­вой этикет.

Тер­мин «циф­ро­вой эти­кет» появил­ся во вре­мя ста­нов­ле­ния тре­тье­го поко­ле­ния Все­мир­ной гло­баль­ной пау­ти­ны (Web 3.0) и рас­смат­ри­ва­ет­ся как «нор­ма­тив­но­эти­че­ский регу­ля­тор ком­му­ни­ка­тив­но­го вза­и­мо­дей­ствия в сети при помо­щи всех форм эти­кет­ной ком­му­ни­ка­ции: пись­мен­ной, пове­ден­че­ской и рече­вой и пред­став­ля­ет собой более широ­кое поня­тие, чем сете­вой эти­кет» [Мами­на, Царе­ва 2018]. В свою оче­редь, сете­вой эти­кет, или нети­кет, был одной из пер­вых форм орга­ни­за­ции вза­и­мо­от­но­ше­ний в сети, кото­рая сфор­ми­ро­ва­лась в эпо­ху Web 1.0 и пре­тер­пе­ла каче­ствен­ные изме­не­ния вме­сте с раз­ви­ти­ем Web 2.0.

Про­бле­ма­ти­ка циф­ро­во­го эти­ке­та нахо­дит­ся в сфе­ре вни­ма­ния уче­ных раз­ных спе­ци­аль­но­стей: линг­ви­стов, поли­то­ло­гов, социо­ло­гов, куль­ту­ро­ло­гов, пси­хо­ло­гов и др. Мно­го­чис­лен­ные иссле­до­ва­ния послед­них лет пока­зы­ва­ют меж­дис­ци­пли­нар­ный харак­тер ново­го эти­ке­та, а так­же раз­но­об­ра­зие его содер­жа­тель­ных характеристик.

Акту­аль­ность ана­ли­за тема­ти­ки циф­ро­во­го эти­ке­та под­чер­ки­ва­ет­ся мно­го­чис­лен­ны­ми пуб­ли­ка­ци­я­ми послед­них лет. Соглас­но рабо­те М. Ашок, где про­во­дит­ся систе­ма­ти­че­ский обзор лите­ра­ту­ры, посвя­щен­ной циф­ро­вым тех­но­ло­ги­ям, самые частот­ные лек­се­мы 59 ста­тей из 43 раз­лич­ных жур­на­лов сле­ду­ю­щие: дан­ные, эти­ка, тех­но­ло­гия, систе­мы, изу­ча­ю­щий, инфор­ми­ру­ет, соци­аль­но, алго­рит­мы и др. (рис. 1).

Рис. 1. Обла­ко слов систе­ма­ти­че­ско­го обзо­ра ста­тей Источ­ник: [Ashok et al. 2022]

На дан­ный момент в науч­ной лите­ра­ту­ре при­ме­ня­ет­ся боль­шое коли­че­ство тер­ми­но­ло­ги­че­ских сино­ни­мов к поня­тию «циф­ро­вой эти­кет». Наи­бо­лее часто упо­треб­ля­е­мые — инфор­ма­ци­он­ная эти­ка, эти­ка боль­ших дан­ных, эти­ка алго­рит­мов, эти­ка циф­ро­вых медиа, эти­ка циф­ро­вой жур­на­ли­сти­ки, эти­ка геоб­ло­ки­ров­ки [Schmücker 2022], эти­ка искус­ствен­но­го интел­лек­та, кибер­эти­ка, эти­ка дан­ных, сете­вой эти­кет, ком­пью­тер­ная эти­ка [Schultz, Seele 2022]. Ниже при­во­дят­ся дефи­ни­ции тер­ми­нов, свя­зан­ных с эти­че­ски­ми вопро­са­ми в циф­ро­вой сре­де (табл. 1).

Таб­ли­ца 1. Циф­ро­вой эти­кет и его тер­ми­но­ло­ги­че­ские синонимы

Тер­минОпре­де­ле­ние
Инфор­ма­ци­он­ная этика

«В узком смыс­ле это все, что каса­ет­ся воз­дей­ствия циф­ро­вых тех­но­ло­гий на обще­ство и на окру­жа­ю­щую сре­ду в целом, а так­же реше­ния эти­че­ских про­блем, свя­зан­ных с функ­ци­о­ни­ро­ва­ни­ем онлай­но­вых СМИ (эти­ка циф­ро­вых СМИ) в част­но­сти. Поня­тие инфор­ма­ци­он­ной эти­ки в широ­ком смыс­ле охва­ты­ва­ет всю инфор­ма­ци­он­ную и ком­му­ни­ка­ци­он­ную сфе­ру, вклю­чая, но не огра­ни­чи­ва­ясь ими, циф­ро­вые сред­ства мас­со­вой инфор­ма­ции» [Кап­пу­ро 2010]

Эти­ка боль­ших данных

«Боль­шие дан­ные явля­ют­ся сти­му­лом заду­мать­ся над вопро­са­ми этич­но­сти их исполь­зо­ва­ния и опас­но­сти нару­ше­ния основ­ных граж­дан­ских, соци­аль­ных, поли­ти­че­ских и юри­ди­че­ских прав» [Mateosian 2013]

Эти­ка алгоритмов

«С точ­ки зре­ния алго­рит­мов самый глав­ный вопрос в том, что­бы они были спра­вед­ли­вы в при­ня­тии каких-либо реше­ний и чест­ны с поль­зо­ва­те­лем»2

Эти­ка циф­ро­вых медиа

«Циф­ро­вая меди­а­эти­ка», или «эти­ка циф­ро­вых медиа», — тер­мин, вве­ден­ный в жур­на­лист­ский и науч­ный дис­курс отно­си­тель­но недав­но. В более широ­ком смыс­ле, циф­ро­вая меди­а­эти­ка, явля­ясь послед­стви­ем раз­ви­тия циф­ро­вых инфор­ма­ци­он­но-ком­му­ни­ка­ци­он­ных тех­но­ло­гий, охва­ты­ва­ет весь ком­плекс эти­че­ских вопро­сов, воз­ни­ка­ю­щих в циф­ро­вой медиа­сре­де» [Афа­на­сье­ва 2014]

Эти­ка геоблокировки

«Область эти­ки, кото­рая зани­ма­ет­ся вопро­са­ми кон­флик­та потре­би­тель­ско­го пове­де­ния и кон­крет­но­го рын­ка, а имен­но огра­ни­че­ние досту­па к раз­лич­но­му интер­нет кон­тен­ту по тер­ри­то­ри­аль­но­му при­зна­ку» [Zahrádka 2018]

Эти­ка искус­ствен­но­го интеллекта

[Эти­ка искус­ствен­но­го интел­лек­та] «явля­ет­ся частью эти­ки тех­но­ло­гий, харак­тер­ной для робо­тов и дру­гих искус­ствен­но интел­лек­ту­аль­ных существ. Она обыч­но под­раз­де­ля­ет­ся на робо­э­ти­ку, кото­рая реша­ет вопро­сы мораль­но­го пове­де­ния людей при про­ек­ти­ро­ва­нии, кон­стру­и­ро­ва­нии, исполь­зо­ва­нии и лече­нии искус­ствен­но разум­ных существ и машин­ную эти­ку, кото­рая затра­ги­ва­ет про­бле­мы мораль­но­го пове­де­ния искус­ствен­ных мораль­ных аген­тов»3

Ком­пью­тер­ная этика

«Ана­лиз при­ро­ды и соци­аль­но­го воз­дей­ствия ком­пью­тер­ной тех­но­ло­гии в соче­та­нии с соот­вет­ству­ю­щи­ми фор­му­ли­ров­ка­ми эти­че­ско­го оправ­да­ния тех­но­ло­гии» [Галин­ская 2001]

Кибер­эти­ка

«Кибер­эти­ка име­ет дело с буду­щи­ми ком­пью­тер­ны­ми тех­но­ло­ги­я­ми, с каче­ством жиз­ни, с эти­че­ски­ми и соци­аль­ны­ми про­бле­ма­ми, свя­зан­ны­ми с кибер­про­стран­ством и обще­ством все­мир­ной ком­пью­тер­ной сре­ды» [Галин­ская 2001]

Интер­нет-эти­кет

«Моде­ли пове­де­ния лич­но­сти с уста­нов­ка­ми, направ­лен­ны­ми на соблю­де­ние пра­вил пове­де­ния в ком­му­ни­ка­тив­ном про­стран­стве…» Интер­нет-эти­ка «полу­чи­ла назва­ние нети­кет (от англ. Net + Etiquette) — свод пра­вил, сове­тов и реко­мен­да­ций по пове­де­нию и обще­нию в сети Интер­нет» [Мосей­ко 2019]

Таб­ли­ца нагляд­но демон­стри­ру­ет, что меж­ду тер­ми­на­ми нет чет­ко­го раз­гра­ни­че­ния по изу­ча­е­мо­му пред­ме­ту и обла­сти при­ме­не­ния. Одна­ко неко­то­рые тер­ми­ны все же отли­ча­ют­ся клю­че­вы­ми харак­те­ри­сти­ка­ми, напри­мер эти­ка геоб­ло­ки­ров­ки зани­ма­ет­ся исклю­чи­тель­но вопро­са­ми этич­но­сти лока­ли­за­ции интернет-контента.

Пред­став­лен­ный ниже гра­фик поз­во­ля­ет про­сле­дить, как меня­лась частот­ность упо­треб­ле­ния тер­ми­нов в англо­языч­ной лите­ра­ту­ре. На сего­дняш­ний день самые упо­треб­ля­е­мые сло­ва — это инфор­ма­ци­он­ная эти­ка (information ethics), ком­пью­тер­ная эти­ка (computer ethics) и циф­ро­вой эти­кет (digital ethics). При этом начи­ная с 2015 г. наблю­да­ет­ся стре­ми­тель­ный рост часто­ты упо­треб­ле­ния тер­ми­на циф­ро­вой эти­кет (digital ethics) (рис. 2).

Рис. 2. Частот­ность исполь­зо­ва­ния N‑грамм digital media ethics, digital ethics, cyberethics, AI ethics, information ethics, data ethics, internet ethics в англо­языч­ной лите­ра­ту­ре за пери­од 1800–2019 гг.
Источ­ник: Google Books Ngram Viewer.

Из пере­чис­лен­ных выше вари­ан­тов тер­ми­нов в рус­ско­языч­ной лите­ра­ту­ре сер­вис Google Books Ngram Viewer обна­ру­жил толь­ко сете­вой эти­кет, ком­пью­тер­ная эти­ка, инфор­ма­ци­он­ная эти­ка (рис. 3). Самым рас­про­стра­нен­ным явля­ет­ся поня­тие сете­во­го эти­ке­та.

Рис. 3. Частот­ность исполь­зо­ва­ния N‑грамм инфор­ма­ци­он­ная эти­ка, сете­вой эти­кет, ком­пью­тер­ная эти­ка в рус­ско­языч­ной лите­ра­ту­ре за пери­од 1800–2019 гг.
Источ­ник: Google Books Ngram Viewer.

Оче­вид­но, что циф­ро­вой эти­кет сего­дня — это широ­кое поня­тие, кото­рое вклю­ча­ет в себя более спе­ци­а­ли­зи­ро­ван­ные обла­сти эти­ки, такие как инфор­ма­ци­он­ная эти­ка, эти­ка боль­ших дан­ных, эти­ка алго­рит­мов, эти­ка циф­ро­вых медиа, эти­ка циф­ро­вой жур­на­ли­сти­ки, эти­ка геоб­ло­ки­ров­ки, эти­ка искус­ствен­но­го интел­лек­та и др.

Учи­ты­вая дан­ную спе­ци­фи­ку, неуди­ви­тель­но, что в насто­я­щее вре­мя суще­ству­ет боль­шое коли­че­ство лите­ра­ту­ры о пра­ви­лах ком­му­ни­ка­ции в вир­ту­аль­ном про­стран­стве. Оль­га Луки­но­ва в кни­ге «Циф­ро­вой эти­кет. Как не бесить друг дру­га в сети» отме­ча­ет, что «циф­ро­вой эти­кет помо­га­ет людям избе­жать нелов­ко­стей в обще­нии и пред­ла­га­ет гото­вые кон­струк­ции, как вести себя в раз­ных ситу­а­ци­ях в Сети», а так­же пред­ла­га­ет прак­ти­че­ские реко­мен­да­ции [Луки­но­ва 2020]. Дан­ное опре­де­ле­ние циф­ро­во­го эти­ке­та под­твер­жда­ет­ся в науч­ных пуб­ли­ка­ци­ях оте­че­ствен­ных авто­ров. Напри­мер, Л. Р. Дус­ка­е­ва в иссле­до­ва­нии рече­во­го эти­ке­та в онлайн-сооб­ще­ствах ука­зы­ва­ет на то, что «суще­ству­ю­щие пра­ви­ла в онлайн-сооб­ще­ствах направ­ле­ны на то, что­бы сде­лать обще­ние эмо­ци­о­наль­но ком­форт­ным, ней­тра­ли­зо­вать агрес­сию, поощ­рять поль­зо­ва­те­лей демон­стри­ро­вать веж­ли­вость и про­яв­лять вни­ма­ние друг к дру­гу» [Duskaeva 2020]. Изу­чая эти­кет­ные осо­бен­но­сти ком­му­ни­ка­ции в интер­нет-сооб­ще­ствах, О. В. Золт­нер дела­ет вывод о том, что в онлайн ком­му­ни­ка­ции про­ис­хо­дит «сти­ли­сти­че­ский сдвиг», то есть тра­ди­ци­он­ные пра­ви­ла рече­вых реги­стров в онлайн-сре­де не рабо­та­ют. Фами­льяр­ные, под­черк­ну­то-веж­ли­вые и гру­бые реги­стры рус­ско­го лите­ра­тур­но­го язы­ка пре­вра­ща­ют­ся в ней­траль­ные и дру­же­ски-неофи­ци­аль­ные [Золт­нер, Шабу­ро­ва 2017].

Кон­суль­та­тив­ная груп­па по эти­ке, учре­жден­ная Евро­пей­ским над­зор­ным орга­ном по защи­те дан­ных с целью изу­че­ния вза­и­мо­от­но­ше­ния меж­ду пра­ва­ми чело­ве­ка, тех­но­ло­ги­я­ми, рын­ка­ми и биз­нес-моде­ля­ми в XXI в., в опуб­ли­ко­ван­ном в 2018 г. отче­те ана­ли­зи­ру­ет труд­но­сти пере­хо­да в циф­ро­вой фор­мат жиз­ни. Спе­ци­а­ли­сты под­чер­ки­ва­ют, что необ­хо­ди­мо пере­осмыс­ле­ние фун­да­мен­таль­ных цен­но­стей в обще­стве, кото­рое управ­ля­ет­ся боль­ши­ми дан­ны­ми и в кото­ром есть уяз­ви­мые груп­пы. Тако­го рода зада­ча тре­бу­ет диа­ло­га меж­ду зако­но­да­те­ля­ми и экс­пер­та­ми по защи­те дан­ных, каса­ю­щих­ся вопро­сов сохра­не­ния непри­кос­но­вен­но­сти част­ной жиз­ни и мораль­но-эти­че­ских про­блем защи­ты дан­ных [Burgess et al. 2018].

Круг акту­аль­ных вопро­сов циф­ро­вой эти­ки так­же широк и раз­но­об­ра­зен. Уче­ные иссле­ду­ют про­бле­мы дис­кри­ми­на­ции раз­лич­ных групп насе­ле­ния в про­цес­се исполь­зо­ва­ния про­грам­мы рас­по­зна­ва­ния лиц [Khalil et al. 2020], слу­чаи неза­кон­но­го полу­че­ния пер­со­наль­ных дан­ных поль­зо­ва­те­лей Facebook* ком­па­ни­ей Cambridge Analytica [Venturini, Rogers 2019], исполь­зо­ва­ние соци­аль­ных медиа и Twitter-ботов в пери­од Брек­си­та и выбо­ров пре­зи­ден­та США в 2016 г. [Gorodnichenko, Pham, Talavera 2021] и пр.

В рам­ках наше­го иссле­до­ва­ния будем пони­мать циф­ро­вой эти­кет как про­дол­же­ние рече­во­го эти­ке­та, направ­лен­но­го на ней­тра­ли­за­цию агрес­сии по отно­ше­нию к уяз­ви­мым чле­нам обще­ства в онлайн-среде.

Описание методики исследования

Целью насто­я­ще­го иссле­до­ва­ния явля­ет­ся ана­лиз и после­ду­ю­щее срав­не­ние осо­бен­но­стей циф­ро­во­го эти­ке­та в рус­ском и англий­ском язы­ке на при­ме­ре тек­стов соци­аль­ных медиа, посвя­щен­ных теме мигра­ции и мигрантам.

В каче­стве мате­ри­а­ла были исполь­зо­ва­ны дан­ные соци­аль­ных медиа объ­е­мом 8 478 629 зна­ков («ВКон­так­те», «Одно­класс­ни­ки», YouTube и др.). Дата сбо­ра: с 11.11.2019 по 11.12.2019. Для ана­ли­за англо­языч­ных меди­а­тек­стов были собра­ны дан­ные iWeb по вход­но­му сло­ву migrant. Кор­пус iWeb содер­жит 14 млрд слов из Все­мир­ной пау­ти­ны и при­мер­но 95 000 веб-сай­тов, что поз­во­ля­ет сде­лать боль­шой охват ауди­то­рии и про­ана­ли­зи­ро­вать раз­но­об­раз­ный кон­тент, вклю­чая дан­ные соци­аль­ных сетей, фору­мов, чатов, постов и пр. Общий объ­ем про­ана­ли­зи­ро­ван­ных англо­языч­ных интер­нет-сооб­ще­ний 1 185 200 знаков.

В ходе рабо­ты были исполь­зо­ва­ны сле­ду­ю­щие мето­ды: сен­ти­мент-ана­лиз для выяв­ле­ния тональ­но­сти сооб­ще­ния [Agarwal et al. 2020; Poria, Hussain, Cambria 2018; Bing 2012; Solovyev, Antonova, Pazelskaya 2012], ана­лиз лек­си­че­ских ассо­ци­а­ций для опре­де­ле­ния интен­ций авто­ра и оце­ноч­ной пара­диг­мы тек­ста [Vivas et al. 2019; Kharlamov, Pilgun 2020; Nelson, McEvoy, Schreiber 2004].

Сен­ти­мент-ана­лиз пред­став­ля­ет собой выяв­ле­ние тональ­но­сти тек­ста с помо­щью фик­са­ции эмо­тив­ной лек­си­ки. Такой метод кон­тент-ана­ли­за может быть осу­ществ­лен с помо­щью авто­ма­ти­че­ских про­грамм тек­сто­во­го ана­ли­за, кото­рые постро­е­ны на осно­ве тональ­ных сло­ва­рей, тео­ре­ти­ко-гра­фо­вых моде­лей или алго­рит­мов машин­но­го обу­че­ния. Тональ­ность тек­ста так­же может быть опре­де­ле­на с помо­щью линг­ви­сти­че­ской экс­пер­ти­зы. Для наи­бо­лее эффек­тив­но­го ана­ли­за мы при­ме­ни­ли ком­би­на­цию ука­зан­ных методов.

Ана­лиз лек­си­че­ских ассо­ци­а­ций поз­во­ля­ет опре­де­лить интен­ции авто­ра и выявить импли­цит­ную инфор­ма­цию в сооб­ще­нии. Для дан­но­го иссле­до­ва­ния была исполь­зо­ва­на про­грам­ма интел­лек­ту­аль­но­го ана­ли­за тек­ста TextAnalyst, с помо­щью кото­рой мы выпол­ни­ли ассо­ци­а­тив­ный поиск по запро­су «мигрант».

Анализ материала и результаты исследования

Для ана­ли­за рус­ско­языч­ных меди­а­тек­стов была исполь­зо­ва­на Eureka Engine — систе­ма выяв­ле­ния тональ­но­сти сооб­ще­ний, раз­ра­бо­тан­ная Brand Analytics. Про­грам­ма бази­ру­ет­ся на ста­ти­сти­че­ском алго­рит­ме услов­ных слу­чай­ных полей CRF с исполь­зо­ва­ни­ем тональ­ных сло­ва­рей. В каче­стве вход­ных дан­ных исполь­зу­ют­ся после­до­ва­тель­но­сти лек­сем, затем алго­ритм вычис­ля­ет веро­ят­но­сти воз­мож­ных после­до­ва­тель­но­стей меток и выби­ра­ет мак­си­маль­но вероятную.

В резуль­та­те 29 % сооб­ще­ний были опре­де­ле­ны как нега­тив­ные, 66 % — ней­траль­ные и 5 % — поло­жи­тель­ные. При­ве­дем примеры.

Мигран­ты-раз­бой­ни­ки были задер­жа­ны поли­ци­ей в Москве.

Он сде­лал Моск­ву без­раз­мер­ной для мигран­тов всех мастей!

В насто­я­щее вре­мя в Моск­ву и дру­гие горо­да Рос­сии пере­се­ля­ют­ся мил­ли­о­ны мигран­тов (азер­бай­джан­цев, армян, афган­цев, китай­цев, вьет­нам­цев и т. д.).

Теперь гости Моск­вы из Сред­ней Азии пла­ни­ру­ют собрать­ся на смот­ро­вой пло­щад­ке Воро­бье­вых гор у глав­но­го зда­ния МГУ — там, где любит про­во­дить Новый год моло­дежь. Отме­тим, что в ряде реги­о­нов Таджи­ки­ста­на, Узбе­ки­ста­на и Кир­ги­зии дей­ству­ют запре­ты на отме­ча­ние «кафир­ско­го» Ново­го года.

Ленин­град­ская область по коли­че­ству мигран­тов зани­ма­ет чет­вер­тое место в Рос­сии, что накла­ды­ва­ет свой отпе­ча­ток на этно­кон­фес­си­о­наль­ную обста­нов­ку. Боль­шое вни­ма­ние в Ленин­град­ской обла­сти, по сло­вам Евге­ния Сирень­ко­го, уде­ля­ет­ся адап­та­ции мигрантов.

Поко­ле­ние бом­жей. Что ждет пона­е­хав­ших в мега­по­ли­сы. В Москве и Петер­бур­ге люди деся­ти­ле­ти­я­ми сни­ма­ют квар­ти­ры. Не пото­му, что хотят сво­бо­ды пере­ме­ще­ний и про­чих хип­стер­ских наво­ро­тов. Про­сто купить не могут.

Все тек­сто­вые дан­ные были раз­де­ле­ны на три бло­ка (нега­тив­ный, пози­тив­ный и ней­траль­ный) и про­ана­ли­зи­ро­ва­ны с помо­щью про­грам­мы авто­ма­ти­че­ско­го ана­ли­за тек­ста TextAnalyst.

Постро­ен­ная семан­ти­че­ская сеть выяви­ла смыс­ло­вой порт­рет ана­ли­зи­ру­е­мых дан­ных и опре­де­ли­ла основ­ные темы: адап­та­ция детей мигран­тов, обу­че­ние рус­ско­му язы­ку при­ез­жих, сохра­не­ние их наци­о­наль­но­го язы­ка, регу­ля­ция тру­до­вой дея­тель­но­сти мигран­тов на тер­ри­то­рии России.

Ней­траль­ные тек­сты фик­си­ру­ют тему асси­ми­ля­ции мигран­тов и их детей посред­ством обу­че­ния при­ез­жих куль­ту­ре и язы­ку этни­че­ско­го боль­шин­ства. Сле­ду­ет отме­тить, что в дан­ном бло­ке сооб­ще­ний были обна­ру­же­ны лек­се­мы с отри­ца­тель­ной семан­ти­кой, раз­го­вор­но-сни­жен­ная лек­си­ка, сло­ва с нега­тив­ной соци­аль­ной кон­но­та­ци­ей, что вли­я­ет на вос­при­я­тие тек­ста и поз­во­ля­ет его отне­сти к груп­пе негативных.

Сооб­ще­ния, выра­жа­ю­щие пози­тив­ную оцен­ку, отоб­ра­жа­ют тему инте­гра­ции мигран­тов и раз­ви­тие толе­рант­но­го отно­ше­ния к приезжим.

Нега­тив­ные сооб­ще­ния вклю­ча­ют лек­си­че­ские еди­ни­цы с опре­де­лен­ным ассо­ци­а­тив­ным ком­по­нен­том, син­так­си­че­ские кон­струк­ции и поня­тия, функ­ци­о­ни­ру­ю­щие как сте­рео­ти­пы, кото­рые спо­соб­ству­ют фор­ми­ро­ва­нию отри­ца­тель­ной тональности.

Для ана­ли­за направ­лен­но­сти англо­языч­но­го меди­тек­ста были собра­ны дан­ные iWeb по вход­но­му сло­ву migrant. В каче­стве инстру­мен­та иссле­до­ва­ния исполь­зо­ва­лась про­грам­ма авто­ма­ти­че­ско­го тек­сто­во­го ана­ли­за LIWC (Linguistic Inquiry and Word Count). Дан­ная про­грам­ма опре­де­ли­ла общий эмо­ци­о­наль­ный тон сооб­ще­ний как низ­кий, то есть боль­шин­ство сооб­ще­ний явля­ют­ся нега­тив­ны­ми. Выяв­лен­ная эмо­тив­ная лек­си­ка ука­зы­ва­ет на отри­ца­тель­ные кате­го­рии эмо­ций, в част­но­сти враж­деб­ность (рис. 4). Эмо­тив­ная лек­си­ка состав­ля­ет 3,17 %, фик­си­ру­ют­ся нега­тив­ные эмо­ции: бес­по­кой­ство (0,30 %), злость (0,45 %), грусть (0,28 %). Высо­кий про­цент «воз­дей­ствия» сооб­ще­ний (72,83 %) выяв­ля­ет сте­пень убеж­ден­но­сти авто­ра, что под­твер­жда­ет­ся высо­ким про­цен­том «ана­ли­ти­че­ско­го мыш­ле­ния» (96,39 %). Например.

But some kinds of work are not regulated. Children of migrant workers, for example, have no legal protection.

Angie. Now you have gone ahead and green-lighted an unlimited mass invasion of unscreened migrant hordes from the Middle East and Africa.

It is safe to say, then, that through the prism of the unrestricted movement of EU nationals into the UK, immigration was and is a cause of anxiety for many.

…whats happening is that the UK citizens are sick of being taken for fools, are sick of taking in people who don’t share their values and have no intention of but more importantly want the UK to adapt to them.

…real refugees take refuge in the first country they arrive in… these are financial migrants,, trying to get on the uk gravy train… the UK govt badly misjudged the feelings of its population over the farce that was brexit, the uk are leaving because the countries population has simply had enough of mass unchecked migration to the UK by millions… letting in these 25 yr old children just compound the issues…

Про­ве­ден­ный ана­лиз лек­си­че­ских ассо­ци­а­ций поз­во­лил выявить импли­цит­ную инфор­ма­цию дан­ных сооб­ще­ний. Необ­хо­ди­мо заме­тить, что в англо­языч­ных меди­а­текстах нами не было обна­ру­же­но сооб­ще­ний с пози­тив­ной направ­лен­но­стью, вме­сто это­го были выяв­ле­ны сооб­ще­ния, выра­жа­ю­щие эмпатию.

Нега­тив­ные кон­но­та­тив­ные харак­те­ри­сти­ки сооб­ще­ни­ям при­да­ют: заме­на сти­ли­сти­че­ски ней­траль­но­го сло­ва мар­ки­ро­ван­ным сино­ни­мом, лек­се­мы с отри­ца­тель­ной семан­ти­кой, отсыл­ка к нега­тив­ным собы­ти­ям и исполь­зо­ва­ние поня­тий с опре­де­лен­ным оце­ноч­ным ком­по­нен­том и тех, кото­рые транс­ли­ру­ют этни­че­ские стереотипы.

Выводы

Резуль­та­ты про­ве­ден­но­го ана­ли­за рус­ских и англо­языч­ных меди­а­тек­стов, посвя­щен­ных мигран­там, пока­зы­ва­ют, что коли­че­ство нега­тив­ных сооб­ще­ний в соци­аль­ных медиа о мигран­тах пре­вы­ша­ет пози­тив­ные сообщения.

В обо­их типах сооб­ще­ний была обна­ру­же­на пре­не­бре­жи­тель­ная раз­го­вор­нос­ни­жен­ная лек­си­ка, экс­прес­сив­ные син­так­си­че­ские кон­струк­ции, поли­се­мия со зна­че­ни­ем неодоб­ре­ния. В отли­чие от англий­ских, сре­ди рус­ско­языч­ных сооб­ще­ний были обна­ру­же­ны тек­сты с пози­тив­ной направ­лен­но­стью. В англо­языч­ных отме­че­ны сооб­ще­ния, выра­жа­ю­щие соли­дар­ность с мигран­та­ми в свя­зи с их уяз­ви­мым поло­же­ни­ем в обществе.

Таким обра­зом, дис­курс о мигран­тах в рус­ско­языч­ных и англо­языч­ных соци­аль­ных медиа отли­ча­ет­ся поли­те­ма­тич­но­стью. С одной сто­ро­ны, в циф­ро­вой сре­де при­сут­ству­ют поло­жи­тель­ные сооб­ще­ния о соци­о­куль­тур­ной адап­та­ции и инте­гра­ции мигран­тов, с дру­гой — вопро­сы сте­рео­ти­пи­за­ции по этни­че­ско­му и рели­ги­оз­но­му при­зна­ку все еще оста­ют­ся актуальными.

* Meta при­зна­на на тер­ри­то­рии РФ экс­тре­мист­ской организацией.

1 Чуть мень­ше сна: сколь­ко вре­ме­ни рос­си­яне сидят в интер­не­те (2020). Газета.ru. Элек­трон­ный ресурс https://​www​.gazeta​.ru/​t​e​c​h​/​2​0​2​0​/​0​2​/​1​2​/​1​2​9​5​6​9​2​9​/​w​e​_​a​r​e​_​s​o​c​i​a​l​.​s​h​tml. 

2 Поче­му люди в бли­жай­шем буду­щем не смо­гут пол­но­стью дове­рить­ся ИИ (2020). РБК. Трен­ды. Элек­трон­ный ресурс https://​trends​.rbc​.ru/​t​r​e​n​d​s​/​i​n​d​u​s​t​r​y​/​5​f​b​5​2​d​a​f​9​a​7​9​4​7​2​3​4​c​4​d​2​8d3. 

3 Эти­ка искус­ствен­но­го интел­лек­та (2022). Вики­пе­дия. Элек­трон­ный ресурс https://ru.wikipedia.org/wiki/%D0%AD%D1%82%D0%B8%D0%BA%D0%B0_%D0%B8%D1%81%D0%BA%D1%83%D1%81%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE_%D0%B8%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D0%B0. 

Ста­тья посту­пи­ла в редак­цию 4 сен­тяб­ря 2022 г.;
реко­мен­до­ва­на к печа­ти 9 мар­та 2023 г.

© Санкт-Петер­бург­ский госу­дар­ствен­ный уни­вер­си­тет, 2023

Received: September 4, 2022
Accepted: March 9, 2023