Четверг, 15 апреляИнститут «Высшая школа журналистики и массовых коммуникаций» СПбГУ

Лингвистические маркеры эмоционального состояния субъекта речи (к проблеме автоматического мониторинга текстов сетевой коммуникации)

Рабо­та выпол­не­на при финан­со­вой под­держ­ке РФФИ (грант № 19–29-07163)

This work was financially supported by the Russian Foundation for Basic Research
(grant no. 19–29-07163)

Постановка проблемы

Новей­шие тен­ден­ции в миро­вой эко­но­ми­ке (в част­но­сти, раз­ви­тие циф­ро­вых тех­но­ло­гий и вытес­не­ние чело­ве­ка из раз­лич­ных про­из­вод­ствен­ных сфер робо­ти­зи­ро­ван­ной тех­ни­кой) дела­ют весь­ма акту­аль­ной про­бле­му сохра­не­ния чело­ве­че­ско­го капи­та­ла. Чело­век ныне гораз­до чаще, чем в инду­стри­аль­ную эпо­ху, ока­зы­ва­ет­ся в ситу­а­ции ново­го про­фес­си­о­наль­но­го выбо­ра, для мно­гих пси­хо­ло­ги­че­ски весь­ма дис­ком­форт­ной, так как, теряя рабо­чее место, чело­век неред­ко лиша­ет­ся и чет­ких пер­спек­тив. Боль­шое зна­че­ние при­об­ре­та­ет спо­соб­ность субъ­ек­та нахо­дить инфор­ма­цию и при­ни­мать на ее осно­ве реше­ния. И если при­ня­тие реше­ния оста­ет­ся пока про­бле­мой само­го чело­ве­ка, то зада­чи поис­ка и обра­бот­ки инфор­ма­ции все чаще воз­ла­га­ют­ся на искус­ствен­ный интел­лект. Пола­га­ем поэто­му, что в скла­ды­ва­ю­щих­ся усло­ви­ях воз­рас­та­ет праг­ма­ти­че­ская роль иссле­до­ва­ний, ори­ен­ти­ро­ван­ных на совер­шен­ство­ва­ние тех­но­ло­гий инфор­ма­ци­он­но­го и пси­хо­ло­ги­че­ско­го сопро­вож­де­ния инди­ви­да в ситу­а­ции кризиса.

Целе­со­об­раз­но такие иссле­до­ва­ния начи­нать с изу­че­ния дина­ми­ки про­фес­си­о­наль­ной струк­ту­ры обще­ства и уста­нов­ле­ние основ­ных тен­ден­ций на рын­ке тру­да, осо­бое вни­ма­ние уде­ляя зада­че обна­ру­же­ния кри­зис­ных явле­ний. Пере­жи­ва­ние кри­зи­са неред­ко повы­ша­ет ком­му­ни­ка­тив­ную актив­ность чело­ве­ка, в том чис­ле в сете­вом кон­тен­те, в свя­зи с чем появ­ля­ет­ся воз­мож­ность допол­нить тра­ди­ци­он­ные социо­мет­ри­че­ские про­грам­мы (анке­ти­ро­ва­ние, опро­сы) мето­да­ми искус­ствен­но­го интел­лек­та (ИИ). В част­но­сти, совре­мен­ные тех­но­ло­гии в обла­сти авто­ма­ти­че­ско­го ана­ли­за тек­ста дела­ют вполне реаль­ной зада­чу иден­ти­фи­ка­ции выска­зы­ва­ний не толь­ко по их пред­мет­но­му (тема­ти­че­ско­му) содер­жа­нию, но и по отра­жен­ным в них пси­хо­ло­ги­че­ским харак­те­ри­сти­кам субъ­ек­та речи, или по субъ­ек­тив­ной модальности.

Апро­би­ро­ван­ные в при­клад­ной линг­ви­сти­ке мето­ды авто­ма­ти­че­ско­го ана­ли­за тек­стов ори­ен­ти­ро­ва­лись в основ­ном на счи­ты­ва­ние про­по­зи­тив­но­го, или дик­тум­но­го (объ­ек­тив­но­го), содер­жа­ния выска­зы­ва­ния, тогда как для изме­ре­ния пси­хи­че­ско­го состо­я­ния инди­ви­ду­мов и обще­ствен­ных настро­е­ний необ­хо­ди­мо обу­че­ние маши­ны рас­по­зна­ва­нию субъ­ек­тив­ной модаль­но­сти тек­ста — пони­ма­нию тех ком­по­нен­тов содер­жа­ния, кото­рые дают ключ к рекон­струк­ции раз­лич­ных субъ­ек­тив­ных смыс­лов, вклю­чая ком­му­ни­ка­тив­ные интен­ции гово­ря­ще­го, дале­ко не все­гда выра­жа­е­мые сег­мент­ны­ми (отно­си­тель­но лег­ко фор­ма­ли­зу­е­мы­ми) сред­ства­ми языка.

В насто­я­щей рабо­те рас­смат­ри­ва­ет­ся воз­мож­ность при­ме­не­ния мето­дов ана­ли­за субъ­ек­тив­ной модаль­но­сти в такой сфе­ре про­яв­ле­ния лич­ност­ных осо­бен­но­стей участ­ни­ков сете­во­го обще­ния, как нали­чие, выра­жен­ность и харак­тер пере­жи­ва­ний, порож­да­е­мых спе­ци­фи­че­ским состо­я­ни­ем — кри­зи­сом про­фес­си­о­наль­ной деятельности.

История вопроса

Кри­зи­сы — неиз­беж­ный и необ­хо­ди­мый ком­по­нент про­цес­са раз­ви­тия чело­ве­ка, в том чис­ле в сфе­ре его про­фес­си­о­наль­ной дея­тель­но­сти. Соглас­но клас­си­фи­ка­ции Э. Ф. Зее­ра, в нор­маль­ном тече­нии про­фес­си­о­наль­ной дея­тель­но­сти наблю­да­ют­ся несколь­ко кри­зис­ных эта­пов: кри­зис учеб­но-про­фес­си­о­наль­ной ори­ен­та­ции; реви­зии и кор­рек­ции про­фес­си­о­наль­но­го выбо­ра; про­фес­си­о­наль­ных экс­пек­та­ций; про­фес­си­о­наль­но­го роста; про­фес­си­о­наль­ной карье­ры; нере­а­ли­зо­ван­ных воз­мож­но­стей (соци­аль­но-про­фес­си­о­наль­ной само­ак­ту­а­ли­за­ции); ухо­да из про­фес­си­о­наль­ной жиз­ни; соци­аль­но-пси­хо­ло­ги­че­ской адек­ват­но­сти (после ухо­да на пен­сию) [Зеер 2003: 101–104].

При всем несход­стве при­чин, вызы­ва­ю­щих раз­ные типы про­фес­си­о­наль­но­го кри­зи­са, воз­мож­но выде­ле­ние общей кар­ти­ны раз­ви­тия кри­зис­но­го состо­я­ния (в том чис­ле его эмо­ци­о­наль­ной состав­ля­ю­щей), пред­по­ла­га­ю­ще­го про­хож­де­ние чело­ве­ком трех ста­дий: пред­кри­зис­ной, соб­ствен­но кри­ти­че­ской (острой) и раз­ре­ше­ния, или выхо­да из кризиса.

Для про­фес­си­о­наль­но­го кри­зи­са харак­те­ри­сти­ка­ми ста­дий слу­жат опре­де­лен­ные соче­та­ния пси­хо­ло­ги­че­ских и соци­аль­ных про­яв­ле­ний, отра­жа­ю­щих­ся так или ина­че в ком­му­ни­ка­тив­ной дея­тель­но­сти и в модаль­но­сти тек­стов, порож­да­е­мых пере­жи­ва­ю­щим кри­зис­ные состо­я­ния субъектом.

1. При­зна­ком пред­кри­зи­са явля­ет­ся состо­я­ние раз­ви­то­го пси­хо­ло­ги­че­ско­го дис­ком­фор­та, кото­рый отра­жа­ет пока еще не осо­зна­ва­е­мое недо­воль­ство чело­ве­ка достиг­ну­тым ста­ту­сом, содер­жа­ни­ем самой про­фес­си­о­наль­ной дея­тель­но­сти, сло­жив­шей­ся систе­мой отно­ше­ний, а про­яв­ля­ет­ся в виде неиз­би­ра­тель­ной раздражительности.

2. Фаза остро­го кри­зи­са харак­те­ри­зу­ет­ся осо­зна­ни­ем субъ­ек­тив­ной неудо­вле­тво­ри­тель­но­сти той про­фес­си­о­наль­ной ситу­а­ции, в кото­рой нахо­дит­ся чело­век. Невоз­мож­ность достичь быст­рых изме­не­ний при­во­дит к тому, что пси­хи­че­ская напря­жен­ность уси­ли­ва­ет­ся, нарас­та­ет неудо­вле­тво­рен­ность собой, эмо­ци­о­наль­ное состо­я­ние ста­но­вит­ся нега­тив­ным, воз­ни­ка­ет ощу­ще­ние бес­по­лез­но­сти, без­на­деж­но­сти, депрес­сии и апа­тии, повы­ша­ет­ся уро­вень тревоги.

3. Содер­жа­ни­ем пост­кри­ти­че­ской фазы ста­но­вит­ся кон­струк­тив­ное, про­фес­си­о­наль­но-ней­траль­ное или деструк­тив­ное раз­ре­ше­ние кон­флик­та. Пас­сив­ное отно­ше­ние к про­бле­ме и игно­ри­ро­ва­ние сиг­на­лов о необ­хо­ди­мо­сти изме­не­ний при­во­дит либо к стаг­на­ции, либо к дегра­да­ции и на про­фес­си­о­наль­ном, и на лич­ност­ном уровне. Кон­струк­тив­ный же исход из кри­зи­са ста­но­вит­ся воз­мож­ным бла­го­да­ря актив­но­сти чело­ве­ка как в плане реше­ния соб­ствен­но про­фес­си­о­наль­ных про­блем (сред­ством чего может высту­пать повы­ше­ние ква­ли­фи­ка­ции, поиск новых спо­со­бов выпол­не­ния дея­тель­но­сти, изме­не­ние про­фес­си­о­наль­но­го ста­ту­са, сме­на места рабо­ты, про­фес­сии и т. п.), так и в ком­му­ни­ка­тив­ной деятельности.

Про­ве­ден­ные ранее пило­таж­ные иссле­до­ва­ния [Куз­не­цо­ва, Пен­ки­на 2020], пока­зы­ва­ют, что ком­му­ни­ка­тив­ная актив­ность в Сети людей, нахо­дя­щих­ся в состо­я­нии про­фес­си­о­наль­но­го кри­зи­са, доста­точ­но высо­ка, для того что­бы ана­лиз кон­тен­та непро­филь­ных сай­тов и плат­форм мог предо­став­лять необ­хо­ди­мую инфор­ма­цию. Пер­спек­тив­ность иссле­до­ва­ния эмо­тив­ной состав­ля­ю­щей тек­стов, созда­ва­е­мых под вли­я­ни­ем состо­я­ния про­фес­си­о­наль­но­го кри­зи­са, опре­де­ля­ет­ся тем, что они име­ют явную тема­ти­че­скую выде­лен­ность и содер­жат как пря­мые эмо­тив­ные выска­зы­ва­ния, так и иные оце­ноч­ные ком­по­нен­ты, отно­си­мые в искус­ствен­ном интел­лек­те к фор­мам выра­же­ния мне­ния, т. е. все то, что в линг­ви­сти­ке назы­ва­ют субъ­ек­тив­ной модаль­но­стью, или моду­сом, про­ти­во­по­став­ляя эту кате­го­рию дик­ту­му.

Если дик­тум — это инфор­ма­ция о реаль­но­сти (физи­че­ском или мен­таль­ном мире), сто­я­щей вне созна­ния гово­ря­ще­го субъ­ек­та, то модус — это инфор­ма­ция, выра­жа­ю­щая «пози­цию гово­ря­ще­го отно­си­тель­но раз­ных ком­по­нен­тов рече­вой ком­му­ни­ка­ции» в дан­ном рече­вом акте, ина­че гово­ря, это «репре­зен­та­ция субъ­ек­та речи в выска­зы­ва­нии и тек­сте» [Мат­ве­е­ва 2010: 468–469]. Пред­ло­же­ние ста­но­вит­ся ком­му­ни­ка­тив­но осмыс­лен­ной еди­ни­цей (выска­зы­ва­ни­ем) лишь при усло­вии, что «в нем инфор­ма­ция о мире, объ­ек­тив­ной дей­стви­тель­но­сти соеди­нит­ся с инфор­ма­ци­ей субъ­ек­тив­ной» [Шме­ле­ва 1994: 6]. Толь­ко в про­цес­се рече­во­го акта про­по­зи­ция, вклю­ча­ясь в ком­му­ни­ка­тив­ную систе­му коор­ди­нат «я — здесь — сей­час», наде­ля­ет­ся «эго-смыс­ла­ми» [Бен­ве­нист 1974: 296] и полу­ча­ет ста­тус пол­но­цен­ной ком­му­ни­ка­тив­ной еди­ни­цы — слож­но­го зна­ка с «внеш­ней» (дик­тум­ной) и «внут­рен­ней» (модус­ной) рефе­рен­ци­ей (или ауто­ре­фе­рен­ци­ей) и опре­де­лен­ным тема-рема­ти­че­ским членением.

Необ­хо­ди­мо отли­чать соб­ствен­но модус («эго-смыс­лы») от тех дик­тум­ных ком­по­нен­тов содер­жа­ния выска­зы­ва­ния, кото­рые рефе­рент­но свя­за­ны с мен­таль­ной сфе­рой, но не с мен­таль­ным состо­я­ни­ем гово­ря­ще­го в момент речи ([‘Я говорю/полагаю’, что] Иван счи­та­ет, что Мария рав­но­душ­на к Пет­ру), где и изъ­яс­ни­тель­ный пре­ди­кат, и ска­зу­е­мое при­да­точ­но­го обра­зу­ют имен­но дик­тум, т. е. опи­сы­ва­ют внеш­нее отно­си­тель­но гово­ря­ще­го «поло­же­ние мен­таль­ных дел». Даже «эго-фор­мы» (напри­мер, 1‑го лица наст. вр. инди­ка­ти­ва эмо­тив­но­го гла­го­ла), несо­мнен­но выра­жая субъ­ек­тив­ную модаль­ность, не могут счи­тать­ся соб­ствен­но моду­сом (как обя­за­тель­ным ком­по­нен­том содер­жа­ния любо­го выска­зы­ва­ния). Так, какое-нибудь Я стра­даю ана­ло­гич­но по содер­жа­нию выра­же­ни­ям Он стра­да­ет, Ты стра­да­ешь [Бен­ве­нист 1974: 297].

Рече­вые мар­ке­ры моду­са адек­ват­но иден­ти­фи­ци­ру­ют­ся лишь с уче­том про­по­зи­тив­ной семан­ти­ки выска­зы­ва­ния, поэто­му модус­ный ана­ли­за­тор «встра­и­ва­ет­ся» в алго­рит­мы ана­ли­за про­по­зи­ций, объ­ек­ти­ви­ро­ван­ных в поверх­ност­но-син­так­си­че­ской струк­ту­ре авто­ном­но­го выска­зы­ва­ния. Труд­ность заклю­ча­ет­ся в том, что модус, во-пер­вых, может быть импли­цит­ным (пол­но­стью или отча­сти), во-вто­рых, выра­жать­ся сверх­сег­мент­ны­ми сред­ства­ми (инто­на­ци­ей и поряд­ком слов), нако­нец, в‑третьих, опре­де­лять­ся неко­то­ры­ми дис­кур­сив­ны­ми усло­ви­я­ми (кон­вен­ци­я­ми, при­ня­ты­ми для опре­де­лен­ных рече­вых жан­ров в той или иной сфе­ре общения).

Экс­пли­цит­ные (вклю­чая выра­жен­ные сверх­сег­мент­ны­ми сред­ства­ми) и импли­цит­ные ком­по­нен­ты моду­са (так ска­зать, нуле­вые модус­но-пер­фор­ма­тив­ные рам­ки) в зна­чи­тель­ной мере узу­аль­ны, а пото­му выяв­ле­ние их тек­сто­вых пока­за­те­лей ока­зы­ва­ет­ся не слиш­ком слож­ной зада­чей. Одна­ко это спра­вед­ли­во лишь для тек­стов пря­мой ком­му­ни­ка­ции (выска­зы­ва­ний с пря­мой илло­ку­ци­ей, в кото­рых импли­цит­ная пер­фор­ма­тив­ная рам­ка согла­су­ет­ся с закреп­лен­ной в систе­ме язы­ка син­так­си­че­ской фор­мой). В то же вре­мя вклю­че­ние в авто­ма­ти­че­ский ана­ли­за­тор язы­ко­вых выра­же­ний, смысл кото­рых опре­де­ля­ет­ся дис­кур­сив­ны­ми кон­вен­ци­я­ми, выво­дит его (ана­ли­за­тор) в область дина­мич­ной речи, где гос­под­ству­ет кос­вен­ная илло­ку­ция и язы­ко­вая игра, а это суще­ствен­но услож­ня­ет зада­чу авто­ма­ти­че­ско­го выяв­ле­ния субъ­ек­тив­ных ком­по­нен­тов содер­жа­ния еди­ниц тек­ста. Реше­ние такой зада­чи прин­ци­пи­аль­но воз­мож­но лишь при усло­вии выхо­да из язы­ко­вой систем­но­сти в рече­вую [Кожи­на 2014]. Понят­но, что в обла­сти речи, где нет «жест­ких» грам­ма­ти­че­ских моде­лей (т. е. регу­ляр­но вос­про­из­во­ди­мых форм, за кото­ры­ми закреп­ле­но типо­вое содер­жа­ние), веро­ят­ность адек­ват­ной иден­ти­фи­ка­ции субъ­ек­тив­ных смыс­лов гово­ря­ще­го сни­жа­ет­ся, и что­бы добить­ся при­ем­ле­мо­го уров­ня пра­виль­ных реше­ний ана­ли­за­то­ра, необ­хо­ди­мо учи­ты­вать все мно­же­ство фор­ма­ли­зу­е­мых рече­вых мар­ке­ров, име­ю­щих­ся как в ана­ли­зи­ру­е­мом фраг­мен­те тек­ста, так и в его бли­жай­шем окружении.

Мето­ды авто­ма­ти­че­ско­го ана­ли­за осно­вы­ва­ют­ся пре­иму­ще­ствен­но на логи­ко­син­так­си­че­ских кон­цеп­ци­ях смыс­ла выска­зы­ва­ния. Осо­бен­но пло­до­твор­ным, на наш взгляд, ста­ло моде­ли­ро­ва­ние дик­тум­но­го содер­жа­ния тек­ста на осно­ве струк­ту­ры ситу­а­ции (реля­ци­он­ной струк­ту­ры), отра­жен­ной в поверх­ност­но-син­так­си­че­ской струк­ту­ре выска­зы­ва­ния. Дру­ги­ми сло­ва­ми, меж­ду раз­лич­ны­ми ком­по­нен­та­ми пред­ло­же­ния уста­нав­ли­ва­ют­ся отно­ше­ния, соот­вет­ству­ю­щие неко­то­рым уни­вер­саль­ным (глу­бин­ным) ролям, испол­ня­е­мым пар­ти­ци­пан­та­ми опи­сы­ва­е­мой в пред­ло­же­нии ситу­а­ции (агенс, паци­енс, инстру­мент и др.). Фак­ти­че­ски роли опре­де­ля­ют­ся лек­си­че­ским зна­че­ни­ем пре­ди­кат­но­го сло­ва, чаще все­го гла­го­ла, в кото­ром «фик­си­ру­ет­ся» струк­ту­ра отра­жа­е­мой ситу­а­ции. В линг­ви­сти­че­ской части метод реля­ци­он­но-ситу­а­ци­он­но­го ана­ли­за (РСА) опи­ра­ет­ся на ком­му­ни­ка­тив­ный син­так­сис [Золо­то­ва 2010], в обла­сти ИИ — на тео­рию неод­но­род­ных семан­ти­че­ских сетей [Оси­пов 2011].

Поста­нов­ка зада­чи авто­ма­ти­че­ско­го счи­ты­ва­ния не толь­ко дик­тум­ной, но и модус­ной инфор­ма­ции тре­бу­ет даль­ней­шей акти­ви­за­ции иссле­до­ва­ний, направ­лен­ных на совер­шен­ство­ва­ние мето­дов извле­че­ния импли­цит­ной инфор­ма­ции — того содер­жа­ния, кото­рое в рече­вой ком­му­ни­ка­ции извле­ка­ет­ся из тек­ста бла­го­да­ря фоно­вым зна­ни­ям (вклю­чая зна­ние пре­це­дент­ных тек­стов) и нали­чию у ком­му­ни­кан­тов «дис­кур­сив­ных ком­пе­тен­ций», поз­во­ля­ю­щих им учи­ты­вать мно­же­ство отно­ше­ний, воз­ни­ка­ю­щих меж­ду часто вос­про­из­во­ди­мы­ми в дан­ном дис­кур­се тек­сто­вы­ми еди­ни­ца­ми (кол­ло­ка­ци­я­ми).

Это озна­ча­ет, что авто­ма­ти­че­ское извле­че­ние импли­цит­ной инфор­ма­ции тре­бу­ет раз­ра­бот­ки алго­рит­мов пред­ва­ри­тель­но­го машин­но­го обу­че­ния на обшир­ных кор­пу­сах тек­стов опре­де­лен­но­го жан­ра в соста­ве опре­де­лен­но­го дис­кур­са. Пред­ла­га­ет­ся, в част­но­сти, метод «встра­и­ва­ния» в ана­ли­зи­ру­е­мый текст слов (Discoursespecific Word Embeddings), т. е., по сути, «достра­и­ва­ния» (домыс­ли­ва­ния) тек­ста путем экс­тра­по­ля­ции отно­ше­ний, выра­жа­е­мых в ана­ло­гич­ных текстах экс­пли­цит­но [Changxing et al. 2017; Jun et al. 2019].

Для обес­пе­че­ния авто­ма­ти­че­ско­го извле­че­ния эмо­тив­ной состав­ля­ю­щей речи на сты­ке линг­ви­сти­ки (преж­де все­го пси­хо­линг­ви­сти­ки) и искус­ствен­но­го интел­лек­та сфор­ми­ро­ва­лось осо­бое направ­ле­ние, име­ну­е­мое в англо­языч­ных рабо­тах тер­ми­на­ми «май­нинг» (opinion mining — ана­лиз мне­ний) и sentiment analisis, а в рус­ско­языч­ной лите­ра­ту­ре — тер­ми­ном «ана­лиз тональ­но­сти» (обзо­ры работ это­го направ­ле­ния см. в: [Кули­ков 2016; Raghuvanshi, Patil 2016; Das et al. 2017; Francisco et al. 2017; Varathan et al. 2017; Mishra et al. 2018].

Клю­че­вы­ми для ана­ли­за субъ­ек­тив­ной модаль­но­сти речи явля­ют­ся под­хо­ды, осно­ван­ные на пси­хо­линг­ви­сти­че­ских мето­дах и мето­дах искус­ствен­но­го интел­лек­та. Пси­хо­линг­ви­сти­че­ский под­ход под­ра­зу­ме­ва­ет при­ме­не­ние при ана­ли­зе тек­ста набо­ра мар­ке­ров, ото­бран­ных по резуль­та­там спе­ци­аль­ных эмпи­ри­че­ских иссле­до­ва­ний по прин­ци­пу устой­чи­вой кор­ре­ля­ции с эмо­ци­о­наль­ным состо­я­ни­ем авто­ра, диа­гно­сти­ру­е­мым с помо­щью спе­ци­аль­ных мето­дик [Гудов­ских, Молош­ни­ков, Рыб­ка 2015; Кол­мо­го­ро­ва, Вдо­ви­на 2019].

В пара­диг­ме искус­ствен­но­го интел­лек­та про­це­ду­ра оцен­ки тональ­но­сти сво­дит­ся к реше­нию зада­чи клас­си­фи­ка­ции, т. е. опре­де­ле­ния поло­же­ния ана­ли­зи­ру­е­мо­го содер­жа­ния на шка­ле оце­нок бинар­ных («нега­тив­ный» — «пози­тив­ный»), тер­нар­ных («нега­тив­ный» — «ней­траль­ный» — «пози­тив­ный») или n‑арных. При­ме­ром при­ме­не­ния мно­го­мер­ной моде­ли может слу­жить авто­ма­ти­че­ский клас­си­фи­ка­тор рус­ско­языч­ных интер­нет-тек­стов, рас­пре­де­ля­ю­щий тек­сты на восемь клас­сов в соот­вет­ствии с восе­мью эмо­ци­я­ми: «злость/гнев», «интерес/возбуждение», «удовольствие/радость», «брезгливость/отвращение», «удив­ле­ние», «стыд/унижение», «страх/ужас», «страдание/тоска» [Кол­мо­го­ро­ва, Вдо­ви­на 2019]. Одна­ко иссле­до­ва­ния пока­зы­ва­ют, что услож­не­ние оце­ноч­но­го аппа­ра­та ведет не столь­ко к полу­че­нию более тон­ких раз­ли­чий, сколь­ко к росту неод­но­знач­но­сти и неопре­де­лен­но­сти полу­ча­е­мых резуль­та­тов. Так, для тек­стов на рус­ском язы­ке при бинар­ной клас­си­фи­ка­ции зна­че­ние согла­сия экс­пер­тов, оце­ни­ва­ю­щих тональ­ность, нахо­дит­ся на уровне 80 %, а при выде­ле­нии трех клас­сов это зна­че­ние умень­ша­ет­ся до 70 % [Chetviorkin, Braslavskiy, Loukachevitch 2012].

При реше­нии задач авто­ма­ти­че­ско­го ана­ли­за тональ­но­сти при­ме­ня­ют­ся два основ­ных под­хо­да — машин­ное обу­че­ние и сло­вар­ный метод [Mishra et al. 2018]. В пер­вом из них клас­си­фи­ка­тор стро­ит­ся на осно­ве кор­пу­са раз­ме­чен­ных обу­ча­ю­щих тек­стов, каж­дый из кото­рых отне­сен к одно­му из зна­че­ний на шка­ле тональ­но­сти. Пре­иму­ще­ством машин­но­го обу­че­ния явля­ет­ся высо­кая точ­ность ана­ли­за, одна­ко при этом необ­хо­ди­ма тру­до­ем­кая рабо­та по состав­ле­нию кор­пу­са обу­ча­ю­щих тек­стов, а постро­ен­ный клас­си­фи­ка­тор часто не учи­ты­ва­ет кон­текст и его слож­но интер­пре­ти­ро­вать и пере­но­сить в дру­гие пред­мет­ные обла­сти. При сло­вар­ном под­хо­де вме­сто раз­ме­чен­ных тек­стов исполь­зу­ют­ся мас­си­вы оце­ноч­ной лек­си­ки (сло­ва­ри), поз­во­ля­ю­щие опре­де­лить тональ­ность лек­си­че­ских еди­ниц тек­ста и на этой осно­ве при­нять реше­ние о тональ­но­сти тек­ста в целом. Такой под­ход поз­во­ля­ет лег­ко интер­пре­ти­ро­вать про­цесс клас­си­фи­ка­ции, а необ­хо­ди­мость в раз­мет­ке обу­ча­ю­щих тек­стов отсут­ству­ет. Одна­ко точ­ность часто ока­зы­ва­ет­ся ниже, чем при машин­ном обу­че­нии [Котель­ни­ков 2019].

Сло­вар­ный под­ход преду­смат­ри­ва­ет состав­ле­ние спис­ков слов, спо­соб­ных выра­жать эмо­ци­о­наль­ную оцен­ку авто­ра тек­ста. К про­блем­ным момен­там, не поз­во­ля­ю­щим зна­чи­тель­но повы­сить эффек­тив­ность это­го под­хо­да, отно­сят­ся такие свой­ства оце­ноч­ных ресур­сов язы­ка и речи, как кон­тек­сту­аль­ная вари­а­тив­ность (по сути, энан­тио­се­мич­ность) аксио­ло­ги­че­ско­го зна­че­ния слов (ср.: Бата­рей­ка рабо­та­ет дол­го — Фокус настра­и­ва­ет­ся дол­го), исполь­зо­ва­ние во мно­гих дис­кур­сах форм непря­мой ком­му­ни­ка­ции, интер­тек­сту­аль­ных свя­зей, что обу­слов­ли­ва­ет импли­цит­ность оце­ноч­но­го содер­жа­ния тек­ста [Лука­ше­вич 2017].

Систе­мы ана­ли­за тональ­но­сти, осно­ван­ные на машин­ном обу­че­нии, реа­ли­зу­ют­ся в после­до­ва­тель­но­сти опре­де­лен­ных реше­ний, напри­мер: 1) выбор алго­рит­мов клас­си­фи­ка­ции, сре­ди кото­рых наи­бо­лее эффек­тив­ны­ми при­зна­ют­ся метод опор­ных век­то­ров SVM, наив­ный бай­е­сов­ский клас­си­фи­ка­тор и ней­рон­ные сети; 2) выбор при­зна­ков, в соот­вет­ствии с кото­рым текст может быть пред­став­лен в виде а) набо­ра слов (bag-of-words) или б) набо­ра уни- би- или n-грамм; в каче­стве допол­ни­тель­ных при­вле­ка­ют­ся такие при­зна­ки, как части речи; пунк­ту­а­ция (напри­мер, нали­чие вос­кли­ца­тель­ных зна­ков); могут учи­ты­вать­ся так­же семан­ти­че­ские отно­ше­ния меж­ду сло­ва­ми с помо­щью таких ресур­сов, как раз­лич­ные теза­у­ру­сы, онто­ло­гии, семан­ти­че­ские сети [Лука­ше­вич 2017].

Описание методов исследования

Модус­ные смыс­лы, каза­лось бы, не соот­не­се­ны напря­мую со струк­ту­рой ситу­а­ции (с неко­то­рым «поло­же­ни­ем дел», «сце­на­ри­ем»), ибо при­вя­за­ны к мен­таль­но­му миру субъ­ек­та речи, тем не менее модель РСА может быть с успе­хом при­ме­не­на и для ана­ли­за субъ­ек­тив­ных смыс­лов — моти­вов и интен­ций гово­ря­ще­го, его оце­нок и мне­ний, отно­ше­ния к опи­сы­ва­е­мым собы­ти­ям и их участ­ни­кам. К тому же модус­ный ана­лиз тек­ста, вооб­ще гово­ря, не может быть осу­ществ­лен без ана­ли­за дик­тум­но­го содер­жа­ния, а реа­ли­зу­ет­ся, по при­ро­де язы­ка, как модус-дик­тум­ный ана­лиз. Поэто­му имен­но на метод РСА, поз­во­лив­ший полу­чить хоро­шие резуль­та­ты при созда­нии моде­лей рас­по­зна­ва­ния в текстах мен­таль­ных дей­ствий, про­цес­сов и состо­я­ний [Сали­мов­ский и др. 2019], ори­ен­ти­ру­ет­ся раз­ра­ба­ты­ва­е­мый авто­ра­ми линг­ви­сти­че­ский ана­ли­за­тор модус­ных смыслов.

При реше­нии задач авто­ма­ти­че­ской обра­бот­ки тек­ста на базе мето­да РСА при­ме­ня­ют­ся шаб­ло­ны, зада­ю­щие мно­же­ство неод­но­род­ных семан­ти­че­ских сетей, кото­рые поз­во­ля­ют учи­ты­вать раз­но­уров­не­вые линг­ви­сти­че­ские при­зна­ки, необ­хо­ди­мые для реше­ния при­клад­ных задач [Оси­пов 2011]. В созда­нии шаб­ло­на, кро­ме про­грам­ми­ста, при­ни­ма­ют уча­стие пси­хо­лог, рас­кры­ва­ю­щий суще­ствен­ные при­зна­ки моде­ли­ру­е­мых мен­таль­ных про­цес­сов и состо­я­ний, и линг­вист, чьей зада­чей явля­ет­ся как мож­но более пол­ное и точ­ное опи­са­ние средств объ­ек­ти­ва­ции этих про­цес­сов и состо­я­ний в тексте.

Для авто­ма­ти­че­ско­го мони­то­рин­га сете­во­го кон­тен­та и выяв­ле­ния в нем тек­стов опре­де­лен­ной тема­ти­ки и опре­де­лен­ной модаль­но­сти раз­ра­ба­ты­ва­ет­ся бази­ру­ю­щий­ся на моде­ли РСА метод авто­ма­ти­че­ско­го тема­ти­че­ско­го пси­хо­линг­ви­сти­че­ско­го ана­ли­за тек­стов (АТПЛАТ), для чего исполь­зу­ют­ся как линг­ви­сти­че­ские мето­ды, напри­мер раз­лич­ные мето­ды лек­си­че­ской семан­ти­ки [Васи­льев 1990], наце­лен­ные на фор­ми­ро­ва­ние тема­ти­че­ских групп слов (ТГС), так и мето­ды искус­ствен­но­го интел­лек­та, в част­но­сти метод выде­ле­ния клю­че­вых слов на осно­ве харак­те­ри­сти­ки тема­ти­че­ской зна­чи­мо­сти, раз­ра­бо­тан­ный для авто­ма­ти­че­ско­го ана­ли­за боль­ших мас­си­вов дан­ных в систе­ме TextAppliance [Мбай­код­жи, Драль, Сочен­ков 2012; Ана­нье­ва и др. 2016].

Линг­ви­сти­че­ский ана­ли­за­тор в моде­ли РСА вклю­ча­ет фор­ма­ли­зо­ван­ный сло­варь пре­ди­кат­ных слов (СПС), в кото­ром каж­до­му пре­ди­кат­но­му сло­ву сопо­став­ле­но мно­же­ство актан­тов, задан­ных в виде семан­ти­че­ских ролей и их поверх­ност­но-син­так­си­че­ских реа­ли­за­ций (син­так­сем). Типо­ло­гия пре­ди­ка­тов, имен и семан­ти­че­ских ролей стро­ит­ся по прин­ци­пу откры­той архи­тек­ту­ры (или по модуль­но­му прин­ци­пу), кото­рый поз­во­ля­ет рас­ши­рять в слу­чае необ­хо­ди­мо­сти номен­кла­ту­ру клас­сов, так что любой пре­ди­кат или семан­ти­че­ская роль (отно­ше­ние), пред­став­ля­е­мые при реше­нии той или иной зада­чи как тер­ми­наль­ные («пре­дель­ные»), могут быть рас­щеп­ле­ны на более кон­крет­ные виды. Так, в аспек­те пси­хо­ло­ги­че­ско­го (модус­но­го) ана­ли­за тек­ста недо­ста­точ­но выяв­лять узу­аль­ные (фик­си­ру­е­мые в тол­ко­вом сло­ва­ре) ком­по­нен­ты семан­ти­ки лек­сем, но важ­но раз­гра­ни­чи­вать (и научить маши­ну раз­гра­ни­чи­вать) «аффек­тив­ные потен­ци­а­лы» слов, исполь­зу­е­мых в раз­ных кон­текстах и раз­ных ситу­а­ци­ях общения.

Анализ материала

В рам­ках жур­наль­ной ста­тьи не пред­став­ля­ет­ся воз­мож­ным опи­сать все фор­маль­ные рече­вые мар­ке­ры (вклю­чая и такие, интер­пре­та­ция кото­рых воз­мож­на с уче­том пред­ше­ству­ю­ще­го кон­тек­ста), поэто­му оха­рак­те­ри­зу­ем здесь лишь наи­бо­лее яркие пока­за­те­ли модус­ных и дик­тум­ных смыс­лов, суще­ствен­ные с точ­ки зре­ния авто­ма­ти­че­ской иден­ти­фи­ка­ции тема­ти­че­ски опре­де­лен­ных тек­стов сете­вой ком­му­ни­ка­ции, выра­жа­ю­щих в целом опти­ми­сти­че­скую тональ­ность или, напро­тив, пес­си­ми­сти­че­ские (кри­зис­ные) настроения.

Пере­чис­лим основ­ные узу­аль­ные сред­ства моду­са, раз­де­лив их на экс­пли­цит­ные и импли­цит­ные. Экс­пли­цит­ные сред­ства, в свою оче­редь, по оче­вид­но­му кри­те­рию делят­ся на сег­мент­ные, выра­жен­ные зву­ка­ми или гра­фи­че­ски­ми сим­во­ла­ми, и сверх­сег­мент­ные (супра­сег­мент­ные). К послед­ним отно­сят­ся, как извест­но, про­со­ди­че­ские сред­ства (инто­на­ция и уда­ре­ние) и осо­бен­но­сти линей­ной струк­ту­ры тек­ста. Ого­во­рим сра­зу, что, посколь­ку в наши зада­чи вхо­дит ана­лиз лишь пись­мен­ных тек­стов соци­аль­ных сетей, из сверх­сег­мент­ных мар­ке­ров моду­са мы можем учи­ты­вать толь­ко осо­бен­но­сти линей­ной струк­ту­ры выска­зы­ва­ния и невер­баль­ные гра­фи­че­ские зна­ки (шриф­то­вые выде­ле­ния и идео­гра­фи­че­ские сим­во­лы эмоций).

Импли­цит­ные узу­аль­ные сред­ства — это не что иное, как нуле­вой модусм). Заме­тим попут­но, что интер­тек­сту­аль­ные импли­ка­ту­ры в узус не вхо­дят: они при­вя­за­ны к весь­ма широ­ко­му кон­тек­сту и дис­кур­сив­ным кон­вен­ци­ям, а пото­му их авто­ма­ти­че­ское счи­ты­ва­ние может быть реа­ли­зо­ва­но толь­ко при допол­не­нии инстру­мен­та­рия СПС мас­си­ва­ми часто цити­ру­е­мых в дан­ной линг­во­куль­ту­ре выра­же­ний, заим­ство­ван­ных из пре­це­дент­ных тек­стов («кры­ла­тых выра­же­ний»), и пра­ви­ла­ми их интерпретации.

Экс­пли­цит­ные сред­ства моду­са вхо­дят в широ­кие клас­сы акци­о­наль­ных и неак­ци­о­наль­ных пре­ди­ка­тов (мен­таль­но­го состо­я­ния, ква­ли­фи­ка­тив­ных и др.), внут­ри кото­рых они обра­зу­ют груп­пы эмо­тив­ных пре­ди­ка­тов раз­но­го уров­ня абстрак­ции. На тер­ми­наль­ном уровне мож­но выде­лять, напри­мер, пре­ди­ка­ты рече­вой агрес­сии (выра­же­ние эмо­ций враж­ды и нена­ви­сти), «гоно­ри­фи­че­ские» (выра­же­ние ува­же­ния) и «май­е­ста­ти­че­ские» (воз­ве­ли­чи­ва­ю­щие) пре­ди­ка­ты и т. п.

С уче­том опы­та моде­ли­ро­ва­ния когни­тив­но-аффек­тив­ных состо­я­ний и дей­ствий по мето­ду РСА при раз­ра­бот­ке шаб­ло­нов для модус-дик­тум­но­го авто­ма­ти­че­ско­го ана­ли­за исполь­зу­ет­ся фор­ма­ли­зо­ван­ная инфор­ма­ция о семан­ти­ке пре­ди­кат­ных слов, обли­га­тор­ных валент­но­стей пре­ди­ка­тов, т. е. о семан­ти­че­ских ролях их актан­тов, и о поверх­ност­но-син­так­си­че­ских реа­ли­за­ци­ях актан­тов. Эта инфор­ма­ция в сово­куп­но­сти отоб­ра­жа­ет как струк­ту­ру опи­сы­ва­е­мой ситу­а­ции (рефе­рен­та выска­зы­ва­ния в его дик­тум­ной части), так и мен­таль­ное состо­я­ние авто­ра тек­ста (соб­ствен­но модус), при этом, под­черк­нем, дик­тум­ная (объ­ек­тив­ная по отно­ше­нию к гово­ря­ще­му) часть выска­зы­ва­ния может отоб­ра­жать те же смыс­лы, что и модус, если актан­та­ми пре­ди­ка­та (пар­ти­ци­пан­та­ми ситу­а­ции) явля­ют­ся лич­ные суще­стви­тель­ные или место­име­ния (ср.: Боюсь, что после это­го Мария оби­дит­ся на Пет­ра).

Для выяв­ле­ния рече­вых мар­ке­ров эмо­ци­о­наль­ных состо­я­ний и моти­ви­ро­ван­ных ими ком­му­ни­ка­тив­ных интен­ций была про­ве­де­на «руч­ная» раз­мет­ка неко­то­ро­го мно­же­ства тек­стов1 задан­ной тема­ти­ки (270 тек­стов объ­е­мом от двух до четы­рех тысяч зна­ков, содер­жа­тель­но свя­зан­ных с про­бле­ма­ми про­фес­си­о­наль­но­го обра­зо­ва­ния, про­фес­си­о­наль­но­го кри­зи­са, кад­ро­вой мобиль­но­сти и др.). Полу­чен­ный в ито­ге спи­сок слов, отно­ся­щих­ся к этим темам, был рас­пре­де­лен по под­груп­пам, соот­вет­ству­ю­щим кон­крет­ным семан­ти­че­ским полям («обра­зо­ва­ние», «про­фес­сия / род заня­тий», «карьера/служба» и др.). Кро­ме того, были выде­ле­ны устой­чи­вые соче­та­ния слов (кол­ло­ка­ции) с поло­жи­тель­ной и отри­ца­тель­ной оце­ноч­но­стью (напри­мер, достой­ная опла­та тру­да, отток кад­ров, коман­да высо­ко­ква­ли­фи­ци­ро­ван­ных спе­ци­а­ли­стов, нехват­ка ква­ли­фи­ци­ро­ван­ных спе­ци­а­ли­стов и т. п.).

Для каж­до­го из выска­зы­ва­ний интро­спек­тив­но рекон­стру­и­ру­ют­ся ком­му­ни­ка­тив­ные интен­ции, что поз­во­ля­ет экс­пли­ци­ро­вать (в точ­ном обо­зна­че­нии) ком­му­ни­ка­тив­ные цели выска­зы­ва­ния (‘Я (не)хочу, что­бы…, поэто­му гово­рю / про­шу / пре­ду­пре­ждаю / обе­щаю / при­зы­ваю / сове­тую…’; ‘Я оце­ни­ваю…, поэто­му гово­рю / назы­ваю…’), и опи­сы­ва­ют­ся внешне выра­жен­ные рече­вые мар­ке­ры рекон­стру­и­ру­е­мых модус­ных смыс­лов. Тако­го рода опи­са­ние так­же вклю­ча­ет­ся в линг­ви­сти­че­ские шаб­ло­ны, на осно­ве кото­рых и созда­ют­ся алго­рит­мы авто­ма­ти­че­ско­го мони­то­рин­га сете­во­го контента.

В текстах, свя­зан­ных с озна­чен­ны­ми тема­ми, с высо­кой веро­ят­но­стью ожи­да­ет­ся исполь­зо­ва­ние таких линг­ви­сти­че­ских мар­ке­ров модальности:

— пре­ди­ка­ты мен­таль­но­го (эмо­ци­о­наль­но­го и интел­лек­ту­аль­но­го) состо­я­ния (Рмент.стат) — знать, верить, пола­гать, счи­тать; разу­ве­рить­ся, сомне­вать­ся, быть убеж­ден­ным; инте­ре­со­вать­ся, обра­щать вни­ма­ние; согла­шать­ся, раз­де­лять мне­ние (точ­ку зре­ния, взгляд…); оши­бать­ся, заблуж­дать­ся; вос­хи­щать­ся, одоб­рять, осуж­дать, радо­вать­ся, огор­чать­ся, ску­чать, гру­стить, оби­жать­ся, бес­по­ко­ить­ся, вооду­шев­лять­ся, отча­и­вать­ся, страдать;

функ­тив­ные пре­ди­ка­ты (Рфункт): рабо­тать, слу­жить, спе­ци­а­ли­зи­ро­вать­ся, ста­жи­ро­вать­ся, гото­вить­ся, про­хо­дить обу­че­ние / под­го­тов­ку / пере­под­го­тов­ку, повы­шать ква­ли­фи­ка­цию, учить­ся, обу­чать­ся, полу­чать специальность/профессию и т. п.);

модаль­ные пре­ди­ка­ты, сре­ди кото­рых осо­бен­но частот­ны пре­ди­ка­ты с опта­тив­ной и кона­тив­ной модаль­но­стью (Ркон, Ропт): соби­рать­ся, наме­ре­вать­ся, меч­тать, наде­ять­ся, ожи­дать (успе­хов, пора­же­ний), видеть себя; выби­рать, решать(ся); пла­ни­ро­вать, пытать­ся, доби­вать­ся, дости­гать, стремиться;

— акци­о­наль­ные пре­ди­ка­ты мен­таль­но­го пла­на (Рмент), обо­зна­ча­ю­щие доволь­но широ­кий спектр рече­мыс­ли­тель­ных дей­ствий, выра­жа­ют субъ­ек­тив­ную модаль­ность по опре­де­ле­нию (сво­ей кате­го­ри­аль­ной семан­ти­кой): боль­шин­ство из них может упо­треб­лять­ся в пози­ции соб­ствен­но моду­са (пер­фор­ма­ти­ва), т. е. в фор­ме 1 л. наст. вр. инди­ка­ти­ва (инфор­ми­ро­вать, сооб­щать, гово­рить, выска­зы­вать, изла­гать; спра­ши­вать, него­до­вать, ругать, бра­нить, изде­вать­ся, иро­ни­зи­ро­вать, обви­нять, кри­ти­ко­вать и т. п.); мно­гие из пере­чис­лен­ных пре­ди­ка­тов могут так­же выра­жать как мен­таль­ное состо­я­ние (эмо­ци­о­наль­ное отно­ше­ние, настрой, склон­ность), так и неко­то­рое ком­му­ни­ка­тив­ное дей­ствие, про­яв­ляя омо­ни­мию или син­кре­тизм (отли­чия в том, что омо­ни­мия кон­тек­сту­аль­но сни­ма­ет­ся, а син­кре­тизм нераз­ре­шим в принципе);

— непо­сред­ствен­ны­ми сред­ства­ми выра­же­ния моду­са могут слу­жить ком­му­ни­ка­тив­ные гла­го­лы побуж­де­ния (Ркомм.побуд): про­сить, тре­бо­вать, уго­ва­ри­вать, при­ка­зы­вать, убеж­дать, умо­лять, аги­ти­ро­вать, при­зы­вать и дру­гие, явля­ю­щи­е­ся экс­пли­цит­но поли­про­по­зи­тив­ны­ми, посколь­ку обя­за­тель­но тре­бу­ют соеди­не­ния с объ­ект­ным инфи­ни­ти­вом, номи­на­ли­за­ци­ей или изъ­яс­ни­тель­ным при­да­точ­ным (с сою­зом что­бы); в этот же класс вклю­ча­ют­ся опта­тив­ные модаль­ные пре­ди­ка­ты (кос­вен­но­го побуж­де­ния), под­чи­ня­ю­щие что­бы-при­да­точ­ные (желать, хотеть, пред­по­чи­тать и т. п.); в соеди­не­нии с субъ­ект­ным инфи­ни­ти­вом кау­за­тив­но­го гла­го­ла (попро­сить, поре­ко­мен­до­вать) опта­тив­ные гла­го­лы выра­жа­ют под­черк­ну­то веж­ли­вую фор­му побуж­де­ния (Хоте­лось бы попро­сить участ­ни­ков экс­пе­ри­мен­та…).

Нако­нец, весь­ма широ­кий и семан­ти­че­ски раз­но­род­ный (а пото­му допус­ка­ю­щий даль­ней­шее раз­би­е­ние) класс обра­зу­ют ква­ли­фи­ка­тив­ные реля­ци­он­ные пре­ди­ка­ты (харак­те­ри­зу­ю­щие пред­мет, поня­тие или явле­ние по отно­ше­нию к иным пред­ме­там или собя­ти­ям). Выде­лим пока две раз­но­вид­но­сти таких мар­ке­ров субъ­ек­тив­ной модаль­но­сти: пре­ди­ка­ты обоб­щен­но пони­ма­е­мой сопо­ста­ви­тель­ной семан­ти­ки (Рсопост), выра­жа­ю­щие отно­ше­ния тож­де­ства / подо­бия / отли­чия: тож­де­ствен, иден­ти­чен, равен, бли­зок, подо­бен, схо­ден, отли­чен; сов­па­дать, отли­чать­ся, раз­ли­чать­ся, иметь (обла­дать) + Nном (<Рсопост) [иметь сход­ство, обла­дать осо­бен­но­стью и т. п.]; в том чис­ле соб­ствен­но ком­па­ра­ти­вы Adjcomp/ Advcomp (боль­ше, мень­ше, силь­нее, выше, ниже, зна­чи­тель­ней; более менее + Adj и др.), как пра­ви­ло, со вто­рым ком­па­ра­тив­ным ком­по­нен­том (объ­ек­том срав­не­ния); харак­те­ри­зу­ю­щие пре­ди­ка­ты (Рхаракт) — «неяв­но сопо­ста­ви­тель­ные» (без экс­пли­цит­но­го объ­ек­та срав­не­ния), пре­иму­ще­ствен­но в струк­тур­ных схе­мах со связ­кой: раз­но­об­ра­зен, осо­бен, свое­об­ра­зен, спе­ци­фи­чен, дина­ми­чен, непо­дви­жен, неиз­ме­нен, посто­я­нен, велик, мал, ярок, бле­ден, мно­го­цве­тен, све­тел и т. п. Нелишне заме­тить, что чаще все­го Рхаракт в тек­сте дез­ак­ту­а­ли­зо­ва­ны, т. е. запол­ня­ют атри­бу­тив­ную пози­цию (яркий, мно­го­цвет­ный, тем­ный) в каком-либо имен­ном ком­по­нен­те акту­аль­но­го пре­ди­ка­та (где Р — пре­ди­кат­ное сло­во; Nном — номи­на­ли­за­ция Р; Adjcomp/ Advcomp — при­ла­га­тель­ные и наре­чия в сравн. степени).

Участ­ву­ю­щие в выра­же­нии модус­ных смыс­лов пре­ди­ка­ты неред­ко ока­зы­ва­ют­ся мно­го­знач­ны­ми, и их модус­ная семан­ти­ка про­яв­ля­ет­ся (выяв­ля­ет­ся адре­са­том в про­цес­се ком­му­ни­ка­ции) бла­го­да­ря спе­ци­фи­че­ско­му набо­ру син­так­сем: нали­чию лич­но­го суще­стви­тель­но­го в роли аген­са — при акци­о­наль­ном пре­ди­ка­те (Петр рас­стро­ил Ива­на) или паци­ен­са (аффек­ти­ва) — при пре­ди­ка­тах со зна­че­ни­ем физио­ло­ги­че­ско­го или мен­таль­но­го состо­я­ния (Иван кипя­тит­ся, Пет­ру фио­ле­то­во, Марии пока­за­лось, что… (ср.: На гори­зон­те пока­за­лось суд­но); Есть люди, кото­рые боят­ся пау­ков (ср.: Цемент боит­ся сыро­сти) и т. п.

Рас­смот­рим несколь­ко при­ме­ров из сочи­не­ний сту­ден­тов (мыс­ли о выбран­ной про­фес­сии, надеж­дах и пер­спек­ти­вах на выбран­ном пути). Во мно­гих слу­ча­ях субъ­ек­тив­ная модаль­ность импли­цит­на, т. е. пред­став­ле­на в нуле­вых модус­но-пер­фор­ма­тив­ных рам­ках. В зави­си­мо­сти от дик­тум­но­го содер­жа­ния нуле­вой модус име­ет зна­че­ние либо ней­траль­но­го (нека­те­го­ри­че­ско­го) утвер­жде­ния (Øф: ‘я знаю/верю и гово­рю’ — для факт­фик­си­ру­ю­щих выска­зы­ва­ний с собы­тий­ной рефе­рен­ци­ей), либо «сло­жив­ше­го­ся мне­ния», ней­траль­но­го «моду­са пола­га­ния» (Øп: ‘я счи­таю, думаю’ — для выска­зы­ва­ний с ква­ли­фи­ка­тив­ны­ми и оце­ноч­ны­ми предикатами).

К экс­пли­цит­ным линг­ви­сти­че­ским мар­ке­рам субъ­ек­тив­ной модаль­но­сти отно­сим: 1) эмо­тив­ные и модаль­но-оце­ноч­ные пре­ди­ка­ты в фор­ме 1‑го л. (в том чис­ле их номи­на­ли­за­ции в пози­ции актан­та с место­имен­ны­ми дейк­ти­ка­ми 1‑го л. или кос­вен­но-субъ­ект­ные транс­фор­ма­ции пре­ди­ка­тив­ных еди­ниц: я желаю → мое жела­ние; я пла­ни­рую → у меня в пла­нах); 2) оце­ноч­ные и харак­те­ри­зу­ю­щие пре­ди­ка­ты в дик­тум­ной части выска­зы­ва­ния, как пра­ви­ло, в атри­бу­тив­ной пози­ции при том или ином актан­те в поверх­ност­но-син­так­си­че­ской струк­ту­ре выска­зы­ва­ния. Кро­ме того, посколь­ку в зада­чи ана­ли­за­то­ра вхо­дит «диа­гно­сти­ка тональ­но­сти» не речи вооб­ще, а тек­ста, соот­не­сен­но­го с опре­де­лен­ны­ми тема­ти­че­ски­ми сфе­ра­ми (рефе­рен­та­ми), его линг­ви­сти­че­ская часть содер­жит инфор­ма­цию о «дик­тум­ных» пре­ди­ка­тах и актан­тах, вклю­ча­е­мых в ТГС тех семан­ти­че­ских полей, кото­рые зна­чи­мы под углом зре­ния реша­е­мых задач («про­фес­сия», «заня­тость», «карье­ра» и др.).

Фор­ма­ли­зо­ван­ное опи­са­ние линг­ви­сти­че­ских мар­ке­ров субъ­ек­тив­ной модаль­но­сти (т. е. то, что посту­па­ет на вход опе­ра­ци­он­но­го ком­по­нен­та моде­ли РСА) вклю­ча­ет ука­за­ние на при­над­леж­ность пре­ди­ка­та и актан­тов к опре­де­лен­ным (задан­ным в спис­ках) семан­ти­че­ским клас­сам и на семан­ти­че­ские роли непре­ди­ка­тив­ных ком­по­нен­тов пред­ло­же­ния (на отно­ше­ния меж­ду пре­ди­ка­том и актан­том). Напри­мер, в выска­зы­ва­ни­ях Я выбрал про­фес­сию эко­но­ми­ста, так как счи­таю, что это очень важ­ная про­фес­сия в наши дни. Ожи­даю, что смо­гу добить­ся успе­хов и быть полез­ным обще­ству линг­ви­стом и пси­хо­ло­гом долж­ны быть опре­де­ле­ны как отно­ся­щи­е­ся к фор­ми­ру­е­мой ТГС лек­се­мы про­фес­сия, эко­но­мист, обще­ство, кол­ло­ка­ции выбрать про­фес­сию, про­фес­сия эко­но­ми­ста, добить­ся успе­хов, быть полез­ным обще­ству, а пре­ди­ка­ты выбрать, счи­тать, очень важ­ный, смочь, полез­ный поме­ча­ют­ся как сред­ства выра­же­ния субъ­ек­тив­ной модаль­но­сти («модус-потен­ци­а­ла», по выра­же­нию Т. В. Шмелевой).

Руч­ная раз­мет­ка тек­сто­во­го мате­ри­а­ла может иметь такой вид: Øф [‘я знаю/ верю и гово­рю’] Я [Nлицо1aгн] выбрал [Pмент] про­фес­сию эко­но­ми­ста [Nпроф4], так как счи­таю [Рмдс/п], что [чтоdlb] это очень важ­ная [Рхаракт] про­фес­сия [Nпроф1сбъ] в наши дни. Ожи­даю [Рмдс+ наде­юсь = ‘думаю с надеж­дой’], что [чтоdlb] смо­гу добить­ся успе­хов [Рхаракт] и быть полез­ным [Рхаракт] обще­ству (где Øф — нуле­вая пер­фор­ма­тив­но-модус­ная рам­ка фак­то­фик­си­ру­ю­ще­го выска­зы­ва­ния, Nлицо1aгн — имя семан­ти­че­ско­го клас­са «лицо» / дейк­ти­ка 1‑го л. в им.п., в роли аген­са; Pмент — акци­о­наль­ный пре­ди­кат мен­таль­но­го пла­на; Nпроф4 — сущ. в вин. пад. из ТГС «про­фес­сия» в роли ква­зи­объ­ек­та; Рмдс/п — модус­ный пре­ди­кат («модус пола­га­ния»); Рмдс+ — модус­ный пре­ди­кат, сли­тый с поло­жи­тель­ной оцен­кой содер­жа­ния (рефе­рен­та) дик­ту­ма; чтоdlb — изъ­яс­ни­тель­ное при­да­точ­ное в роли дели­бе­ра­тив­но­го актан­та; Рхарактхарак­те­ри­зу­ю­щий (оце­ноч­ный) пре­ди­кат; Nпроф1субъ — сущ. в им. пад. из ТГС «про­фес­сия» в роли «субъекта_носителя_признака», или «объекта_характеризации»).

Пола­га­ем, что линг­ви­сти­че­ские мар­ке­ры моду­са (в нашем при­ме­ре име­ю­щем зна­че­ние ‘сдер­жан­ный опти­мизм’, ‘надеж­да на пози­тив­ный резуль­тат’) в сово­куп­но­сти с дик­тум­ны­ми зна­ка­ми с той же рефе­рен­ци­ей (тема­ти­че­ской при­уро­чен­но­стью) вполне доста­точ­ны для того, что­бы диа­гно­сти­ка тональ­но­сти тек­стов с ана­ло­гич­ным набо­ром пре­ди­ка­тов и син­так­сем при авто­ма­ти­че­ском ана­ли­зе тональ­но­сти дава­ла в боль­шин­стве слу­ча­ев объ­ек­тив­ный результат.

В при­во­ди­мых ниже при­ме­рах пре­ди­ка­ты «модус-потен­ци­а­ла» выде­ле­ны полу­жир­ным шриф­том, иные пре­ди­ка­ты и актан­ты, а так­же суще­стви­тель­ные в атри­бу­тив­ной пози­ции (несо­гла­со­ван­ные опре­де­ле­ния), кото­рые вхо­дят в ТГС семан­ти­че­ских полей, суще­ствен­ных под углом зре­ния реша­е­мых задач («про­фес­сия», «заня­тость», «карье­ра»), подчеркнуты.

Кол­ло­ка­ции с вне­кон­тек­сту­аль­ной отри­ца­тель­ной оце­ноч­но­стью зада­ют­ся спис­ком (ср.: нехват­ка ква­ли­фи­ци­ро­ван­но­го пер­со­на­ла; низ­кий ста­тус про­фес­сии, высо­кая теку­честь кад­ров, низ­ко­опла­чи­ва­е­мое заня­тие, про­бле­ма дет­ской без­над­зор­но­сти и бес­при­зор­но­сти, низ­кий поку­па­тель­ский спрос и т. п.). В слу­чае, если знак оцен­ки не заклю­чен в семан­ти­ке пре­ди­кат­но­го сло­ва (в потен­ци­аль­но энан­тио­се­мич­ных оце­ноч­ных сло­вах), общая тональ­ность (оце­ноч­ность) модус­ных выра­же­ний при машин­ном «май­нин­ге» опре­де­ля­ет­ся семан­ти­кой дик­ту­ма (объ­ек­та оцен­ки): Ожи­даю, что Петр спра­вит­ся с зада­чей (Рмдс+) / не спра­вит­ся с зада­чей (Рмдс–); Тех­ни­че­ское состо­я­ние тре­бу­ет обнов­ле­ния и модер­ни­за­ции, а затра­ты на содер­жа­ние уве­ли­чи­ва­ют­ся за счет роста тари­фов на энер­го­но­си­те­ли / за счет роста зара­бот­ной пла­ты (с точ­ки зре­ния авто­ра тек­ста, сооб­ща­ю­ще­го о необ­хо­ди­мо­сти обнов­ле­ния и модер­ни­за­ции обо­ру­до­ва­ния, т. е. выра­жа­ю­ще­го — при усло­вии искрен­но­сти — заин­те­ре­со­ван­ность в этом, оце­ноч­ное зна­че­ние дик­тум­но­го выра­же­ния за счет роста зара­бот­ной пла­ты ока­зы­ва­ет­ся со зна­ком «минус», хотя в ТГС, исполь­зу­е­мых в моде­ли РСА, сло­во­со­че­та­ния со зна­че­ни­ем ‘рост зар­пла­ты’, несо­мнен­но, долж­ны быть отне­се­ны к кол­ло­ка­ци­ям с поло­жи­тель­ным оце­ноч­ным значением).

При­ве­дем несколь­ко раз­ме­чен­ных фраг­мен­тов из наше­го мате­ри­а­ла (рече­вые мар­ке­ры семан­ти­че­ских ролей не обозначены).

Øм Мой про­фес­си­о­наль­ный путь начи­на­ет­ся в МГИМО! Øм Здесь я соби­ра­юсь прой­ти ста­жи­ров­ку в круп­ных ком­па­ни­ях в каче­стве спе­ци­а­ли­ста эко­но­ми­ста. Øм После окон­ча­ния уни­вер­си­те­та я соби­ра­юсь рабо­тать там же, где и про­хо­дил ста­жи­ров­ку. Нако­пив доста­точ­ный капи­тал, я открою свой биз­нес. В дан­ном выска­зы­ва­нии пози­тив­ная (опти­ми­сти­че­ская) тональ­ность выра­жа­ет­ся выбо­ром опта­тив­но­го пре­ди­ка­та в фор­ме 1‑го лица наст. вр. (при том что выбор фор­мы прош. вр. сви­де­тель­ство­вал бы ско­рее о пес­си­ми­сти­че­ских настро­е­ни­ях пишущего).

Øм Я вижу себя [= ‘хочу быть / рабо­тать в…’] в пред­при­ни­ма­тель­ской сфе­ре. Øм Я пол­но­стью пони­маю все труд­но­сти и слож­но­сти, с кото­ры­ми мне пред­сто­ит столк­нуть­ся. Øм Мно­гие люди дума­ют, что пред­при­ни­ма­тель­ская дея­тель­ность — это про­сто, одна­ко это не так.

С моей точ­ки зре­ния, чело­век дол­жен зани­мать­ся тем, в чем он себя видит [= ‘где хочет быть / рабо­тать’], и в той сфе­ре, в кото­рой он хорош.

Øм Я ста­ра­юсь нако­пить как мож­но боль­ше зна­ний и уме­ний. Ожи­даю, что дан­ная про­фес­сия будет непро­ста, но глав­ное чет­ко поста­вить для себя цель и идти к ней. Здесь модус пола­га­ния (ожи­даю) соеди­ня­ет­ся не с поло­жи­тель­ной оцен­кой дик­ту­ма, а с отри­ца­тель­ной (≈‘боюсь, что…’), так как дик­тум пред­став­лен нега­тив­но-оце­ноч­ным суж­де­ни­ем в изъ­яс­ни­тель­ном при­да­точ­ном (ср.: Ожи­даю, что выбран­ная про­фес­сия будет вос­тре­бо­ван­ной, зада­ча будет нетруд­ной, Иван решит эту зада­чу и т. п.).

Øм Тех­ни­че­ское состо­я­ние тре­бу­ет обнов­ле­ния и модер­ни­за­ции, а затра­ты на содер­жа­ние уве­ли­чи­ва­ют­ся за счет роста тари­фов на энер­го­но­си­те­ли. К при­ве­ден­но­му выше ком­мен­та­рию это­го фраг­мен­та доба­вим, что здесь отри­ца­тель­ная оце­ноч­ность моду­са импли­цит­на: она инду­ци­ру­ет­ся дис­кур­сив­ной пози­тив­но­стью кон­но­та­ций слов обнов­лять и модер­ни­зи­ро­вать, свя­зан­ных кау­заль­ным отно­ше­ни­ем (выра­же­но кау­заль­ным пре­ди­ка­том тре­бо­вать) с оце­ноч­но ней­траль­ным, каза­лось бы, соче­та­ни­ем тех­ни­че­ское состо­я­ние (в тако­го рода поли­про­по­зи­тив­ных семан­ти­че­ских струк­ту­рах обо­зна­че­ние кау­зи­ру­ю­щей ситу­а­ции импли­ци­ру­ет в модус­но-пер­фор­ма­тив­ной рам­ке отри­ца­тель­ную оце­ноч­ность: ‘неудо­вле­тво­ри­тель­ное тех­ни­че­ское состояние’).

Øм В усло­ви­ях рыноч­ных отно­ше­ний и кон­ку­рент­ной борь­бы потре­би­тель­ская коопе­ра­ция не может успеш­но раз­ви­вать­ся, исполь­зуя ста­рые мето­ды рабо­ты. Опре­де­ле­ние ста­рые име­ет отри­ца­тель­ную оце­ноч­ную кон­но­та­цию в узу­се, а не толь­ко в кон­тек­сте дан­но­го выска­зы­ва­ния, ней­траль­ную или поло­жи­тель­ную оце­ноч­ность в соче­та­нии с кол­ло­ка­ци­ей мето­ды рабо­ты име­ло бы опре­де­ле­ние тра­ди­ци­он­ный или клас­си­че­ский (как в ста­рой рекла­ме ижев­ско­го лег­ко­во­го авто­мо­би­ля: при­вод клас­си­че­ский).

Выводы

В любом выска­зы­ва­нии как ком­му­ни­ка­тив­но осмыс­лен­ной еди­ни­це связ­но­го тек­ста, вклю­чен­ной по зако­нам рече­вой систем­но­сти и в соот­вет­ствии с дис­кур­сив­ны­ми пра­ви­ла­ми в кон­текст и кон­си­ту­а­цию, име­ют­ся фор­маль­ные рече­вые мар­ке­ры не толь­ко дик­тум­ных, но и модус­ных смыс­лов, опи­ра­ясь на кото­рые адре­сат ком­му­ни­ка­тив­но­го акта (вос­при­ни­ма­ю­щий текст чело­век или его кибер­не­ти­че­ский ана­лог) спо­со­бен адек­ват­но иден­ти­фи­ци­ро­вать неко­то­рое мно­же­ство мен­таль­ных состо­я­ний адре­сан­та. Вос­при­я­тие модус­ной инфор­ма­ции, заклю­чен­ной в тек­сте, по самой при­ро­де язы­ка и рече­вой ком­му­ни­ка­ции, не может быть отде­ле­но от вос­при­я­тия дик­тум­но­го содер­жа­ния, поэто­му в чис­ло линг­ви­сти­че­ских мар­ке­ров эмо­ци­о­наль­но­го состо­я­ния вклю­ча­ют­ся не толь­ко эмо­тив­ные и оце­ноч­ные пре­ди­ка­ты с узу­аль­ной семан­ти­кой, но и такие лек­се­мы, оце­ноч­ное содер­жа­ние кото­рых опре­де­ля­ет­ся «дик­тум­ным контекстом».

Ана­лиз мате­ри­а­ла пока­зы­ва­ет, что в каж­дом из тема­ти­че­ски опре­де­лен­ных тек­стов (содер­жа­щих мно­же­ство лек­сем, мар­ки­ру­ю­щих при­над­леж­ность тек­ста к дан­ной теме) име­ет­ся неко­то­рое мно­же­ство вер­баль­ных пока­за­те­лей моду­са, т. е. акту­аль­но­го в момент речи отно­ше­ния авто­ра тек­ста к опи­сы­ва­е­мой ситу­а­ции или к участ­ни­кам рече­во­го акта. Бла­го­да­ря этим пока­за­те­лям адре­сат речи полу­ча­ет воз­мож­ность вос­при­нять (рекон­стру­и­ро­вать) и импли­цит­ную инфор­ма­цию об эмо­ци­о­наль­ном состо­я­нии субъ­ек­та речи.

Авто­ры счи­та­ют, что выяв­лен­ные в ходе руч­ной раз­мет­ки вер­баль­ные мар­ке­ры субъ­ек­тив­ной модаль­но­сти тек­стов во вза­и­мо­дей­ствии с линг­ви­сти­че­ски­ми мар­ке­ра­ми их тема­ти­че­ской при­уро­чен­но­сти могут быть исполь­зо­ва­ны при раз­ра­бот­ке мето­да­ми искус­ствен­но­го интел­лек­та алго­рит­мов авто­ма­ти­че­ско­го ана­ли­за модаль­но­сти (машин­но­го «май­нин­га»). Про­грамм­ная реа­ли­за­ция пред­ла­га­е­мо­го под­хо­да поз­во­лит осу­ществ­лять мони­то­рин­го­вые и диа­гно­сти­че­ские меро­при­я­тия, направ­лен­ные на выяв­ле­ние при­зна­ков про­фес­си­о­наль­но­го кри­зи­са по тек­стам сете­вой коммуникации.

1 Мате­ри­а­лом послу­жи­ли сочи­не­ния на тему «Мое про­фес­си­о­наль­ное раз­ви­тие», напи­сан­ные сту­ден­та­ми эко­но­ми­че­ских спе­ци­аль­но­стей (ана­лиз см. в: [Махму­то­ва, Кузь­ми­на 2019]), а так­же эссе жен­щин-пред­при­ни­ма­те­лей, опуб­ли­ко­ван­ные в сбор­ни­ках: [Эссе по акту­аль­ным про­бле­мам 2006; Кон­курс­ные рабо­ты 2010].

Ста­тья посту­пи­ла в редак­цию 11 мая 2020 г.;
реко­мен­до­ва­на в печать 28 июля 2020 г.

© Санкт-Петер­бург­ский госу­дар­ствен­ный уни­вер­си­тет, 2020

Received: May 11, 2020
Accepted: July 28, 2020