Вторник, 17 сентябряИнститут «Высшая школа журналистики и массовых коммуникаций» СПбГУ
Shadow

Статистика моделей предложения как средство корпусных исследований аттитюдов (на материале сетевых дискуссий)

Иссле­до­ва­ние выпол­не­но в рам­ках науч­ной про­грам­мы Наци­о­наль­но­го цен­тра физи­ки и мате­ма­ти­ки, направ­ле­ние № 9 «Искус­ствен­ный интел­лект и боль­шие дан­ные в тех­ни­че­ских, про­мыш­лен­ных, при­род­ных и соци­аль­ных системах».

This study was conducted within the framework of the scientific program of the National Center for Physics and Mathematics, section no. 9 “Artificial intelligence and big data in technical, industrial, natural and social systems”.

Постановка проблемы

Про­бле­ма­ти­ка сете­вой пси­хо­ди­а­гно­сти­ки актив­но пред­став­ле­на в послед­ние годы в линг­ви­сти­че­ских и пси­хо­ло­ги­че­ских иссле­до­ва­ни­ях, в рабо­тах по авто­ма­ти­че­ско­му ана­ли­зу тек­ста. Пер­во­на­чаль­ный пери­од «побед­ных реля­ций» сме­нил­ся трез­вым пони­ма­ни­ем того, что тре­бу­ют­ся тон­ко орга­ни­зо­ван­ные иссле­до­ва­ния, в кото­рых учи­ты­ва­лась бы спе­ци­фи­ка как опре­де­ля­е­мых по тек­сту пси­хо­ло­ги­че­ских сущ­но­стей, так и пара­мет­ров тек­стов, выби­ра­е­мых в каче­стве так назы­ва­е­мых мар­ке­ров. Если гово­рить о пер­вых, то необ­хо­ди­мо пом­нить о том, что пред­ме­том диа­гно­сти­ки, осно­ван­ной на ана­ли­зе тек­стов, могут быть не толь­ко лич­ност­ные осо­бен­но­сти, эмо­ци­о­наль­ные реак­ции и пси­хи­че­ские состо­я­ния, но и раз­лич­ные ком­по­нен­ты позна­ва­тель­ной сфе­ры, в том чис­ле свя­зан­ные с самой орга­ни­за­ци­ей этой сфе­ры, т. е. такие струк­ту­ры, как образ мира и кар­ти­на мира. Каж­дая струк­ту­ра пси­хи­ки порож­да­ет­ся набо­ром сво­их пси­хо­ло­ги­че­ских меха­низ­мов и име­ет свое­об­раз­ные отно­ше­ния с речью, так что и для диа­гно­сти­ки осо­бен­но­стей этой струк­ту­ры по тек­сту тре­бу­ют­ся свои тек­сто­вые пока­за­те­ли. В каче­стве тако­вых могут высту­пать весь­ма раз­лич­ные эле­мен­ты язы­ка и речи — от кон­крет­ных лек­сем, лег­ко выде­ля­е­мых совре­мен­ны­ми линг­ви­сти­че­ски­ми ана­ли­за­то­ра­ми, до таких слож­но­ор­га­ни­зо­ван­ных и пока не став­ших пред­ме­том моде­ли­ро­ва­ния в систе­мах искус­ствен­но­го интел­лек­та сущ­но­стей, как модель пред­ло­же­ния или ком­му­ни­ка­тив­ный регистр. Насто­я­щая рабо­та посвя­ще­на иссле­до­ва­нию воз­мож­но­сти выяв­ле­ния в сете­вых обсуж­де­ни­ях ком­по­нен­тов атти­тю­да (или типов кар­ти­ны мира) по харак­те­ру исполь­зу­е­мых моде­лей предложения.

Отно­ше­ния ска­зу­е­мо­го с под­ле­жа­щим, состав­ля­ю­щие струк­ту­ру дву­со­став­но­го пред­ло­же­ния, пред­став­ля­ют субъ­ек­ту говорения/слушания отно­ше­ние дей­ствия акто­ра и объ­ек­та это­го дей­ствия. Имен­но эти отно­ше­ния обра­зу­ют осно­ву созна­ния, кото­рое зарож­да­ет­ся в антро­по­ге­не­зе и фор­ми­ру­ет­ся в онто­ге­не­зе как раз для того, что­бы пре­зен­ти­ро­вать само­му субъ­ек­ту систе­му его дей­ствия с объ­ек­та­ми. Как было пока­за­но в рабо­тах Л. С. Выгот­ско­го и его шко­лы, любой пси­хи­че­ский про­цесс воз­ни­ка­ет вна­ча­ле в поле интер­пси­хи­че­ско­го, в обще­нии и вза­и­мо­дей­ствии и лишь затем ста­но­вит­ся интра­пси­хи­че­ским обра­зо­ва­ни­ем, инте­ри­о­ри­зу­ет­ся. Таким обра­зом, пред­став­ле­ние (точ­нее было бы исполь­зо­вать нео­ло­гизм «пред­став­ли­ва­ние») дей­ствия и его объ­ек­та зарож­да­ет­ся в антро­по­ге­не­зе в ком­му­ни­ка­ции и фор­ми­ру­ет грам­ма­ти­ку язы­ка, а в онто­ге­не­зе, при овла­де­нии язы­ком, отно­ше­ние ска­зу­е­мо­го и под­ле­жа­ще­го воз­ни­ка­ет как сред­ство струк­ту­ри­ро­ва­ния реаль­но­сти и опре­де­ля­ет стро­е­ние инди­ви­ду­аль­но­го созна­ния. В пред­ло­жен­ной А. Н. Леон­тье­вым схе­ме стро­е­ния эле­мен­та созна­ния зна­че­ние пред­ме­та рас­смат­ри­ва­ет­ся как инстру­мент куль­ту­ры, ответ­ствен­ный за акку­му­ля­цию обще­ствен­но-исто­ри­че­ско­го опы­та дей­ство­ва­ния с пред­ме­том, его смысл — как инстру­мент накоп­ле­ния лич­но­го опы­та вза­и­мо­дей­ствия с пред­ме­том, чув­ствен­ная ткань созна­ния. Ина­че гово­ря, сам образ пред­ме­та, отра­жа­ю­щий его свой­ства, рабо­та­ет как инстру­мент обоб­ще­ния зна­ний о мно­же­стве кон­крет­ных объ­ек­тов, с кото­ры­ми чело­век дей­ство­вал как с пред­ме­том — носи­те­лем име­ни [Леон­тьев 2004].

В общей пси­хо­ло­гии эти осно­ва­ния созна­ния рас­смат­ри­ва­ют­ся в рам­ках про­бле­ма­ти­ки кар­ти­ны мира, в соци­аль­ной пси­хо­ло­гии — в рам­ках изу­че­ния так назы­ва­е­мых соци­аль­ных уста­но­вок, атти­тю­дов. В соци­аль­ной пси­хо­ло­гии атти­тюд пони­ма­ет­ся как «опре­де­лен­ное состо­я­ние созна­ния и нерв­ной систе­мы, выра­жа­ю­щее готов­ность к реак­ции, орга­ни­зо­ван­ное на осно­ве пред­ше­ству­ю­ще­го опы­та, ока­зы­ва­ю­щее направ­ля­ю­щее и дина­ми­че­ское вли­я­ние на пове­де­ние» [Андре­ева 2018: 289]. Атти­тюд обла­да­ет трех­ком­по­нент­ной струк­ту­рой, «в кото­рой выде­ля­ют­ся: а) когни­тив­ный ком­по­нент (осо­зна­ние объ­ек­та соци­аль­ной уста­нов­ки); б) аффек­тив­ный ком­по­нент (эмо­ци­о­наль­ная оцен­ка объ­ек­та, выяв­ле­ние чув­ства сим­па­тии или анти­па­тии к нему); в) пове­ден­че­ский (кона­тив­ный) ком­по­нент (после­до­ва­тель­ное пове­де­ние по отно­ше­нию к объ­ек­ту)» [Андре­ева 2018: 290]. Дру­ги­ми сло­ва­ми, если рас­смат­ри­вать выска­зы­ва­ние чело­ве­ка об объ­ек­те в соци­аль­но-пси­хо­ло­ги­че­ском клю­че, то мы обна­ру­жим, что чело­век опи­сы­ва­ет свое эмо­ци­о­наль­ное, позна­ва­тель­ное или пове­ден­че­ское отно­ше­ние к нему. В искус­ствен­ном интел­лек­те пред­став­ле­ние о стро­е­нии созна­ния, пред­ло­жен­ное А. Н. Леон­тье­вым, полу­чи­ло раз­ви­тие, суще­ствен­ное для моде­ли­ро­ва­ния целе­по­ла­га­ния интел­лек­ту­аль­но­го аген­та [Оси­пов и др. 2018]. В обла­сти линг­ви­сти­ки эти сов­мест­ные с мате­ма­ти­ка­ми и пси­хо­ло­га­ми рабо­ты [Сали­мов­ский и др. 2019] направ­ле­ны на выяв­ле­ние рече­вой орга­ни­за­ции таких аспек­тов систе­мы выска­зы­ва­ний, как пред­став­лен­ный в ней сце­на­рий пове­де­ния (пре­зен­та­ция созна­нию зна­че­ния пред­ме­та), лич­ная исто­рия (нар­ра­тив, экс­пли­ци­ру­ю­щий смысл пред­ме­та для субъ­ек­та выска­зы­ва­ния), образ пред­ме­та (опи­са­ние свойств и свя­зей предмета).

В насто­я­щей ста­тье мы хоте­ли бы пред­ло­жить сред­ство ана­ли­за тек­ста как систе­мы выска­зы­ва­ний, содер­жа­щей эти типы в раз­ных про­пор­ци­ях. Такая линг­во­ста­ти­сти­че­ская типо­ло­ги­за­ция кор­пу­сов тек­стов, собран­ных в сете­вых дис­кус­си­ях, поз­во­ли­ла бы при даль­ней­шей авто­ма­ти­за­ции ана­ли­за речи про­во­дить мони­то­ринг соци­аль­ных сетей на пред­мет выяв­ле­ния пове­ден­че­ско­го, эмо­ци­о­наль­но­го и когни­тив­но­го аспек­тов аттитюда.

На сле­ду­ю­щем эта­пе рабо­ты пла­ни­ру­ет­ся обра­ще­ние так­же к кор­пу­су выска­зы­ва­ний, в кото­рых в каче­стве доми­ни­ру­ю­щей реа­ли­зу­ет­ся соб­ствен­но ком­му­ни­ка­тив­ная интен­ция. Тем самым субъ­ект­но-объ­ект­ное отно­ше­ние будет допол­не­но субъ­ект­но-субъ­ект­ным, диа­ло­ги­че­ским [Дус­ка­е­ва и др. 2019].

Итак, на наш взгляд, модель пред­ло­же­ния может рас­смат­ри­вать­ся как еди­ни­ца ана­ли­за дей­ствия, пре­зен­ти­ро­ван­но­го созна­нию субъ­ек­та. Гово­ря о еди­ни­це ана­ли­за, мы опи­ра­ем­ся на пред­став­ле­ние Л. С. Выгот­ско­го: «Под еди­ни­цей мы под­ра­зу­ме­ва­ем такой про­дукт ана­ли­за, кото­рый, в отли­чие от эле­мен­тов, обла­да­ет все­ми основ­ны­ми свой­ства­ми, при­су­щи­ми цело­му, и кото­рые явля­ют­ся далее нераз­ло­жи­мы­ми живы­ми частя­ми это­го един­ства» [Выгот­ский 2021: 14]. В насто­я­щий момент для задач авто­ма­ти­че­ско­го ана­ли­за тек­стов сете­во­го кон­тен­та доста­точ­но ост­ро сто­ит вопрос о том, про­дол­жать ли про­во­дить поэле­мент­ный ана­лиз, выде­ля­ю­щий в тек­сте отдель­ные лек­се­мы, части речи, пунк­ту­а­ци­он­ные зна­ки и т. п., или же необ­хо­ди­мо пере­хо­дить к ана­ли­зу линг­ви­сти­че­ских еди­ниц, харак­те­ри­зу­ю­щих пси­хо­ло­ги­че­скую реаль­ность, сто­я­щую за выска­зы­ва­ни­ем авто­ра. В про­ве­ден­ном в 2021 г. [Moreno et al. 2021] обзор­но-ана­ли­ти­че­ском иссле­до­ва­нии мето­дов авто­ма­ти­че­ско­го ана­ли­за выска­зы­ва­ний и их кор­ре­ля­ции с лич­ност­ным опрос­ни­ком «Боль­шой пятер­ки» (на осно­ве дан­ных, пред­став­лен­ных в 84 пуб­ли­ка­ци­ях о свя­зи тек­сто­вых пара­мет­ров с дан­ны­ми пси­хо­ди­а­гно­сти­ки) эта про­бле­ма пред­став­ле­на так: «В лите­ра­ту­ре мож­но най­ти два основ­ных мето­да ана­ли­за язы­ка для изу­че­ния лич­но­сти — мето­ды, осно­ван­ные на кри­те­ри­ях экс­пер­тов… и мето­ды, осно­ван­ные на вычис­ли­тель­ных моде­лях язы­ка (речь идет о совре­мен­ных мето­дах машин­но­го обу­че­ния. — Авт.). Основ­ное раз­ли­чие меж­ду ними заклю­ча­ет­ся в том, что послед­ние моде­ли фоку­си­ру­ют­ся на семан­ти­че­ских отно­ше­ни­ях меж­ду сло­ва­ми, фра­за­ми, абза­ца­ми и т. д., в то вре­мя как пер­вые моде­ли пред­по­ла­га­ют ана­лиз, кото­рый направ­лен на обна­ру­же­ние шаб­ло­нов (обыч­но опре­де­ля­е­мых как пра­ви­ла в регу­ляр­ных выра­же­ни­ях или грам­ма­ти­ке и даже под­дер­жи­ва­е­мых син­так­си­че­ски­ми ана­ли­за­то­ра­ми)» [Moreno et al. 2021: 2]. На осно­ве про­ве­ден­но­го ста­ти­сти­че­ски­ми сред­ства­ми мета­а­на­ли­за дела­ет­ся вывод о том, что «ком­би­на­ция син­так­си­че­ской и семан­ти­че­ской инфор­ма­ции по срав­не­нию с исполь­зо­ва­ни­ем толь­ко одно­го типа инфор­ма­ции» обла­да­ет боль­шей эффек­тив­но­стью [Moreno et al. 2021: 5]. К тако­му же выво­ду при­хо­дит и оте­че­ствен­ный иссле­до­ва­тель [Devyatkin 2019].

В насто­я­щей рабо­те, учи­ты­вая вклю­чен­ность меха­низ­мов син­так­си­са в рече­вое мыш­ле­ние [Аху­ти­на 2022] и важ­ную роль моде­лей пред­ло­же­ния в пере­хо­де от струк­тур пси­хи­ки к внеш­ней речи [Нор­ман 2011], мы про­ве­дем ста­ти­сти­че­ский ана­лиз реа­ли­за­ции моде­лей пред­ло­же­ния в текстах сете­вых дис­кус­сий с целью раз­ли­че­ния ком­по­нен­тов атти­тю­да — аффек­тив­но­го, когни­тив­но­го и поведенческого.

История вопроса

В коли­че­ствен­ном ана­ли­зе тек­ста по его язы­ко­вым пара­мет­рам, как нам пред­став­ля­ет­ся, мож­но раз­ли­чать два основ­ных под­хо­да. Пер­вый, пре­об­ла­да­ю­щий, состо­ит в выбо­ре в каче­стве пара­мет­ров ста­ти­сти­че­ско­го иссле­до­ва­ния тех грам­ма­ти­че­ских и лек­си­ко-семан­ти­че­ских кате­го­рий, кото­рые во флек­тив­ных язы­ках обра­зу­ют осно­ву язы­ко­вой систе­мы — частей речи, их мор­фо­ло­ги­че­ских кате­го­рий, а так­же типов сло­во­со­че­та­ния, видов про­сто­го пред­ло­же­ния (преж­де все­го по цели выска­зы­ва­ния, соста­ву глав­ных чле­нов), видов слож­но­го пред­ло­же­ния с их даль­ней­шей типо­ло­ги­за­ци­ей, семан­ти­че­ских клас­сов слов и др. Назна­че­ние работ это­го направ­ле­ния — пред­ста­вить по воз­мож­но­сти пол­ную кар­ти­ну коли­че­ствен­ных зако­но­мер­но­стей функ­ци­о­ни­ро­ва­ния язы­ка в рече­вых разновидностях.

Вто­рой под­ход состо­ит во вклю­че­нии в состав пара­мет­ров коли­че­ствен­но­го ана­ли­за пер­во­на­чаль­но толь­ко тех язы­ко­вых средств, функ­ци­о­ни­ро­ва­ние кото­рых может под­твер­дить (или опро­верг­нуть) гипо­те­зу иссле­до­ва­те­ля о при­чин­ной зави­си­мо­сти их регу­ляр­но­го упо­треб­ле­ния в том или ином типе тек­стов от его содер­жа­тель­ных харак­те­ри­стик или вли­я­ния опре­де­лен­ных пси­хо­ло­ги­че­ских либо соци­аль­ных фак­то­ров. Этот под­ход важен как для изу­че­ния спе­ци­фи­ки раз­но­вид­но­стей речи [Кожи­на 2020], так и для реше­ния погра­нич­ных линг­во­со­ци­о­пси­хо­ло­ги­че­ских задач.

Часто иссле­до­ва­те­ли стре­мят­ся сов­ме­стить эти под­хо­ды: рас­ши­ря­ют, насколь­ко это воз­мож­но, состав пара­мет­ров коли­че­ствен­но­го ана­ли­за тек­стов и в той мере, в какой это уда­ет­ся, объ­яс­ня­ют полу­чен­ные коли­че­ствен­ные данные.

Широ­кое исполь­зо­ва­ние ста­ти­сти­че­ских мето­дов в ана­ли­зе тек­стов начи­на­ет­ся в 1960–1970‑е годы (см., напри­мер: [Андре­ев 1967; Адмо­ни 1963; Голо­вин 1971; Кожи­на 1972; Лес­скисс 1962; Шай­ке­вич 1968; Пио­тров­ский 1968]).

Нуж­но отме­тить, что уста­нов­ка линг­ви­стов на широ­кий охват в ста­ти­сти­че­ском ана­ли­зе речи грам­ма­ти­че­ских и лек­си­ко-семан­ти­че­ских явле­ний объ­яс­ня­ет­ся логи­кой раз­ви­тия язы­ко­зна­ния: после того как ста­ла оче­вид­ной непол­но­та зна­ний о язы­ке, полу­ча­е­мых толь­ко каче­ствен­ны­ми мето­да­ми, нача­ла раз­ви­вать­ся коли­че­ствен­ная линг­ви­сти­ка, назна­че­ние кото­рой мно­гие иссле­до­ва­те­ли виде­ли глав­ным обра­зом в допол­не­нии зна­ний о грам­ма­ти­че­ском и лек­си­че­ском строе язы­ка. Вме­сте с тем в рас­смат­ри­ва­е­мый пери­од скла­ды­ва­ют­ся пер­вые соб­ствен­но рече­вед­че­ские кон­цеп­ции, в кото­рых линг­во­ста­ти­сти­ка исполь­зу­ет­ся для изу­че­ния орга­ни­за­ции речи, зако­но­мер­но­стей рече­вой деятельности.

Имен­но в рече­ве­де­нии наи­бо­лее после­до­ва­тель­но стал реа­ли­зо­вать­ся вто­рой из ука­зан­ных под­хо­дов. По отно­ше­нию к функ­ци­о­наль­ной сти­ли­сти­ке его содер­жа­ние емко оха­рак­те­ри­зо­ва­ла М. Н. Кожи­на: «Мож­но идти эмпи­ри­че­ским путем и под­вер­гать ста­ти­сти­че­ско­му обсле­до­ва­нию одну за дру­гой еди­ни­цы язы­ко­вой систе­мы, функ­ци­о­ни­ру­ю­щие в речи… Этот путь в кон­це кон­цов при­ве­дет к реше­нию постав­лен­ных задач, осо­бен­но — к пол­но­му опи­са­нию ста­ти­сти­че­ской струк­ту­ры сти­лей. Одна­ко этот путь не эко­но­мен… Часто­та упо­треб­ле­ния не всех и не каж­до­го из язы­ко­вых средств дает более или менее чет­кие гра­ни­цы по сти­лям. Более эффек­тив­ным пред­став­ля­ет­ся дру­гой воз­мож­ный путь. Исхо­дя из тео­ре­ти­че­ских посы­лок… целе­со­об­раз­но ста­ти­сти­че­ское обсле­до­ва­ние сти­лей речи начи­нать пре­иму­ще­ствен­но с тех язы­ко­вых еди­ниц… кото­рые бла­го­да­ря сво­ей семан­ти­ко-грам­ма­ти­че­ской при­ро­де более “соот­вет­ству­ют” зада­чам обще­ния в иссле­ду­е­мом сти­ле. Сте­пень упо­тре­би­тель­но­сти этих еди­ниц (часто­та) нахо­дит­ся в при­чин­ной зави­си­мо­сти от назна­че­ния соот­вет­ству­ю­щей фор­мы обще­ствен­но­го созна­ния, вида дея­тель­но­сти и т. д.» [Кожи­на 2020: 180–181].

Дума­ет­ся, что этот спо­соб коли­че­ствен­но­го ана­ли­за речи при­ме­ним не толь­ко к функ­ци­о­наль­ным сти­лям, но к любым мно­же­ствам тек­стов, орга­ни­за­ция кото­рых под­чи­не­на обще­му прин­ци­пу и кон­кре­ти­зи­ру­ю­щим его закономерностям.

В 1980–1990‑е годы инте­рес к вопро­сам линг­во­ста­ти­сти­ки осла­бе­ва­ет. Но через непро­дол­жи­тель­ное вре­мя он воз­рож­да­ет­ся в свя­зи с бур­ным раз­ви­ти­ем вычис­ли­тель­ной тех­ни­ки и успе­ха­ми искус­ствен­но­го интел­лек­та1.

Сего­дня вни­ма­ние иссле­до­ва­те­лей сосре­до­то­че­но преж­де все­го на про­грамм­ных аспек­тах реше­ния широ­ко­го кру­га задач ана­ли­за тек­ста, воз­мож­но­стях раз­лич­ных алго­рит­мов машин­но­го обу­че­ния и архи­тек­тур ней­рон­ных сетей [Golbeck 2016; Hawkins et al. 2017; Qiu et al. 2017; Moreno et al. 2021]. При этом линг­ви­сти­че­ская про­бле­ма­ти­ка изу­че­ния рече­вой систем­но­сти, созда­ва­е­мой выбо­ром и исполь­зо­ва­ни­ем раз­но­уров­не­вых язы­ко­вых еди­ниц и детер­ми­ни­ру­е­мая «внеш­ни­ми» — пси­хо­ло­ги­че­ски­ми и соци­аль­ны­ми — фак­то­ра­ми, в ста­ти­сти­че­ском ана­ли­зе тек­ста ста­ла отхо­дить на вто­рой план. Объ­яс­ня­ет­ся это, по-види­мо­му, как слож­но­стью меж­дис­ци­пли­нар­но­го вза­и­мо­дей­ствия спе­ци­а­ли­стов при раз­ра­бот­ке мето­дов про­грамм­но­го иссле­до­ва­ния, так и раз­де­ля­е­мым мно­ги­ми авто­ра­ми мне­ни­ем о том, что усто­яв­ши­е­ся пред­став­ле­ния о соста­ве пара­мет­ров ста­ти­сти­че­ско­го изу­че­ния речи доста­точ­ны для поис­ка новых реше­ний клас­си­фи­ка­ци­он­ной зада­чи в интел­лек­ту­аль­ном ана­ли­зе тек­ста. Состав таких пара­мет­ров, как и в преж­ние годы, охва­ты­ва­ет основ­ные грам­ма­ти­че­ские кате­го­рии язы­ка и его сло­варь, при этом боль­ше все­го вни­ма­ния уде­ля­ет­ся часто­те упо­треб­ле­ния слов, их рас­пре­де­ле­нию по частям речи, длине пред­ло­же­ния, а так­же биграм­мам и три­грам­мам сим­во­лов и слов, пунк­ту­а­ци­он­ным зна­кам [Кур­ту­ко­ва и др. 2022]).

В то же вре­мя аль­тер­на­тив­ным стал под­ход, заклю­ча­ю­щий­ся в раз­ра­бот­ке средств искус­ствен­но­го интел­лек­та на базе не толь­ко мате­ма­ти­че­ской, но и линг­ви­сти­че­ской тео­рии. В каче­стве при­ло­же­ния мето­да реля­ци­он­но-ситу­а­ци­он­но­го ана­ли­за тек­ста [Оси­пов 2011] этот под­ход реа­ли­зо­ван в инстру­мен­те TITANIS [Smirnov et al. 2021]. Здесь состав пара­мет­ров ста­ти­сти­че­ско­го иссле­до­ва­ния тек­ста задан кон­цеп­ци­ей функ­ци­о­наль­но­го син­так­си­са рус­ско­го язы­ка. Важ­ное досто­ин­ство ука­зан­но­го мето­да заклю­ча­ет­ся в том, что его объ­ек­том ста­ла струк­ту­ра пред­ло­же­ния, созда­ва­е­мая соче­та­ни­ем вза­и­мо­обу­слов­лен­ных син­так­сем. Вве­де­ние в ана­лиз как фор­мы, так и семан­ти­ки пред­ло­же­ния может послу­жить пред­по­сыл­кой ком­пью­тер­но­го моде­ли­ро­ва­ния вопло­ще­ния в речи (т. е. в после­до­ва­тель­но­сти пред­ло­же­ний-выска­зы­ва­ний) внут­рен­них — мыс­ли­тель­ных и аффек­тив­ных — про­цес­сов. Поэто­му акту­аль­ной пред­став­ля­ет­ся зада­ча про­грам­ми­ро­ва­ния и вклю­че­ния в инстру­мен­ты ана­ли­за тек­ста не толь­ко кон­сти­ту­ен­тов моде­лей пред­ло­же­ния, но и самих моде­лей, явля­ю­щих­ся отвле­чен­ны­ми образ­ца­ми созда­ния предложений.

Для реа­ли­за­ции это­го замыс­ла пред­став­ля­ют­ся цен­ны­ми суж­де­ния В. А. Бело­шап­ко­вой о соот­но­ше­нии двух основ­ных трак­то­вок моде­ли (или струк­тур­ной схе­мы) пред­ло­же­ния — как его пре­ди­ка­тив­но­го или же номи­на­тив­но­го мини­му­ма. По мне­нию ука­зан­но­го авто­ра, эти трак­тов­ки, при всем раз­ли­чии меж­ду ними, «допол­ня­ют друг дру­га, пред­став­ляя собой раз­ные уров­ни абстрак­ции: бóль­шую при ори­ен­та­ции на пре­ди­ка­тив­ный мини­мум и мень­шую при ори­ен­та­ции на номи­на­тив­ный мини­мум. Это поз­во­ля­ет гово­рить о двух типах струк­тур­ных схем пред­ло­же­ний — мини­маль­ных и рас­ши­рен­ных. Рас­ши­рен­ные схе­мы пред­став­ля­ют собой мини­маль­ные схе­мы + не вхо­дя­щие в них кон­сти­ту­тив­ные, т. е. суще­ствен­ные для семан­ти­че­ской струк­ту­ры пред­ло­же­ния, ком­по­нен­ты. Таким обра­зом, меж­ду мини­маль­ны­ми и рас­ши­рен­ны­ми схе­ма­ми пред­ло­же­ний суще­ству­ют отно­ше­ния вклю­че­ния» [Бело­шап­ко­ва 1989: 636].

Грам­ма­ти­ка совре­мен­но­го рус­ско­го язы­ка рас­по­ла­га­ет пол­ным систе­ма­ти­зи­ро­ван­ным опи­са­ни­ем мини­маль­ных струк­тур­ных схем пред­ло­же­ния, пред­став­лен­ных его пре­ди­ка­тив­ной осно­вой [Шве­до­ва 1980]. Меж­ду тем в иссле­до­ва­ни­ях, посвя­щен­ных рас­ши­рен­ным схе­мам, пока лишь рас­смат­ри­ва­ют­ся и иллю­стри­ру­ют­ся прин­ци­пы их выде­ле­ния. Пол­но­го закры­то­го спис­ка рас­ши­рен­ных струк­тур­ных схем эти рабо­ты не содер­жат. Поэто­му в насто­я­щее вре­мя зада­ча про­грам­ми­ро­ва­ния моде­лей пред­ло­же­ния может ста­вить­ся толь­ко по отно­ше­нию к мини­маль­ным схе­мам и их регу­ляр­ным реа­ли­за­ци­ям. При этом в нуж­ных слу­ча­ях объ­ек­том про­грам­ми­ро­ва­ния могут быть и рас­ши­рен­ные моде­ли, а так­же рас­про­стра­ня­ю­щие их фор­мы слов [Куз­не­цо­ва и др. 2022].

Ниже мы рас­смот­рим резуль­та­ты исполь­зо­ва­ния в пилот­ном иссле­до­ва­нии про­грамм­но­го сред­ства, содер­жа­ще­го ряд моде­лей пред­ло­же­ния, кото­рые, пред­по­ло­жи­тель­но, поз­во­ля­ют диф­фе­рен­ци­ро­вать кол­лек­ции выска­зы­ва­ний, состав­лен­ные на пси­хо­ло­ги­че­ском основании.

Описание методики исследования

Пси­хо­ло­ги­че­ский аспект мето­ди­ки иссле­до­ва­ния сво­дил­ся к сбо­ру раз­ме­чен­ных кор­пу­сов тек­стов сете­вых дис­кус­сий. Раз­мет­ка осу­ществ­ля­лась тре­мя пси­хо­ло­га­ми мето­дом сплош­ной выбор­ки: каж­дое выска­зы­ва­ние в дис­кус­сии каж­дым экс­пер­том отме­ча­лось как отно­ся­ще­е­ся к одно­му из трех аспек­тов атти­тю­да (аффек­тив­но­му, когни­тив­но­му или пове­ден­че­ско­му) или оце­ни­ва­лось как соб­ствен­но ком­му­ни­ка­тив­ное дей­ствие, т. е. выска­зы­ва­ние, не свя­зан­ное с пред­ме­том раз­го­во­ра и не экс­пли­ци­ру­ю­щее отно­ше­ние авто­ра к это­му пред­ме­ту. К пер­во­му типу выска­зы­ва­ний в соот­вет­ствии с типо­ло­ги­ей эмо­ци­о­наль­ных явле­ний С. Л. Рубин­штей­на отно­си­лись выска­зы­ва­ния, содер­жа­щие как соб­ствен­но эмо­ции авто­ра, так и опи­са­ние им сво­их чувств и сво­е­го отно­ше­ния к пред­ме­ту обсуж­де­ния. К когни­тив­ным выска­зы­ва­ни­ям отно­си­лись те, в кото­рых дава­лось опи­са­ние свойств кон­крет­но­го пред­ме­та, и те, в кото­рых автор обсуж­дал меж­пред­мет­ные свя­зи, свой­ства клас­са пред­ме­тов, осно­ва­ния клас­си­фи­ка­ции, давал опре­де­ле­ние. Содер­жа­щи­ми пове­ден­че­ский ком­по­нент счи­та­лись выска­зы­ва­ния, в кото­рых автор опи­сы­вал кон­крет­ные собы­тия, про­изо­шед­шие с ними или кем-либо дру­гим, или пред­став­лял сце­на­рий пове­де­ния, реко­мен­ду­е­мую или вызы­ва­ю­щую опа­се­ния схе­му действия.

Мы раз­ме­ти­ли три дис­кус­сии, содер­жа­щие 3214 выска­зы­ва­ний. Как пра­ви­ло, выска­зы­ва­ние пред­став­ля­ло собой ком­мен­та­рий, но ино­гда один ком­мен­та­рий содер­жал два-три выска­зы­ва­ния. Далее в про­це­ду­ре ком­пью­тер­ной обра­бот­ки кор­пу­са выска­зы­ва­ний, раз­ме­чен­ных тре­мя экс­пер­та­ми, была оце­не­на согла­со­ван­ность раз­мет­ки. К линг­ви­сти­че­ско­му ана­ли­зу пред­ло­жи­ли те выска­зы­ва­ния неком­му­ни­ка­тив­но­го (пред­мет­но­го) типа, в отно­ше­нии кото­рых была полу­че­на сто­про­цент­ная согла­со­ван­ность. Таких выска­зы­ва­ний ока­за­лось 1360: 269 аффек­тив­ных, 859 когни­тив­ных, 232 поведенческих.

Линг­ви­сти­че­ский аспект. При­ме­ня­ют­ся каче­ствен­но-коли­че­ствен­ный и сопо­ста­ви­тель­ный мето­ды ана­ли­за мате­ри­а­ла. Каче­ствен­ный метод, состо­я­щий в ана­ли­зе струк­ту­ры и семан­ти­ки пред­ло­же­ний-выска­зы­ва­ний, направ­лен на обна­ру­же­ние соот­вет­ствия меж­ду зна­че­ни­ем моде­лей (струк­тур­ных схем) пред­ло­же­ния и содер­жа­ни­ем каж­до­го из трех ком­по­нен­тов атти­тю­да: 1) аффек­тив­но­го (эмо­ци­о­наль­ной оцен­кой объ­ек­та), 2) когни­тив­но­го (его свой­ства и свя­зи, познан­ные чело­ве­ком) и 3) пове­ден­че­ско­го (лич­ный или соци­аль­ный опыт пове­де­ния по отно­ше­нию к объекту).

Коли­че­ствен­ный ана­лиз заклю­ча­ет­ся в уста­нов­ле­нии чис­ла акту­а­ли­за­ций струк­тур­ных схем пред­ло­же­ния, соот­вет­ству­ю­щих по сво­ей семан­ти­ке содер­жа­нию како­го-либо из ком­по­нен­тов атти­тю­да и выра­жа­ю­щих это содержание.

Сопо­ста­ви­тель­ный ана­лиз состо­ит в срав­не­нии чис­ла акту­а­ли­за­ций каж­дой из рас­смат­ри­ва­е­мых струк­тур­ных схем в мате­ри­а­лах трех кол­лек­ций и в объ­яс­не­нии обна­ру­жи­ва­е­мых различий.

В целом мето­ди­ка иссле­до­ва­ния при­зва­на про­де­мон­стри­ро­вать резуль­та­тив­ность вклю­че­ния пара­мет­ра «струк­тур­ная схе­ма пред­ло­же­ния» в состав важ­ней­ших пере­мен­ных линг­во­ста­ти­сти­че­ско­го ана­ли­за тек­стов в рабо­тах по ком­пью­тер­но­му когни­тив­но­му моделированию.

Про­грамм­ный аспект. Метод для выяв­ле­ния моде­лей пред­ло­же­ний осно­вы­ва­ет­ся на мор­фо­ло­ги­че­ской раз­мет­ке инстру­мен­та MyStem2, рабо­та с кото­рым осу­ществ­ля­лась при помо­щи язы­ка про­грам­ми­ро­ва­ния Python 3. Дан­ный ана­ли­за­тор поз­во­ля­ет пред­став­лять текст в виде после­до­ва­тель­но­сти токе­нов, каж­дый из кото­рых отра­жа­ет инфор­ма­цию о лем­ме и грам­ме­мах слов в тексте.

После полу­че­ния мор­фо­ло­ги­че­ской раз­мет­ки MyStem про­грамм­ный метод про­хо­дит в цик­ле через после­до­ва­тель­ность токе­нов и фик­си­ру­ет ряд буле­вых и коли­че­ствен­ных пара­мет­ров тек­ста, кото­рые могут ука­зы­вать на реа­ли­за­цию той или иной моде­ли пред­ло­же­ния. При­ме­ра­ми таких пара­мет­ров явля­ют­ся коли­че­ство суще­стви­тель­ных и место­име­ний в име­ни­тель­ном паде­же, нали­чие в тек­сте пол­ноз­на­ме­на­тель­ных гла­го­лов, вопро­си­тель­ных слов и вопро­си­тель­но­го зна­ка, инфи­ни­ти­вов, гла­го­лов в пове­ли­тель­ном накло­не­нии, суще­стви­тель­ных в роди­тель­ном и тво­ри­тель­ном паде­же, пол­ных при­ла­га­тель­ных, лемм «есть» и «нет» и др. После вычис­ле­ния пара­мет­ров тек­ста про­грамм­ный метод сопо­став­ля­ет эти пара­мет­ры с необ­хо­ди­мы­ми усло­ви­я­ми реа­ли­за­ции моде­лей. Напри­мер, модель Interr S опре­де­ля­ет­ся тогда, когда в тек­сте есть вопро­си­тель­ное сло­во и вопро­си­тель­ный знак, а модель N1–N1 может харак­те­ри­зо­вать­ся отсут­стви­ем зна­ме­на­тель­ных гла­го­лов и нали­чи­ем двух суще­стви­тель­ных в име­ни­тель­ном падеже.

Так как метод выяв­ле­ния моде­ли пред­ло­же­ния рабо­та­ет с про­сты­ми пред­ло­же­ни­я­ми, раз­ме­чен­ные фраг­мен­ты тек­стов были раз­би­ты на кла­у­зы с сохра­не­ни­ем ква­ли­фи­ка­ции атти­тю­да в исход­ных пред­ло­же­ни­ях. После при­ме­не­ния мето­да выяв­ле­ния моде­ли пред­ло­же­ния на мате­ри­а­ле кла­уз при помо­щи кри­те­рия согла­сия хи-квад­рат про­во­ди­лось попар­ное срав­не­ние выбо­рок атти­тю­дов отдель­но для каж­дой из семи моделей.

Анализ материала

Лингвистический анализ материала

Та или иная модель пред­ло­же­ния регу­ляр­но исполь­зу­ет­ся при реа­ли­за­ции како­го-либо ком­по­нен­та атти­тю­да тогда, когда ее семан­ти­ка соот­вет­ству­ет содер­жа­нию это­го ком­по­нен­та. Если же тако­го соот­вет­ствия нет, модель пред­ло­же­ния ока­зы­ва­ет­ся невос­тре­бо­ван­ной: она хотя и пред­став­ле­на в собран­ных кол­лек­ци­ях, но лишь немно­ги­ми выска­зы­ва­ни­я­ми. Одна и та же модель пред­ло­же­ния может регу­ляр­но исполь­зо­вать­ся при реа­ли­за­ции двух или даже трех ком­по­нен­тов атти­тю­да. Это про­ис­хо­дит в тех слу­ча­ях, когда содер­жа­нию раз­ных его ком­по­нен­тов соот­вет­ству­ют раз­ные зна­че­ния модели.

Обра­тим­ся к ана­ли­зу выска­зы­ва­ний каж­дой из трех коллекций.

В кол­лек­ции выска­зы­ва­ний, вопло­ща­ю­щих аффек­тив­ный ком­по­нент атти­тю­да, осо­бен­но актив­но исполь­зу­ют­ся две модели:

N1–N1 Автор моло­дец!; Джек Лон­дон — гений!; Ты кра­са­ва; Вы 65-лет­ний не слу­жив­ший дед с бро­нью; Пост 100 % зака­зу­ха.

N1–Adj1полн. Очень силь­ная пес­ня и очень силь­ное испол­не­ние; Вер­бов­ка кле­вая в филь­ме; Юмор такой же боро­да­тый; Хоть кто-то гра­мот­ный; Все такие «умные».

Реа­ли­за­ция обе­их моде­лей пред­ло­же­ния зако­но­мер­на. Струк­тур­ная схе­ма N1–N1 в чис­ле сво­их семан­ти­че­ских вари­ан­тов име­ет и такой, кото­рый отве­ча­ет потреб­но­сти участ­ни­ков сете­во­го обще­ния в эмо­ци­о­наль­ных оцен­ках кого-чего­ли­бо, а имен­но зна­че­ние «оцен­ка субъ­ек­та» [Шве­до­ва 1980: 281]. Оно реа­ли­зу­ет­ся, если ска­зу­е­мое выра­же­но суще­стви­тель­ным оце­ни­ва­ю­щей семан­ти­ки (гений, моло­дец, кра­са­ва и т. п.).

В свою оче­редь, ука­зан­ной потреб­но­сти соот­вет­ству­ет струк­тур­ная схе­ма N1–Adj1полн., имея зна­че­ние «отно­ше­ние меж­ду субъ­ек­том и его пре­ди­ка­тив­ным при­зна­ком — свой­ством или каче­ством» [Шве­до­ва 1980: 289].

Разу­ме­ет­ся, в рече­вом вопло­ще­нии эмо­ци­о­наль­ных оце­нок при­ни­ма­ет уча­стие целый ком­плекс раз­но­уров­не­вых линг­ви­сти­че­ских средств, орга­ни­зу­е­мых фор­ма­ми пред­ло­же­ний и сверх­фра­зо­вых единств. В наших при­ме­рах это инвер­сия (очень силь­ная пес­ня), исполь­зо­ва­ние интен­си­фи­ка­то­ра (очень силь­ная), жар­гон­ные сло­ва, мета­фо­ры, ирония.

Перей­дем к выска­зы­ва­ни­ям, в кото­рых доми­ни­ру­ет позна­ва­тель­ная (когни­тив­ная) уста­нов­ка.

Чаще все­го она реа­ли­зу­ет­ся исполь­зо­ва­ни­ем моде­ли N1–N1 — пре­иму­ще­ствен­но в зна­че­нии иден­ти­фи­ка­ции пред­ме­та речи с кем-/че­м‑л. (в том чис­ле при отне­се­нии к извест­но­му, тол­ко­ва­нии, отри­ца­нии тож­де­ства) [Шве­до­ва 1980: 279–280]: Суб­бренд — это отдель­ный бренд; При­ме­ня­е­мые в пище­вой про­мыш­лен­но­сти олив­ки — это пло­ды окуль­ту­рен­но­го вида мас­лич­но­го дере­ва; Под­пись — это пись­мен­ное соб­ствен­но­руч­ное заве­ре­ние доку­мен­та; День про­ры­ва и день сня­тия [бло­ка­ды] — раз­ные празд­ни­ки; Это декла­ра­ция, а не сер­ти­фи­кат.

Вполне оче­вид­но, что модель N1–Adj1полн., отоб­ра­жа­ю­щая свой­ства или каче­ства пред­ме­та речи, тоже ори­ен­ти­ро­ва­на на выра­же­ние резуль­та­тов позна­ва­тель­но­го про­цес­са: Олив­ки зеле­ные, мас­ли­ны чер­ные же; Внешне они абсо­лют­но иден­тич­ные; У Гон­до­ра мест­ность более леси­стая, куль­ту­ра более урба­ни­зи­ро­ван­ная; Мате­ри­а­лы креп­кие; Состав… отнюдь не полный.

Пока­за­тель­но и исполь­зо­ва­ние струк­тур­ной схе­мы вопро­си­тель­но­го пред­ло­же­ния с место­имен­ным вопро­си­тель­ным сло­вом — Interr S. Ее акту­а­ли­за­ции явля­ют­ся запро­сом све­де­ний о раз­лич­ных свой­ствах и отно­ше­ни­ях объ­ек­та. Имен­но поэто­му она регу­ляр­но фик­си­ру­ет­ся в кол­лек­ции выска­зы­ва­ний, реа­ли­зу­ю­щих когни­тив­ный ком­по­нент атти­тю­да: Так что такое фик­тив­ное повы­ше­ние цен? Из чего ты дела­ешь этот вывод? Какой пра­вя­щий класс в стране? В какой обла­сти он док­тор? Как назы­ва­ет­ся дан­ный доку­мент? В чем слож­ность печа­тать кор­пу­са из пластика?

Нуж­но учи­ты­вать, что при позна­нии чело­ве­ком объ­ек­та в нем обна­ру­жи­ва­ют­ся раз­ные по сво­е­му типу свой­ства и отно­ше­ния: бытий­ные, при­чин­но-след­ствен­ные, пар­ти­тив­ные (клас­си­фи­ка­ци­он­ные, части и цело­го), посес­сив­ные (при­над­леж­но­сти), ста­ту­аль­ные (состо­я­ния, изме­не­ния состо­я­ния), функ­ци­о­наль­ные и др. Из чис­ла моде­лей пред­ло­же­ния, выра­жа­ю­щих эти свой­ства, выбе­рем две со зна­че­ни­ем бытийности:

Есть N1 (регу­ляр­ная реа­ли­за­ция струк­тур­ной схе­мы N1–Vf). У меня есть интер­нет; Есть такая фиp­ма, как Pridе; Уже есть защи­та соб­ствен­но­сти в суде, есть сво­бо­да пере­ме­ще­ния; Есть доку­мен­таль­ные под­твер­жде­ния; В каж­дом круп­ном горо­де есть какие-то памят­ни­ки, колон­ны и прочее; 

Нет N2. У меня нет юри­ди­че­ско­го обра­зо­ва­ния; Нет у это­го доку­мен­та назва­ния; Нет ника­ких прин­ци­пи­аль­ных огра­ни­че­ний; Но у них нет про­из­вод­ства на тер­ри­то­рии РФ; Ана­ло­гов за эту цену про­сто нет.

Ори­ен­ти­ро­ван­ность этих моде­лей на реа­ли­за­цию позна­ва­тель­ной уста­нов­ки опре­де­ля­ет их регу­ляр­ную реа­ли­за­цию в рас­смат­ри­ва­е­мой кол­лек­ции высказываний.

Пове­ден­че­ский ком­по­нент атти­тю­да регу­ляр­но реа­ли­зу­ют моде­ли, име­ю­щие импе­ра­тив­ную семан­ти­ку (в наших мате­ри­а­лах семан­ти­ку сове­та, реко­мен­да­ции). Исполь­зуя их, субъ­ект речи хочет повли­ять на пове­де­ние собеседника.

Это опре­де­лен­но-лич­ные пред­ло­же­ния с глав­ным чле­ном, выра­жен­ным пове­ли­тель­ным накло­не­ни­ем гла­го­ла, — регу­ляр­ная реа­ли­за­ция струк­тур­ной схе­мы N1–Vf. Обо­зна­чим эти пред­ло­же­ния сим­во­ла­ми Imp (Ну не ходи тогда;Вос­поль­зуй­ся логи­кой и Гуг­лом; Про­да­вай их по 1500; Ну так най­ди ему год­ные само­дел­ки и при­шли; Толь­ко не дове­ряй­те обзо­рам на юту­бе). И Praed Inf (Нуж­но поку­пать с внеш­ни­ми под­клю­ча­те­ля­ми к розет­ке; Без про­блем вер­нуть мож­но; Не сто­ит наго­нять пани­ки; Нуж­но читать дого­вор еще вни­ма­тель­нее; При сомне­ни­ях нуж­но сове­то­вать­ся со спе­ци­а­ли­ста­ми).

Кро­ме про­стых неослож­нен­ных пред­ло­же­ний импе­ра­тив­ной семан­ти­ки, регу­ляр­но исполь­зу­е­мым син­так­си­че­ским сред­ством опи­са­ния пове­де­ния субъ­ек­та явля­ют­ся про­стые пред­ло­же­ния с одно­род­ны­ми ска­зу­е­мы­ми и слож­ные пред­ло­же­ния, отра­жа­ю­щие после­до­ва­тель­ность дей­ствий и собы­тий: …сна­ча­ла запол­ня­ешь дого­вор, потом опла­чи­ва­ешь, а уже затем [идешь] к вра­чу; …отправ­ля­ешь дого­вор на озна­ком­ле­ние, а тебе через две мину­ты при­ле­та­ет подпись.

Важ­но отме­тить, что семан­ти­че­ские вари­ан­ты моде­лей пред­ло­же­ния часто име­ют струк­тур­ные осо­бен­но­сти. Напри­мер, в моде­ли N1–N1 «выбор свя­зок и свя­зоч­ных обра­зо­ва­ний… опре­де­ля­ет­ся семан­ти­че­ской струк­ту­рой пред­ло­же­ния» [Шве­до­ва 1980: 284]. В наших мате­ри­а­лах эта модель при реа­ли­за­ции аффек­тив­но­го ком­по­нен­та атти­тю­да обыч­но исполь­зу­ет­ся с нуле­вой связ­кой (Автор моло­дец!), а когни­тив­но­го — в боль­шин­стве слу­ча­ев со связ­кой это (Суб­бренд — это отдель­ный бренд). У дру­гих моде­лей обна­ру­жи­ва­ют­ся свои струк­тур­но-семан­ти­че­ские варианты.

Статистический анализ материала

Срав­ни­тель­ный ана­лиз (попар­ное срав­не­ние по кри­те­рию хи-квад­рат) пред­став­лен­но­сти моде­лей пред­ло­же­ния в выска­зы­ва­ни­ях, авто­ма­ти­че­ски отне­сен­ных про­грамм­ны­ми сред­ства­ми к одно­му из аспек­тов атти­тю­да, пока­зал сле­ду­ю­щее (табл. 1, 2):

— выска­зы­ва­ния пове­ден­че­ско­го типа отли­ча­ют­ся более частым исполь­зо­ва­ни­ем моде­лей 6 и 7 (Imp, Praed Inf) и более ред­ким исполь­зо­ва­ни­ем моде­лей 1, 2 и 3 (N1–N1, Interr S, N1—Adj1полн.);

— выска­зы­ва­ния аффек­тив­но­го типа отли­ча­ют­ся частым исполь­зо­ва­ни­ем моде­ли 2 (Adj1полн.) — по срав­не­нию с выска­зы­ва­ни­я­ми как пове­ден­че­ско­го типа, так и когни­тив­но­го, а так­же с ред­ким исполь­зо­ва­ни­ем (точ­нее, отсут­стви­ем в кор­пу­се при­ме­ров исполь­зо­ва­ния) моде­ли 5 (Есть N1);

— для выска­зы­ва­ний когни­тив­но­го типа в изу­чен­ном кор­пу­се не най­де­но спе­ци­фи­че­ских моде­лей пред­ло­же­ний, кото­рые исполь­зо­ва­лись бы зна­чи­мо чаще или реже, чем в выска­зы­ва­ни­ях аффек­тив­но­го и когни­тив­но­го типа: отно­си­тель­но более частое исполь­зо­ва­ние моде­ли 5 (Есть N1) все же не поз­во­ля­ет отли­чить когни­тив­ный тип выска­зы­ва­ния от пове­ден­че­ско­го, а моде­ли 4 (Нет N2) — от выска­зы­ва­ний как пове­ден­че­ско­го, так и аффек­тив­но­го типа.

 

Таб­ли­ца 1. Пред­став­лен­ность в под­кор­пу­сах выска­зы­ва­ний, содер­жа­щих рас­смат­ри­ва­е­мые моде­ли предложений

Модель пред­ло­же­нияПод­кор­пус аффек­тив­ных выска­зы­ва­ний (%)Под­кор­пус когни­тив­ных выска­зы­ва­ний (%)Под­кор­пус пове­ден­че­ских высказываний (%)Общее чис­ло кла­уз с дан­ной моделью 
1. N1-ADJ1полн.28 (6,91)83 (4,01)21 (2,16)149
2. N1-N140 (9,88)270 (13,04)63 (6,49)430
3. Interr S17 (4,2)83 (4,01)13 (1,34)132
4. Есть N1037 (1,79)8 (0,82)49
5. Нет N21 (0,25)28 (1,35)4 (0,41)38
6. Imp14 (3,46)47 (2,27)66 (6,8)151
7. Praed Inf7 (1,73)57 (2,75)43 (4,43)133
Кла­у­зы без моде­лей 1–7298 (73,58)1466 (70,79)752 (77,53)2957
Чис­ло кла­уз в подкорпусе40520719704039

 

Таб­ли­ца 2. Ста­ти­сти­че­ская зна­чи­мость раз­ли­чий в пред­став­лен­но­сти моде­лей в подкорпусах

МодельАттитюд1Аттитюд2рр*
N1-ADJ1полн.Аффек­тив­ныйПове­ден­че­ский0,00003***
N1-ADJ1полн.Когни­тив­ныйПове­ден­че­ский0,01245**
N1-ADJ1полн.Аффек­тив­ныйКогни­тив­ный0,01416**
N1-N1Когни­тив­ныйПове­ден­че­ский0,00000***
N1-N1Аффек­тив­ныйПове­ден­че­ский0,03949*
N1-N1Аффек­тив­ныйКогни­тив­ный0,09380 
Interr SКогни­тив­ныйПове­ден­че­ский0,00014***
Interr SАффек­тив­ныйПове­ден­че­ский0,00191***
Interr SАффек­тив­ныйКогни­тив­ный0,96853 
Есть N1Аффек­тив­ныйКогни­тив­ный0,01291**
Есть N1Когни­тив­ныйПове­ден­че­ский0,05925 
Есть N1Аффек­тив­ныйПове­ден­че­ский0,14873 
Нет N2Когни­тив­ныйПове­ден­че­ский0,02955*
Нет N2Аффек­тив­ныйКогни­тив­ный0,10142 
Нет N2Аффек­тив­ныйПове­ден­че­ский1,00000 
ImpКогни­тив­ныйПове­ден­че­ский0,00000***
ImpАффек­тив­ныйПове­ден­че­ский0,02198*
ImpАффек­тив­ныйКогни­тив­ный0,21701 
Praed InfКогни­тив­ныйПове­ден­че­ский0,02071*
Praed InfАффек­тив­ныйПове­ден­че­ский0,02236*
Praed InfАффек­тив­ныйКогни­тив­ный0,30944 

 

Результаты исследования

Линг­ви­сти­че­ский (каче­ствен­ный) ана­лиз раз­ме­чен­ных вруч­ную пси­хо­ло­га­ми кол­лек­ций выска­зы­ва­ний в сете­вых дис­кус­си­ях пока­зал, что эти кол­лек­ции могут быть надеж­но диф­фе­рен­ци­ро­ва­ны по семан­ти­че­ским вари­ан­там мно­го­знач­ных струк­тур­ных схем. Ста­ти­сти­че­ский (коли­че­ствен­ный) ана­лиз кол­лек­ций, авто­ма­ти­че­ски раз­ме­чен­ных создан­ны­ми про­грамм­ны­ми сред­ства­ми, поз­во­лил диф­фе­рен­ци­ро­вать кол­лек­ции пове­ден­че­ско­го и аффек­тив­но­го типа, но не решил эту зада­чу для выска­зы­ва­ний когни­тив­но­го типа. Посколь­ку на этом эта­пе рабо­ты про­грамм­ные сред­ства учи­ты­ва­ют толь­ко мак­си­маль­но отвле­чен­ную семан­ти­ку моде­ли пред­ло­же­ния, оче­вид­но, что даль­ней­шее совер­шен­ство­ва­ние мето­ди­ки иссле­до­ва­ния пред­по­ла­га­ет вклю­че­ние в авто­ма­ти­че­ский ана­лиз струк­тур­но-семан­ти­че­ских вари­ан­тов мно­го­знач­ных моде­лей предложения.

Необ­хо­ди­мо учи­ты­вать так­же осо­бен­но­сти исполь­зо­ван­но­го мате­ри­а­ла. Вопер­вых, семь рас­смот­рен­ных моде­лей пред­став­ле­ны толь­ко в 27 % кла­уз, выде­лен­ных авто­ма­ти­че­ски. Во-вто­рых, кол­лек­ция выска­зы­ва­ний когни­тив­но­го типа ока­за­лась в изу­чен­ных сете­вых дис­кус­си­ях впя­те­ро боль­ше кол­лек­ции выска­зы­ва­ний аффек­тив­но­го типа и вдвое боль­ше кол­лек­ции выска­зы­ва­ний пове­ден­че­ско­го типа. Соот­вет­ствен­но, мож­но ожи­дать, что при уве­ли­че­нии чис­ла раз­ме­чен­ных сете­вых дис­кус­сий и при уве­ли­че­нии чис­ла моде­лей, рас­по­зна­ва­е­мых авто­ма­ти­че­ски спе­ци­аль­но создан­ны­ми про­грамм­ны­ми сред­ства­ми, харак­те­ри­сти­ка выска­зы­ва­ний аффек­тив­но­го типа уточ­нит­ся, а для выска­зы­ва­ний когни­тив­но­го типа будут най­де­ны спе­ци­фи­ци­ру­ю­щие их моде­ли предложений.

В заклю­че­ние хоте­лось бы отме­тить мето­до­ло­ги­че­скую осо­бен­ность линг­ви­сти­че­ских иссле­до­ва­ний, про­во­ди­мых в инте­ре­сах пси­хо­ди­а­гно­сти­ки. В тако­го рода зада­чах тек­сто­вый «порт­рет» выска­зы­ва­ний состав­ля­ет­ся линг­ви­стом для пси­хо­ло­ги­че­ско­го поня­тия, нашед­ше­го свою реа­ли­за­цию в тек­сте. Это зна­чит, что опи­са­нию под­ле­жит не сама реаль­ность, а ее науч­ная модель. Доступ к этой моде­ли линг­вист полу­ча­ет из дефи­ни­ции, пред­ла­га­е­мой пси­хо­ло­ги­ей, и из раз­ме­чен­но­го пси­хо­ло­га­ми кор­пу­са. Мож­но ска­зать, что в меж­дис­ци­пли­нар­ных иссле­до­ва­ни­ях по ана­ли­зу тек­стов сете­вых обсуж­де­ний линг­вист иссле­ду­ет инту­и­тив­ные реше­ния экс­пер­та-пси­хо­ди­а­гно­ста, а спе­ци­а­лист по искус­ствен­но­му интел­лек­ту моде­ли­ру­ет неосо­зна­ва­е­мые «рас­суж­де­ния» пси­хо­ло­га, выно­ся­ще­го на осно­ве доступ­ных ему тек­стов суж­де­ние о свой­ствах их авто­ров (отдель­ных людей или групп). Как пока­за­ло пило­таж­ное иссле­до­ва­ние, поня­тие атти­тю­да и пред­став­ле­ние о его аспек­тах может быть успеш­но опе­ра­ци­о­на­ли­зи­ро­ва­но как грам­ма­ти­че­ский «про­филь» тек­стов сете­вых обсуж­де­ний, где в каче­стве пока­за­те­лей высту­па­ют моде­ли предложений.

Выводы

Для линг­во­ста­ти­сти­ки боль­шое зна­че­ние име­ет выбор пара­мет­ров ана­ли­за речи. Пред­став­ля­ет­ся важ­ным вве­сти в их состав моде­ли (струк­тур­ные схе­мы) пред­ло­же­ния, явля­ю­ще­го­ся основ­ной еди­ни­цей выра­же­ния мыс­ли. Посколь­ку ака­де­ми­че­ские грам­ма­ти­ки рус­ско­го язы­ка содер­жат пол­ный и закры­тый спи­сок струк­тур­ных схем пред­ло­же­ния как его пре­ди­ка­тив­но­го мини­му­ма, счи­та­ем целе­со­об­раз­ным их про­грам­ми­ро­ва­ние и исполь­зо­ва­ние в инстру­мен­тах авто­ма­ти­че­ско­го ана­ли­за тек­ста. От мини­маль­ных струк­тур­ных схем в необ­хо­ди­мых слу­ча­ях воз­мо­жен пере­ход к рас­ши­рен­ным струк­тур­ным схе­мам (к номи­на­тив­но­му мини­му­му пред­ло­же­ния) и пра­ви­лам их распространения.

Вклю­чен­ность меха­низ­мов син­так­си­са в рече­вое мыш­ле­ние и важ­ная роль моде­лей пред­ло­же­ния в пере­хо­де от внут­рен­ней речи к внеш­ней явля­ют­ся осно­ва­ни­ем для пред­по­ло­же­ния о том, что ста­ти­сти­че­ский ана­лиз реа­ли­за­ции син­так­си­че­ских моде­лей в текстах может стать эффек­тив­ным сред­ством сете­вой пси­хо­ди­а­гно­сти­ки. Постав­ле­на зада­ча авто­ма­ти­че­ско­го раз­ли­че­ния трех кол­лек­ций, состав­лен­ных из выска­зы­ва­ний, вопло­ща­ю­щих эмо­ци­о­наль­ное, позна­ва­тель­ное или пове­ден­че­ское отно­ше­ние к объ­ек­ту (один из этих ком­по­нен­тов аттитюда).

В пило­таж­ном иссле­до­ва­нии выбра­ны семь моде­лей пред­ло­же­ния, семан­ти­ка кото­рых соот­вет­ству­ет содер­жа­нию како­го-либо из ука­зан­ных ком­по­нен­тов. Каче­ствен­ный ана­лиз мате­ри­а­ла пока­зал, что мно­го­знач­ные моде­ли реа­ли­зу­ют в раз­ных кол­лек­ци­ях раз­лич­ные семан­ти­че­ские вари­ан­ты — имен­но те, кото­рые сов­па­да­ют с содер­жа­ни­ем атти­тю­да. Коли­че­ствен­ный ана­лиз, ори­ен­ти­ро­ван­ный на дан­ном эта­пе рабо­ты толь­ко на наи­бо­лее отвле­чен­ное зна­че­ние син­так­си­че­ской моде­ли (без уче­та ее семан­ти­че­ско­го варьи­ро­ва­ния), поз­во­лил диф­фе­рен­ци­ро­вать кол­лек­ции пове­ден­че­ско­го и аффек­тив­но­го типа, но не решил эту зада­чу для кол­лек­ции выска­зы­ва­ний, вопло­ща­ю­щих когни­тив­ный ком­по­нент. Допол­не­ние коли­че­ствен­но­го ана­ли­за мате­ри­а­ла каче­ствен­ным обес­пе­чи­ло интер­пре­ти­ру­е­мость полу­чен­ных ста­ти­сти­че­ских дан­ных. Совер­шен­ство­ва­ние оха­рак­те­ри­зо­ван­ной мето­ди­ки пред­по­ла­га­ет вклю­че­ние в иссле­до­ва­ние фор­маль­ных при­зна­ков, обна­ру­жи­ва­е­мых у реа­ли­за­ций семан­ти­че­ских вари­ан­тов син­так­си­че­ской модели.

Впо­след­ствии раз­лич­ные меди­а­тек­сты смо­гут быть пред­став­ле­ны как содер­жа­щие выска­зы­ва­ния, реа­ли­зу­ю­щие пре­иму­ще­ствен­но одни моде­ли пред­ло­же­ний и не реа­ли­зу­ю­щие дру­гие, а сами тек­сты в этом слу­чае мож­но будет рас­смат­ри­вать как про­яв­ля­ю­щие аффек­тив­ное, когни­тив­ное или пове­ден­че­ское отно­ше­ние кол­лек­тив­но­го субъ­ек­та к обсуж­да­е­мым соци­аль­ным объ­ек­там. Появ­ле­ние тако­го инстру­мен­та авто­ма­ти­че­ско­го соци­аль­но-пси­хо­ло­ги­че­ско­го ана­ли­за меди­а­тек­стов поз­во­лит про­во­дить иссле­до­ва­ние отно­ше­ния поль­зо­ва­те­лей соц­се­тей и ком­мен­та­то­ров элек­трон­ных СМИ к соци­аль­но зна­чи­мым объ­ек­там и событиям.

1 Жур­нал «Инфор­ма­ци­он­ные тех­но­ло­гии и вычис­ли­тель­ные систе­мы». Элек­трон­ный ресурс http://​www​.jitcs​.ru/; Жур­нал «Искус­ствен­ный интел­лект и при­ня­тие реше­ний». Элек­трон­ный ресурс https://​www​.aidt​.ru/​r​u​/​s​c​o​p​e​/​s​u​b​j​e​cts; Жур­нал «Тру­ды Инсти­тут систем­но­го ана­ли­за РАН». Элек­трон­ный ресурс http://​www​.isa​.ru/​p​r​o​c​e​e​d​i​n​gs/.

2 МyStem. Элек­трон­ный ресурс https://​yandex​.ru/​d​e​v​/​m​y​s​t​em/.

Ста­тья посту­пи­ла в редак­цию 19 сен­тяб­ря 2023 г.;
реко­мен­до­ва­на к печа­ти 7 апре­ля 2024 г.

© Санкт-Петер­бург­ский госу­дар­ствен­ный уни­вер­си­тет, 2024

Received: September 19, 2023
Accepted: April 7, 2024