Понедельник, 15 декабряИнститут «Высшая школа журналистики и массовых коммуникаций» СПбГУ
Shadow

Статистика моделей предложения как средство корпусных исследований аттитюдов (на материале сетевых дискуссий)

Исследование выпол­не­но в рам­ках науч­ной про­грам­мы Национального цен­тра физи­ки и мате­ма­ти­ки, направ­ле­ние № 9 «Искусственный интел­лект и боль­шие дан­ные в тех­ни­че­ских, про­мыш­лен­ных, при­род­ных и соци­аль­ных системах».

This study was conducted within the framework of the scientific program of the National Center for Physics and Mathematics, section no. 9 “Artificial intelligence and big data in technical, industrial, natural and social systems”.

Постановка проблемы

Проблематика сете­вой пси­хо­ди­а­гно­сти­ки актив­но пред­став­ле­на в послед­ние годы в линг­ви­сти­че­ских и пси­хо­ло­ги­че­ских иссле­до­ва­ни­ях, в рабо­тах по авто­ма­ти­че­ско­му ана­ли­зу тек­ста. Первоначальный пери­од «побед­ных реля­ций» сме­нил­ся трез­вым пони­ма­ни­ем того, что тре­бу­ют­ся тон­ко орга­ни­зо­ван­ные иссле­до­ва­ния, в кото­рых учи­ты­ва­лась бы спе­ци­фи­ка как опре­де­ля­е­мых по тек­сту пси­хо­ло­ги­че­ских сущ­но­стей, так и пара­мет­ров тек­стов, выби­ра­е­мых в каче­стве так назы­ва­е­мых мар­ке­ров. Если гово­рить о пер­вых, то необ­хо­ди­мо пом­нить о том, что пред­ме­том диа­гно­сти­ки, осно­ван­ной на ана­ли­зе тек­стов, могут быть не толь­ко лич­ност­ные осо­бен­но­сти, эмо­ци­о­наль­ные реак­ции и пси­хи­че­ские состо­я­ния, но и раз­лич­ные ком­по­нен­ты позна­ва­тель­ной сфе­ры, в том чис­ле свя­зан­ные с самой орга­ни­за­ци­ей этой сфе­ры, т. е. такие струк­ту­ры, как образ мира и кар­ти­на мира. Каждая струк­ту­ра пси­хи­ки порож­да­ет­ся набо­ром сво­их пси­хо­ло­ги­че­ских меха­низ­мов и име­ет свое­об­раз­ные отно­ше­ния с речью, так что и для диа­гно­сти­ки осо­бен­но­стей этой струк­ту­ры по тек­сту тре­бу­ют­ся свои тек­сто­вые пока­за­те­ли. В каче­стве тако­вых могут высту­пать весь­ма раз­лич­ные эле­мен­ты язы­ка и речи — от кон­крет­ных лек­сем, лег­ко выде­ля­е­мых совре­мен­ны­ми линг­ви­сти­че­ски­ми ана­ли­за­то­ра­ми, до таких слож­но­ор­га­ни­зо­ван­ных и пока не став­ших пред­ме­том моде­ли­ро­ва­ния в систе­мах искус­ствен­но­го интел­лек­та сущ­но­стей, как модель пред­ло­же­ния или ком­му­ни­ка­тив­ный регистр. Настоящая рабо­та посвя­ще­на иссле­до­ва­нию воз­мож­но­сти выяв­ле­ния в сете­вых обсуж­де­ни­ях ком­по­нен­тов атти­тю­да (или типов кар­ти­ны мира) по харак­те­ру исполь­зу­е­мых моде­лей предложения.

Отношения ска­зу­е­мо­го с под­ле­жа­щим, состав­ля­ю­щие струк­ту­ру дву­со­став­но­го пред­ло­же­ния, пред­став­ля­ют субъ­ек­ту говорения/слушания отно­ше­ние дей­ствия акто­ра и объ­ек­та это­го дей­ствия. Именно эти отно­ше­ния обра­зу­ют осно­ву созна­ния, кото­рое зарож­да­ет­ся в антро­по­ге­не­зе и фор­ми­ру­ет­ся в онто­ге­не­зе как раз для того, что­бы пре­зен­ти­ро­вать само­му субъ­ек­ту систе­му его дей­ствия с объ­ек­та­ми. Как было пока­за­но в рабо­тах Л. С. Выготского и его шко­лы, любой пси­хи­че­ский про­цесс воз­ни­ка­ет вна­ча­ле в поле интер­пси­хи­че­ско­го, в обще­нии и вза­и­мо­дей­ствии и лишь затем ста­но­вит­ся интра­пси­хи­че­ским обра­зо­ва­ни­ем, инте­ри­о­ри­зу­ет­ся. Таким обра­зом, пред­став­ле­ние (точ­нее было бы исполь­зо­вать нео­ло­гизм «пред­став­ли­ва­ние») дей­ствия и его объ­ек­та зарож­да­ет­ся в антро­по­ге­не­зе в ком­му­ни­ка­ции и фор­ми­ру­ет грам­ма­ти­ку язы­ка, а в онто­ге­не­зе, при овла­де­нии язы­ком, отно­ше­ние ска­зу­е­мо­го и под­ле­жа­ще­го воз­ни­ка­ет как сред­ство струк­ту­ри­ро­ва­ния реаль­но­сти и опре­де­ля­ет стро­е­ние инди­ви­ду­аль­но­го созна­ния. В пред­ло­жен­ной А. Н. Леонтьевым схе­ме стро­е­ния эле­мен­та созна­ния зна­че­ние пред­ме­та рас­смат­ри­ва­ет­ся как инстру­мент куль­ту­ры, ответ­ствен­ный за акку­му­ля­цию общественно-исторического опы­та дей­ство­ва­ния с пред­ме­том, его смысл — как инстру­мент накоп­ле­ния лич­но­го опы­та вза­и­мо­дей­ствия с пред­ме­том, чув­ствен­ная ткань созна­ния. Иначе гово­ря, сам образ пред­ме­та, отра­жа­ю­щий его свой­ства, рабо­та­ет как инстру­мент обоб­ще­ния зна­ний о мно­же­стве кон­крет­ных объ­ек­тов, с кото­ры­ми чело­век дей­ство­вал как с пред­ме­том — носи­те­лем име­ни [Леонтьев 2004].

В общей пси­хо­ло­гии эти осно­ва­ния созна­ния рас­смат­ри­ва­ют­ся в рам­ках про­бле­ма­ти­ки кар­ти­ны мира, в соци­аль­ной пси­хо­ло­гии — в рам­ках изу­че­ния так назы­ва­е­мых соци­аль­ных уста­но­вок, атти­тю­дов. В соци­аль­ной пси­хо­ло­гии атти­тюд пони­ма­ет­ся как «опре­де­лен­ное состо­я­ние созна­ния и нерв­ной систе­мы, выра­жа­ю­щее готов­ность к реак­ции, орга­ни­зо­ван­ное на осно­ве пред­ше­ству­ю­ще­го опы­та, ока­зы­ва­ю­щее направ­ля­ю­щее и дина­ми­че­ское вли­я­ние на пове­де­ние» [Андреева 2018: 289]. Аттитюд обла­да­ет трех­ком­по­нент­ной струк­ту­рой, «в кото­рой выде­ля­ют­ся: а) когни­тив­ный ком­по­нент (осо­зна­ние объ­ек­та соци­аль­ной уста­нов­ки); б) аффек­тив­ный ком­по­нент (эмо­ци­о­наль­ная оцен­ка объ­ек­та, выяв­ле­ние чув­ства сим­па­тии или анти­па­тии к нему); в) пове­ден­че­ский (кона­тив­ный) ком­по­нент (после­до­ва­тель­ное пове­де­ние по отно­ше­нию к объ­ек­ту)» [Андреева 2018: 290]. Другими сло­ва­ми, если рас­смат­ри­вать выска­зы­ва­ние чело­ве­ка об объ­ек­те в социально-психологическом клю­че, то мы обна­ру­жим, что чело­век опи­сы­ва­ет свое эмо­ци­о­наль­ное, позна­ва­тель­ное или пове­ден­че­ское отно­ше­ние к нему. В искус­ствен­ном интел­лек­те пред­став­ле­ние о стро­е­нии созна­ния, пред­ло­жен­ное А. Н. Леонтьевым, полу­чи­ло раз­ви­тие, суще­ствен­ное для моде­ли­ро­ва­ния целе­по­ла­га­ния интел­лек­ту­аль­но­го аген­та [Осипов и др. 2018]. В обла­сти линг­ви­сти­ки эти сов­мест­ные с мате­ма­ти­ка­ми и пси­хо­ло­га­ми рабо­ты [Салимовский и др. 2019] направ­ле­ны на выяв­ле­ние рече­вой орга­ни­за­ции таких аспек­тов систе­мы выска­зы­ва­ний, как пред­став­лен­ный в ней сце­на­рий пове­де­ния (пре­зен­та­ция созна­нию зна­че­ния пред­ме­та), лич­ная исто­рия (нар­ра­тив, экс­пли­ци­ру­ю­щий смысл пред­ме­та для субъ­ек­та выска­зы­ва­ния), образ пред­ме­та (опи­са­ние свойств и свя­зей предмета).

В насто­я­щей ста­тье мы хоте­ли бы пред­ло­жить сред­ство ана­ли­за тек­ста как систе­мы выска­зы­ва­ний, содер­жа­щей эти типы в раз­ных про­пор­ци­ях. Такая линг­во­ста­ти­сти­че­ская типо­ло­ги­за­ция кор­пу­сов тек­стов, собран­ных в сете­вых дис­кус­си­ях, поз­во­ли­ла бы при даль­ней­шей авто­ма­ти­за­ции ана­ли­за речи про­во­дить мони­то­ринг соци­аль­ных сетей на пред­мет выяв­ле­ния пове­ден­че­ско­го, эмо­ци­о­наль­но­го и когни­тив­но­го аспек­тов аттитюда.

На сле­ду­ю­щем эта­пе рабо­ты пла­ни­ру­ет­ся обра­ще­ние так­же к кор­пу­су выска­зы­ва­ний, в кото­рых в каче­стве доми­ни­ру­ю­щей реа­ли­зу­ет­ся соб­ствен­но ком­му­ни­ка­тив­ная интен­ция. Тем самым субъектно-объектное отно­ше­ние будет допол­не­но субъектно-субъектным, диа­ло­ги­че­ским [Дускаева и др. 2019].

Итак, на наш взгляд, модель пред­ло­же­ния может рас­смат­ри­вать­ся как еди­ни­ца ана­ли­за дей­ствия, пре­зен­ти­ро­ван­но­го созна­нию субъ­ек­та. Говоря о еди­ни­це ана­ли­за, мы опи­ра­ем­ся на пред­став­ле­ние Л. С. Выготского: «Под еди­ни­цей мы под­ра­зу­ме­ва­ем такой про­дукт ана­ли­за, кото­рый, в отли­чие от эле­мен­тов, обла­да­ет все­ми основ­ны­ми свой­ства­ми, при­су­щи­ми цело­му, и кото­рые явля­ют­ся далее нераз­ло­жи­мы­ми живы­ми частя­ми это­го един­ства» [Выготский 2021: 14]. В насто­я­щий момент для задач авто­ма­ти­че­ско­го ана­ли­за тек­стов сете­во­го кон­тен­та доста­точ­но ост­ро сто­ит вопрос о том, про­дол­жать ли про­во­дить поэле­мент­ный ана­лиз, выде­ля­ю­щий в тек­сте отдель­ные лек­се­мы, части речи, пунк­ту­а­ци­он­ные зна­ки и т. п., или же необ­хо­ди­мо пере­хо­дить к ана­ли­зу линг­ви­сти­че­ских еди­ниц, харак­те­ри­зу­ю­щих пси­хо­ло­ги­че­скую реаль­ность, сто­я­щую за выска­зы­ва­ни­ем авто­ра. В про­ве­ден­ном в 2021 г. [Moreno et al. 2021] обзорно-аналитическом иссле­до­ва­нии мето­дов авто­ма­ти­че­ско­го ана­ли­за выска­зы­ва­ний и их кор­ре­ля­ции с лич­ност­ным опрос­ни­ком «Большой пятер­ки» (на осно­ве дан­ных, пред­став­лен­ных в 84 пуб­ли­ка­ци­ях о свя­зи тек­сто­вых пара­мет­ров с дан­ны­ми пси­хо­ди­а­гно­сти­ки) эта про­бле­ма пред­став­ле­на так: «В лите­ра­ту­ре мож­но най­ти два основ­ных мето­да ана­ли­за язы­ка для изу­че­ния лич­но­сти — мето­ды, осно­ван­ные на кри­те­ри­ях экс­пер­тов… и мето­ды, осно­ван­ные на вычис­ли­тель­ных моде­лях язы­ка (речь идет о совре­мен­ных мето­дах машин­но­го обу­че­ния. — Авт.). Основное раз­ли­чие меж­ду ними заклю­ча­ет­ся в том, что послед­ние моде­ли фоку­си­ру­ют­ся на семан­ти­че­ских отно­ше­ни­ях меж­ду сло­ва­ми, фра­за­ми, абза­ца­ми и т. д., в то вре­мя как пер­вые моде­ли пред­по­ла­га­ют ана­лиз, кото­рый направ­лен на обна­ру­же­ние шаб­ло­нов (обыч­но опре­де­ля­е­мых как пра­ви­ла в регу­ляр­ных выра­же­ни­ях или грам­ма­ти­ке и даже под­дер­жи­ва­е­мых син­так­си­че­ски­ми ана­ли­за­то­ра­ми)» [Moreno et al. 2021: 2]. На осно­ве про­ве­ден­но­го ста­ти­сти­че­ски­ми сред­ства­ми мета­а­на­ли­за дела­ет­ся вывод о том, что «ком­би­на­ция син­так­си­че­ской и семан­ти­че­ской инфор­ма­ции по срав­не­нию с исполь­зо­ва­ни­ем толь­ко одно­го типа инфор­ма­ции» обла­да­ет боль­шей эффек­тив­но­стью [Moreno et al. 2021: 5]. К тако­му же выво­ду при­хо­дит и оте­че­ствен­ный иссле­до­ва­тель [Devyatkin 2019].

В насто­я­щей рабо­те, учи­ты­вая вклю­чен­ность меха­низ­мов син­так­си­са в рече­вое мыш­ле­ние [Ахутина 2022] и важ­ную роль моде­лей пред­ло­же­ния в пере­хо­де от струк­тур пси­хи­ки к внеш­ней речи [Норман 2011], мы про­ве­дем ста­ти­сти­че­ский ана­лиз реа­ли­за­ции моде­лей пред­ло­же­ния в текстах сете­вых дис­кус­сий с целью раз­ли­че­ния ком­по­нен­тов атти­тю­да — аффек­тив­но­го, когни­тив­но­го и поведенческого.

История вопроса

В коли­че­ствен­ном ана­ли­зе тек­ста по его язы­ко­вым пара­мет­рам, как нам пред­став­ля­ет­ся, мож­но раз­ли­чать два основ­ных под­хо­да. Первый, пре­об­ла­да­ю­щий, состо­ит в выбо­ре в каче­стве пара­мет­ров ста­ти­сти­че­ско­го иссле­до­ва­ния тех грам­ма­ти­че­ских и лексико-семантических кате­го­рий, кото­рые во флек­тив­ных язы­ках обра­зу­ют осно­ву язы­ко­вой систе­мы — частей речи, их мор­фо­ло­ги­че­ских кате­го­рий, а так­же типов сло­во­со­че­та­ния, видов про­сто­го пред­ло­же­ния (преж­де все­го по цели выска­зы­ва­ния, соста­ву глав­ных чле­нов), видов слож­но­го пред­ло­же­ния с их даль­ней­шей типо­ло­ги­за­ци­ей, семан­ти­че­ских клас­сов слов и др. Назначение работ это­го направ­ле­ния — пред­ста­вить по воз­мож­но­сти пол­ную кар­ти­ну коли­че­ствен­ных зако­но­мер­но­стей функ­ци­о­ни­ро­ва­ния язы­ка в рече­вых разновидностях.

Второй под­ход состо­ит во вклю­че­нии в состав пара­мет­ров коли­че­ствен­но­го ана­ли­за пер­во­на­чаль­но толь­ко тех язы­ко­вых средств, функ­ци­о­ни­ро­ва­ние кото­рых может под­твер­дить (или опро­верг­нуть) гипо­те­зу иссле­до­ва­те­ля о при­чин­ной зави­си­мо­сти их регу­ляр­но­го упо­треб­ле­ния в том или ином типе тек­стов от его содер­жа­тель­ных харак­те­ри­стик или вли­я­ния опре­де­лен­ных пси­хо­ло­ги­че­ских либо соци­аль­ных фак­то­ров. Этот под­ход важен как для изу­че­ния спе­ци­фи­ки раз­но­вид­но­стей речи [Кожина 2020], так и для реше­ния погра­нич­ных линг­во­со­ци­о­пси­хо­ло­ги­че­ских задач.

Часто иссле­до­ва­те­ли стре­мят­ся сов­ме­стить эти под­хо­ды: рас­ши­ря­ют, насколь­ко это воз­мож­но, состав пара­мет­ров коли­че­ствен­но­го ана­ли­за тек­стов и в той мере, в какой это уда­ет­ся, объ­яс­ня­ют полу­чен­ные коли­че­ствен­ные данные.

Широкое исполь­зо­ва­ние ста­ти­сти­че­ских мето­дов в ана­ли­зе тек­стов начи­на­ет­ся в 1960–1970‑е годы (см., напри­мер: [Андреев 1967; Адмони 1963; Головин 1971; Кожина 1972; Лесскисс 1962; Шайкевич 1968; Пиотровский 1968]).

Нужно отме­тить, что уста­нов­ка линг­ви­стов на широ­кий охват в ста­ти­сти­че­ском ана­ли­зе речи грам­ма­ти­че­ских и лексико-семантических явле­ний объ­яс­ня­ет­ся логи­кой раз­ви­тия язы­ко­зна­ния: после того как ста­ла оче­вид­ной непол­но­та зна­ний о язы­ке, полу­ча­е­мых толь­ко каче­ствен­ны­ми мето­да­ми, нача­ла раз­ви­вать­ся коли­че­ствен­ная линг­ви­сти­ка, назна­че­ние кото­рой мно­гие иссле­до­ва­те­ли виде­ли глав­ным обра­зом в допол­не­нии зна­ний о грам­ма­ти­че­ском и лек­си­че­ском строе язы­ка. Вместе с тем в рас­смат­ри­ва­е­мый пери­од скла­ды­ва­ют­ся пер­вые соб­ствен­но рече­вед­че­ские кон­цеп­ции, в кото­рых линг­во­ста­ти­сти­ка исполь­зу­ет­ся для изу­че­ния орга­ни­за­ции речи, зако­но­мер­но­стей рече­вой деятельности.

Именно в рече­ве­де­нии наи­бо­лее после­до­ва­тель­но стал реа­ли­зо­вать­ся вто­рой из ука­зан­ных под­хо­дов. По отно­ше­нию к функ­ци­о­наль­ной сти­ли­сти­ке его содер­жа­ние емко оха­рак­те­ри­зо­ва­ла М. Н. Кожина: «Можно идти эмпи­ри­че­ским путем и под­вер­гать ста­ти­сти­че­ско­му обсле­до­ва­нию одну за дру­гой еди­ни­цы язы­ко­вой систе­мы, функ­ци­о­ни­ру­ю­щие в речи… Этот путь в кон­це кон­цов при­ве­дет к реше­нию постав­лен­ных задач, осо­бен­но — к пол­но­му опи­са­нию ста­ти­сти­че­ской струк­ту­ры сти­лей. Однако этот путь не эко­но­мен… Частота упо­треб­ле­ния не всех и не каж­до­го из язы­ко­вых средств дает более или менее чет­кие гра­ни­цы по сти­лям. Более эффек­тив­ным пред­став­ля­ет­ся дру­гой воз­мож­ный путь. Исходя из тео­ре­ти­че­ских посы­лок… целе­со­об­раз­но ста­ти­сти­че­ское обсле­до­ва­ние сти­лей речи начи­нать пре­иму­ще­ствен­но с тех язы­ко­вых еди­ниц… кото­рые бла­го­да­ря сво­ей семантико-грамматической при­ро­де более “соот­вет­ству­ют” зада­чам обще­ния в иссле­ду­е­мом сти­ле. Степень упо­тре­би­тель­но­сти этих еди­ниц (часто­та) нахо­дит­ся в при­чин­ной зави­си­мо­сти от назна­че­ния соот­вет­ству­ю­щей фор­мы обще­ствен­но­го созна­ния, вида дея­тель­но­сти и т. д.» [Кожина 2020: 180–181].

Думается, что этот спо­соб коли­че­ствен­но­го ана­ли­за речи при­ме­ним не толь­ко к функ­ци­о­наль­ным сти­лям, но к любым мно­же­ствам тек­стов, орга­ни­за­ция кото­рых под­чи­не­на обще­му прин­ци­пу и кон­кре­ти­зи­ру­ю­щим его закономерностям.

В 1980–1990‑е годы инте­рес к вопро­сам линг­во­ста­ти­сти­ки осла­бе­ва­ет. Но через непро­дол­жи­тель­ное вре­мя он воз­рож­да­ет­ся в свя­зи с бур­ным раз­ви­ти­ем вычис­ли­тель­ной тех­ни­ки и успе­ха­ми искус­ствен­но­го интел­лек­та1.

Сегодня вни­ма­ние иссле­до­ва­те­лей сосре­до­то­че­но преж­де все­го на про­грамм­ных аспек­тах реше­ния широ­ко­го кру­га задач ана­ли­за тек­ста, воз­мож­но­стях раз­лич­ных алго­рит­мов машин­но­го обу­че­ния и архи­тек­тур ней­рон­ных сетей [Golbeck 2016; Hawkins et al. 2017; Qiu et al. 2017; Moreno et al. 2021]. При этом линг­ви­сти­че­ская про­бле­ма­ти­ка изу­че­ния рече­вой систем­но­сти, созда­ва­е­мой выбо­ром и исполь­зо­ва­ни­ем раз­но­уров­не­вых язы­ко­вых еди­ниц и детер­ми­ни­ру­е­мая «внеш­ни­ми» — пси­хо­ло­ги­че­ски­ми и соци­аль­ны­ми — фак­то­ра­ми, в ста­ти­сти­че­ском ана­ли­зе тек­ста ста­ла отхо­дить на вто­рой план. Объясняется это, по-видимому, как слож­но­стью меж­дис­ци­пли­нар­но­го вза­и­мо­дей­ствия спе­ци­а­ли­стов при раз­ра­бот­ке мето­дов про­грамм­но­го иссле­до­ва­ния, так и раз­де­ля­е­мым мно­ги­ми авто­ра­ми мне­ни­ем о том, что усто­яв­ши­е­ся пред­став­ле­ния о соста­ве пара­мет­ров ста­ти­сти­че­ско­го изу­че­ния речи доста­точ­ны для поис­ка новых реше­ний клас­си­фи­ка­ци­он­ной зада­чи в интел­лек­ту­аль­ном ана­ли­зе тек­ста. Состав таких пара­мет­ров, как и в преж­ние годы, охва­ты­ва­ет основ­ные грам­ма­ти­че­ские кате­го­рии язы­ка и его сло­варь, при этом боль­ше все­го вни­ма­ния уде­ля­ет­ся часто­те упо­треб­ле­ния слов, их рас­пре­де­ле­нию по частям речи, длине пред­ло­же­ния, а так­же биграм­мам и три­грам­мам сим­во­лов и слов, пунк­ту­а­ци­он­ным зна­кам [Куртукова и др. 2022]).

В то же вре­мя аль­тер­на­тив­ным стал под­ход, заклю­ча­ю­щий­ся в раз­ра­бот­ке средств искус­ствен­но­го интел­лек­та на базе не толь­ко мате­ма­ти­че­ской, но и линг­ви­сти­че­ской тео­рии. В каче­стве при­ло­же­ния мето­да реляционно-ситуационного ана­ли­за тек­ста [Осипов 2011] этот под­ход реа­ли­зо­ван в инстру­мен­те TITANIS [Smirnov et al. 2021]. Здесь состав пара­мет­ров ста­ти­сти­че­ско­го иссле­до­ва­ния тек­ста задан кон­цеп­ци­ей функ­ци­о­наль­но­го син­так­си­са рус­ско­го язы­ка. Важное досто­ин­ство ука­зан­но­го мето­да заклю­ча­ет­ся в том, что его объ­ек­том ста­ла струк­ту­ра пред­ло­же­ния, созда­ва­е­мая соче­та­ни­ем вза­и­мо­обу­слов­лен­ных син­так­сем. Введение в ана­лиз как фор­мы, так и семан­ти­ки пред­ло­же­ния может послу­жить пред­по­сыл­кой ком­пью­тер­но­го моде­ли­ро­ва­ния вопло­ще­ния в речи (т. е. в после­до­ва­тель­но­сти предложений-высказываний) внут­рен­них — мыс­ли­тель­ных и аффек­тив­ных — про­цес­сов. Поэтому акту­аль­ной пред­став­ля­ет­ся зада­ча про­грам­ми­ро­ва­ния и вклю­че­ния в инстру­мен­ты ана­ли­за тек­ста не толь­ко кон­сти­ту­ен­тов моде­лей пред­ло­же­ния, но и самих моде­лей, явля­ю­щих­ся отвле­чен­ны­ми образ­ца­ми созда­ния предложений.

Для реа­ли­за­ции это­го замыс­ла пред­став­ля­ют­ся цен­ны­ми суж­де­ния В. А. Белошапковой о соот­но­ше­нии двух основ­ных трак­то­вок моде­ли (или струк­тур­ной схе­мы) пред­ло­же­ния — как его пре­ди­ка­тив­но­го или же номи­на­тив­но­го мини­му­ма. По мне­нию ука­зан­но­го авто­ра, эти трак­тов­ки, при всем раз­ли­чии меж­ду ними, «допол­ня­ют друг дру­га, пред­став­ляя собой раз­ные уров­ни абстрак­ции: бóль­шую при ори­ен­та­ции на пре­ди­ка­тив­ный мини­мум и мень­шую при ори­ен­та­ции на номи­на­тив­ный мини­мум. Это поз­во­ля­ет гово­рить о двух типах струк­тур­ных схем пред­ло­же­ний — мини­маль­ных и рас­ши­рен­ных. Расширенные схе­мы пред­став­ля­ют собой мини­маль­ные схе­мы + не вхо­дя­щие в них кон­сти­ту­тив­ные, т. е. суще­ствен­ные для семан­ти­че­ской струк­ту­ры пред­ло­же­ния, ком­по­нен­ты. Таким обра­зом, меж­ду мини­маль­ны­ми и рас­ши­рен­ны­ми схе­ма­ми пред­ло­же­ний суще­ству­ют отно­ше­ния вклю­че­ния» [Белошапкова 1989: 636].

Грамматика совре­мен­но­го рус­ско­го язы­ка рас­по­ла­га­ет пол­ным систе­ма­ти­зи­ро­ван­ным опи­са­ни­ем мини­маль­ных струк­тур­ных схем пред­ло­же­ния, пред­став­лен­ных его пре­ди­ка­тив­ной осно­вой [Шведова 1980]. Между тем в иссле­до­ва­ни­ях, посвя­щен­ных рас­ши­рен­ным схе­мам, пока лишь рас­смат­ри­ва­ют­ся и иллю­стри­ру­ют­ся прин­ци­пы их выде­ле­ния. Полного закры­то­го спис­ка рас­ши­рен­ных струк­тур­ных схем эти рабо­ты не содер­жат. Поэтому в насто­я­щее вре­мя зада­ча про­грам­ми­ро­ва­ния моде­лей пред­ло­же­ния может ста­вить­ся толь­ко по отно­ше­нию к мини­маль­ным схе­мам и их регу­ляр­ным реа­ли­за­ци­ям. При этом в нуж­ных слу­ча­ях объ­ек­том про­грам­ми­ро­ва­ния могут быть и рас­ши­рен­ные моде­ли, а так­же рас­про­стра­ня­ю­щие их фор­мы слов [Кузнецова и др. 2022].

Ниже мы рас­смот­рим резуль­та­ты исполь­зо­ва­ния в пилот­ном иссле­до­ва­нии про­грамм­но­го сред­ства, содер­жа­ще­го ряд моде­лей пред­ло­же­ния, кото­рые, пред­по­ло­жи­тель­но, поз­во­ля­ют диф­фе­рен­ци­ро­вать кол­лек­ции выска­зы­ва­ний, состав­лен­ные на пси­хо­ло­ги­че­ском основании.

Описание методики исследования

Психологический аспект мето­ди­ки иссле­до­ва­ния сво­дил­ся к сбо­ру раз­ме­чен­ных кор­пу­сов тек­стов сете­вых дис­кус­сий. Разметка осу­ществ­ля­лась тре­мя пси­хо­ло­га­ми мето­дом сплош­ной выбор­ки: каж­дое выска­зы­ва­ние в дис­кус­сии каж­дым экс­пер­том отме­ча­лось как отно­ся­ще­е­ся к одно­му из трех аспек­тов атти­тю­да (аффек­тив­но­му, когни­тив­но­му или пове­ден­че­ско­му) или оце­ни­ва­лось как соб­ствен­но ком­му­ни­ка­тив­ное дей­ствие, т. е. выска­зы­ва­ние, не свя­зан­ное с пред­ме­том раз­го­во­ра и не экс­пли­ци­ру­ю­щее отно­ше­ние авто­ра к это­му пред­ме­ту. К пер­во­му типу выска­зы­ва­ний в соот­вет­ствии с типо­ло­ги­ей эмо­ци­о­наль­ных явле­ний С. Л. Рубинштейна отно­си­лись выска­зы­ва­ния, содер­жа­щие как соб­ствен­но эмо­ции авто­ра, так и опи­са­ние им сво­их чувств и сво­е­го отно­ше­ния к пред­ме­ту обсуж­де­ния. К когни­тив­ным выска­зы­ва­ни­ям отно­си­лись те, в кото­рых дава­лось опи­са­ние свойств кон­крет­но­го пред­ме­та, и те, в кото­рых автор обсуж­дал меж­пред­мет­ные свя­зи, свой­ства клас­са пред­ме­тов, осно­ва­ния клас­си­фи­ка­ции, давал опре­де­ле­ние. Содержащими пове­ден­че­ский ком­по­нент счи­та­лись выска­зы­ва­ния, в кото­рых автор опи­сы­вал кон­крет­ные собы­тия, про­изо­шед­шие с ними или кем-либо дру­гим, или пред­став­лял сце­на­рий пове­де­ния, реко­мен­ду­е­мую или вызы­ва­ю­щую опа­се­ния схе­му действия.

Мы раз­ме­ти­ли три дис­кус­сии, содер­жа­щие 3214 выска­зы­ва­ний. Как пра­ви­ло, выска­зы­ва­ние пред­став­ля­ло собой ком­мен­та­рий, но ино­гда один ком­мен­та­рий содер­жал два-три выска­зы­ва­ния. Далее в про­це­ду­ре ком­пью­тер­ной обра­бот­ки кор­пу­са выска­зы­ва­ний, раз­ме­чен­ных тре­мя экс­пер­та­ми, была оце­не­на согла­со­ван­ность раз­мет­ки. К линг­ви­сти­че­ско­му ана­ли­зу пред­ло­жи­ли те выска­зы­ва­ния неком­му­ни­ка­тив­но­го (пред­мет­но­го) типа, в отно­ше­нии кото­рых была полу­че­на сто­про­цент­ная согла­со­ван­ность. Таких выска­зы­ва­ний ока­за­лось 1360: 269 аффек­тив­ных, 859 когни­тив­ных, 232 поведенческих.

Лингвистический аспект. Применяются качественно-количественный и сопо­ста­ви­тель­ный мето­ды ана­ли­за мате­ри­а­ла. Качественный метод, состо­я­щий в ана­ли­зе струк­ту­ры и семан­ти­ки предложений-высказываний, направ­лен на обна­ру­же­ние соот­вет­ствия меж­ду зна­че­ни­ем моде­лей (струк­тур­ных схем) пред­ло­же­ния и содер­жа­ни­ем каж­до­го из трех ком­по­нен­тов атти­тю­да: 1) аффек­тив­но­го (эмо­ци­о­наль­ной оцен­кой объ­ек­та), 2) когни­тив­но­го (его свой­ства и свя­зи, познан­ные чело­ве­ком) и 3) пове­ден­че­ско­го (лич­ный или соци­аль­ный опыт пове­де­ния по отно­ше­нию к объекту).

Количественный ана­лиз заклю­ча­ет­ся в уста­нов­ле­нии чис­ла акту­а­ли­за­ций струк­тур­ных схем пред­ло­же­ния, соот­вет­ству­ю­щих по сво­ей семан­ти­ке содер­жа­нию какого-либо из ком­по­нен­тов атти­тю­да и выра­жа­ю­щих это содержание.

Сопоставительный ана­лиз состо­ит в срав­не­нии чис­ла акту­а­ли­за­ций каж­дой из рас­смат­ри­ва­е­мых струк­тур­ных схем в мате­ри­а­лах трех кол­лек­ций и в объ­яс­не­нии обна­ру­жи­ва­е­мых различий.

В целом мето­ди­ка иссле­до­ва­ния при­зва­на про­де­мон­стри­ро­вать резуль­та­тив­ность вклю­че­ния пара­мет­ра «струк­тур­ная схе­ма пред­ло­же­ния» в состав важ­ней­ших пере­мен­ных линг­во­ста­ти­сти­че­ско­го ана­ли­за тек­стов в рабо­тах по ком­пью­тер­но­му когни­тив­но­му моделированию.

Программный аспект. Метод для выяв­ле­ния моде­лей пред­ло­же­ний осно­вы­ва­ет­ся на мор­фо­ло­ги­че­ской раз­мет­ке инстру­мен­та MyStem2, рабо­та с кото­рым осу­ществ­ля­лась при помо­щи язы­ка про­грам­ми­ро­ва­ния Python 3. Данный ана­ли­за­тор поз­во­ля­ет пред­став­лять текст в виде после­до­ва­тель­но­сти токе­нов, каж­дый из кото­рых отра­жа­ет инфор­ма­цию о лем­ме и грам­ме­мах слов в тексте.

После полу­че­ния мор­фо­ло­ги­че­ской раз­мет­ки MyStem про­грамм­ный метод про­хо­дит в цик­ле через после­до­ва­тель­ность токе­нов и фик­си­ру­ет ряд буле­вых и коли­че­ствен­ных пара­мет­ров тек­ста, кото­рые могут ука­зы­вать на реа­ли­за­цию той или иной моде­ли пред­ло­же­ния. Примерами таких пара­мет­ров явля­ют­ся коли­че­ство суще­стви­тель­ных и место­име­ний в име­ни­тель­ном паде­же, нали­чие в тек­сте пол­ноз­на­ме­на­тель­ных гла­го­лов, вопро­си­тель­ных слов и вопро­си­тель­но­го зна­ка, инфи­ни­ти­вов, гла­го­лов в пове­ли­тель­ном накло­не­нии, суще­стви­тель­ных в роди­тель­ном и тво­ри­тель­ном паде­же, пол­ных при­ла­га­тель­ных, лемм «есть» и «нет» и др. После вычис­ле­ния пара­мет­ров тек­ста про­грамм­ный метод сопо­став­ля­ет эти пара­мет­ры с необ­хо­ди­мы­ми усло­ви­я­ми реа­ли­за­ции моде­лей. Например, модель Interr S опре­де­ля­ет­ся тогда, когда в тек­сте есть вопро­си­тель­ное сло­во и вопро­си­тель­ный знак, а модель N1–N1 может харак­те­ри­зо­вать­ся отсут­стви­ем зна­ме­на­тель­ных гла­го­лов и нали­чи­ем двух суще­стви­тель­ных в име­ни­тель­ном падеже.

Так как метод выяв­ле­ния моде­ли пред­ло­же­ния рабо­та­ет с про­сты­ми пред­ло­же­ни­я­ми, раз­ме­чен­ные фраг­мен­ты тек­стов были раз­би­ты на кла­у­зы с сохра­не­ни­ем ква­ли­фи­ка­ции атти­тю­да в исход­ных пред­ло­же­ни­ях. После при­ме­не­ния мето­да выяв­ле­ния моде­ли пред­ло­же­ния на мате­ри­а­ле кла­уз при помо­щи кри­те­рия согла­сия хи-квадрат про­во­ди­лось попар­ное срав­не­ние выбо­рок атти­тю­дов отдель­но для каж­дой из семи моделей.

Анализ материала

Лингвистический анализ материала

Та или иная модель пред­ло­же­ния регу­ляр­но исполь­зу­ет­ся при реа­ли­за­ции какого-либо ком­по­нен­та атти­тю­да тогда, когда ее семан­ти­ка соот­вет­ству­ет содер­жа­нию это­го ком­по­нен­та. Если же тако­го соот­вет­ствия нет, модель пред­ло­же­ния ока­зы­ва­ет­ся невос­тре­бо­ван­ной: она хотя и пред­став­ле­на в собран­ных кол­лек­ци­ях, но лишь немно­ги­ми выска­зы­ва­ни­я­ми. Одна и та же модель пред­ло­же­ния может регу­ляр­но исполь­зо­вать­ся при реа­ли­за­ции двух или даже трех ком­по­нен­тов атти­тю­да. Это про­ис­хо­дит в тех слу­ча­ях, когда содер­жа­нию раз­ных его ком­по­нен­тов соот­вет­ству­ют раз­ные зна­че­ния модели.

Обратимся к ана­ли­зу выска­зы­ва­ний каж­дой из трех коллекций.

В кол­лек­ции выска­зы­ва­ний, вопло­ща­ю­щих аффек­тив­ный ком­по­нент атти­тю­да, осо­бен­но актив­но исполь­зу­ют­ся две модели:

N1–N1 Автор моло­дец!; Джек Лондон — гений!; Ты кра­са­ва; Вы 65-летний не слу­жив­ший дед с бро­нью; Пост 100 % зака­зу­ха.

N1–Adj1полн. Очень силь­ная пес­ня и очень силь­ное испол­не­ние; Вербовка кле­вая в филь­ме; Юмор такой же боро­да­тый; Хоть кто-то гра­мот­ный; Все такие «умные».

Реализация обе­их моде­лей пред­ло­же­ния зако­но­мер­на. Структурная схе­ма N1–N1 в чис­ле сво­их семан­ти­че­ских вари­ан­тов име­ет и такой, кото­рый отве­ча­ет потреб­но­сти участ­ни­ков сете­во­го обще­ния в эмо­ци­о­наль­ных оцен­ках кого-чеголибо, а имен­но зна­че­ние «оцен­ка субъ­ек­та» [Шведова 1980: 281]. Оно реа­ли­зу­ет­ся, если ска­зу­е­мое выра­же­но суще­стви­тель­ным оце­ни­ва­ю­щей семан­ти­ки (гений, моло­дец, кра­са­ва и т. п.).

В свою оче­редь, ука­зан­ной потреб­но­сти соот­вет­ству­ет струк­тур­ная схе­ма N1–Adj1полн., имея зна­че­ние «отно­ше­ние меж­ду субъ­ек­том и его пре­ди­ка­тив­ным при­зна­ком — свой­ством или каче­ством» [Шведова 1980: 289].

Разумеется, в рече­вом вопло­ще­нии эмо­ци­о­наль­ных оце­нок при­ни­ма­ет уча­стие целый ком­плекс раз­но­уров­не­вых линг­ви­сти­че­ских средств, орга­ни­зу­е­мых фор­ма­ми пред­ло­же­ний и сверх­фра­зо­вых единств. В наших при­ме­рах это инвер­сия (очень силь­ная пес­ня), исполь­зо­ва­ние интен­си­фи­ка­то­ра (очень силь­ная), жар­гон­ные сло­ва, мета­фо­ры, ирония.

Перейдем к выска­зы­ва­ни­ям, в кото­рых доми­ни­ру­ет позна­ва­тель­ная (когни­тив­ная) уста­нов­ка.

Чаще все­го она реа­ли­зу­ет­ся исполь­зо­ва­ни­ем моде­ли N1–N1 — пре­иму­ще­ствен­но в зна­че­нии иден­ти­фи­ка­ции пред­ме­та речи с кем-/чем‑л. (в том чис­ле при отне­се­нии к извест­но­му, тол­ко­ва­нии, отри­ца­нии тож­де­ства) [Шведова 1980: 279–280]: Суббренд — это отдель­ный бренд; Применяемые в пище­вой про­мыш­лен­но­сти олив­ки — это пло­ды окуль­ту­рен­но­го вида мас­лич­но­го дере­ва; Подпись — это пись­мен­ное соб­ствен­но­руч­ное заве­ре­ние доку­мен­та; День про­ры­ва и день сня­тия [бло­ка­ды] — раз­ные празд­ни­ки; Это декла­ра­ция, а не сер­ти­фи­кат.

Вполне оче­вид­но, что модель N1–Adj1полн., отоб­ра­жа­ю­щая свой­ства или каче­ства пред­ме­та речи, тоже ори­ен­ти­ро­ва­на на выра­же­ние резуль­та­тов позна­ва­тель­но­го про­цес­са: Оливки зеле­ные, мас­ли­ны чер­ные же; Внешне они абсо­лют­но иден­тич­ные; У Гондора мест­ность более леси­стая, куль­ту­ра более урба­ни­зи­ро­ван­ная; Материалы креп­кие; Состав… отнюдь не полный.

Показательно и исполь­зо­ва­ние струк­тур­ной схе­мы вопро­си­тель­но­го пред­ло­же­ния с место­имен­ным вопро­си­тель­ным сло­вом — Interr S. Ее акту­а­ли­за­ции явля­ют­ся запро­сом све­де­ний о раз­лич­ных свой­ствах и отно­ше­ни­ях объ­ек­та. Именно поэто­му она регу­ляр­но фик­си­ру­ет­ся в кол­лек­ции выска­зы­ва­ний, реа­ли­зу­ю­щих когни­тив­ный ком­по­нент атти­тю­да: Так что такое фик­тив­ное повы­ше­ние цен? Из чего ты дела­ешь этот вывод? Какой пра­вя­щий класс в стране? В какой обла­сти он док­тор? Как назы­ва­ет­ся дан­ный доку­мент? В чем слож­ность печа­тать кор­пу­са из пластика?

Нужно учи­ты­вать, что при позна­нии чело­ве­ком объ­ек­та в нем обна­ру­жи­ва­ют­ся раз­ные по сво­е­му типу свой­ства и отно­ше­ния: бытий­ные, причинно-следственные, пар­ти­тив­ные (клас­си­фи­ка­ци­он­ные, части и цело­го), посес­сив­ные (при­над­леж­но­сти), ста­ту­аль­ные (состо­я­ния, изме­не­ния состо­я­ния), функ­ци­о­наль­ные и др. Из чис­ла моде­лей пред­ло­же­ния, выра­жа­ю­щих эти свой­ства, выбе­рем две со зна­че­ни­ем бытийности:

Есть N1 (регу­ляр­ная реа­ли­за­ция струк­тур­ной схе­мы N1–Vf). У меня есть интер­нет; Есть такая фиp­ма, как Pridе; Уже есть защи­та соб­ствен­но­сти в суде, есть сво­бо­да пере­ме­ще­ния; Есть доку­мен­таль­ные под­твер­жде­ния; В каж­дом круп­ном горо­де есть какие-то памят­ни­ки, колон­ны и прочее; 

Нет N2. У меня нет юри­ди­че­ско­го обра­зо­ва­ния; Нет у это­го доку­мен­та назва­ния; Нет ника­ких прин­ци­пи­аль­ных огра­ни­че­ний; Но у них нет про­из­вод­ства на тер­ри­то­рии РФ; Аналогов за эту цену про­сто нет.

Ориентированность этих моде­лей на реа­ли­за­цию позна­ва­тель­ной уста­нов­ки опре­де­ля­ет их регу­ляр­ную реа­ли­за­цию в рас­смат­ри­ва­е­мой кол­лек­ции высказываний.

Поведенческий ком­по­нент атти­тю­да регу­ляр­но реа­ли­зу­ют моде­ли, име­ю­щие импе­ра­тив­ную семан­ти­ку (в наших мате­ри­а­лах семан­ти­ку сове­та, реко­мен­да­ции). Используя их, субъ­ект речи хочет повли­ять на пове­де­ние собеседника.

Это определенно-личные пред­ло­же­ния с глав­ным чле­ном, выра­жен­ным пове­ли­тель­ным накло­не­ни­ем гла­го­ла, — регу­ляр­ная реа­ли­за­ция струк­тур­ной схе­мы N1–Vf. Обозначим эти пред­ло­же­ния сим­во­ла­ми Imp (Ну не ходи тогда;Воспользуйся логи­кой и Гуглом; Продавай их по 1500; Ну так най­ди ему год­ные само­дел­ки и при­шли; Только не дове­ряй­те обзо­рам на юту­бе). И Praed Inf (Нужно поку­пать с внеш­ни­ми под­клю­ча­те­ля­ми к розет­ке; Без про­блем вер­нуть мож­но; Не сто­ит наго­нять пани­ки; Нужно читать дого­вор еще вни­ма­тель­нее; При сомне­ни­ях нуж­но сове­то­вать­ся со спе­ци­а­ли­ста­ми).

Кроме про­стых неослож­нен­ных пред­ло­же­ний импе­ра­тив­ной семан­ти­ки, регу­ляр­но исполь­зу­е­мым син­так­си­че­ским сред­ством опи­са­ния пове­де­ния субъ­ек­та явля­ют­ся про­стые пред­ло­же­ния с одно­род­ны­ми ска­зу­е­мы­ми и слож­ные пред­ло­же­ния, отра­жа­ю­щие после­до­ва­тель­ность дей­ствий и собы­тий: …сна­ча­ла запол­ня­ешь дого­вор, потом опла­чи­ва­ешь, а уже затем [идешь] к вра­чу; …отправ­ля­ешь дого­вор на озна­ком­ле­ние, а тебе через две мину­ты при­ле­та­ет подпись.

Важно отме­тить, что семан­ти­че­ские вари­ан­ты моде­лей пред­ло­же­ния часто име­ют струк­тур­ные осо­бен­но­сти. Например, в моде­ли N1–N1 «выбор свя­зок и свя­зоч­ных обра­зо­ва­ний… опре­де­ля­ет­ся семан­ти­че­ской струк­ту­рой пред­ло­же­ния» [Шведова 1980: 284]. В наших мате­ри­а­лах эта модель при реа­ли­за­ции аффек­тив­но­го ком­по­нен­та атти­тю­да обыч­но исполь­зу­ет­ся с нуле­вой связ­кой (Автор моло­дец!), а когни­тив­но­го — в боль­шин­стве слу­ча­ев со связ­кой это (Суббренд — это отдель­ный бренд). У дру­гих моде­лей обна­ру­жи­ва­ют­ся свои структурно-семантические варианты.

Статистический анализ материала

Сравнительный ана­лиз (попар­ное срав­не­ние по кри­те­рию хи-квадрат) пред­став­лен­но­сти моде­лей пред­ло­же­ния в выска­зы­ва­ни­ях, авто­ма­ти­че­ски отне­сен­ных про­грамм­ны­ми сред­ства­ми к одно­му из аспек­тов атти­тю­да, пока­зал сле­ду­ю­щее (табл. 1, 2):

— выска­зы­ва­ния пове­ден­че­ско­го типа отли­ча­ют­ся более частым исполь­зо­ва­ни­ем моде­лей 6 и 7 (Imp, Praed Inf) и более ред­ким исполь­зо­ва­ни­ем моде­лей 1, 2 и 3 (N1–N1, Interr S, N1—Adj1полн.);

— выска­зы­ва­ния аффек­тив­но­го типа отли­ча­ют­ся частым исполь­зо­ва­ни­ем моде­ли 2 (Adj1полн.) — по срав­не­нию с выска­зы­ва­ни­я­ми как пове­ден­че­ско­го типа, так и когни­тив­но­го, а так­же с ред­ким исполь­зо­ва­ни­ем (точ­нее, отсут­стви­ем в кор­пу­се при­ме­ров исполь­зо­ва­ния) моде­ли 5 (Есть N1);

— для выска­зы­ва­ний когни­тив­но­го типа в изу­чен­ном кор­пу­се не най­де­но спе­ци­фи­че­ских моде­лей пред­ло­же­ний, кото­рые исполь­зо­ва­лись бы зна­чи­мо чаще или реже, чем в выска­зы­ва­ни­ях аффек­тив­но­го и когни­тив­но­го типа: отно­си­тель­но более частое исполь­зо­ва­ние моде­ли 5 (Есть N1) все же не поз­во­ля­ет отли­чить когни­тив­ный тип выска­зы­ва­ния от пове­ден­че­ско­го, а моде­ли 4 (Нет N2) — от выска­зы­ва­ний как пове­ден­че­ско­го, так и аффек­тив­но­го типа.

 

Таблица 1. Представленность в под­кор­пу­сах выска­зы­ва­ний, содер­жа­щих рас­смат­ри­ва­е­мые моде­ли предложений

Модель пред­ло­же­нияПодкорпус аффек­тив­ных выска­зы­ва­ний (%)Подкорпус когни­тив­ных выска­зы­ва­ний (%)Подкорпус пове­ден­че­ских высказываний (%)Общее чис­ло кла­уз с дан­ной моделью 
1. N1-ADJ1полн.28 (6,91)83 (4,01)21 (2,16)149
2. N1-N140 (9,88)270 (13,04)63 (6,49)430
3. Interr S17 (4,2)83 (4,01)13 (1,34)132
4. Есть N1037 (1,79)8 (0,82)49
5. Нет N21 (0,25)28 (1,35)4 (0,41)38
6. Imp14 (3,46)47 (2,27)66 (6,8)151
7. Praed Inf7 (1,73)57 (2,75)43 (4,43)133
Клаузы без моде­лей 1–7298 (73,58)1466 (70,79)752 (77,53)2957
Число кла­уз в подкорпусе40520719704039

 

Таблица 2. Статистическая зна­чи­мость раз­ли­чий в пред­став­лен­но­сти моде­лей в подкорпусах

МодельАттитюд1Аттитюд2рр*
N1-ADJ1полн.АффективныйПоведенческий0,00003***
N1-ADJ1полн.КогнитивныйПоведенческий0,01245**
N1-ADJ1полн.АффективныйКогнитивный0,01416**
N1-N1КогнитивныйПоведенческий0,00000***
N1-N1АффективныйПоведенческий0,03949*
N1-N1АффективныйКогнитивный0,09380 
Interr SКогнитивныйПоведенческий0,00014***
Interr SАффективныйПоведенческий0,00191***
Interr SАффективныйКогнитивный0,96853 
Есть N1АффективныйКогнитивный0,01291**
Есть N1КогнитивныйПоведенческий0,05925 
Есть N1АффективныйПоведенческий0,14873 
Нет N2КогнитивныйПоведенческий0,02955*
Нет N2АффективныйКогнитивный0,10142 
Нет N2АффективныйПоведенческий1,00000 
ImpКогнитивныйПоведенческий0,00000***
ImpАффективныйПоведенческий0,02198*
ImpАффективныйКогнитивный0,21701 
Praed InfКогнитивныйПоведенческий0,02071*
Praed InfАффективныйПоведенческий0,02236*
Praed InfАффективныйКогнитивный0,30944 

 

Результаты исследования

Лингвистический (каче­ствен­ный) ана­лиз раз­ме­чен­ных вруч­ную пси­хо­ло­га­ми кол­лек­ций выска­зы­ва­ний в сете­вых дис­кус­си­ях пока­зал, что эти кол­лек­ции могут быть надеж­но диф­фе­рен­ци­ро­ва­ны по семан­ти­че­ским вари­ан­там мно­го­знач­ных струк­тур­ных схем. Статистический (коли­че­ствен­ный) ана­лиз кол­лек­ций, авто­ма­ти­че­ски раз­ме­чен­ных создан­ны­ми про­грамм­ны­ми сред­ства­ми, поз­во­лил диф­фе­рен­ци­ро­вать кол­лек­ции пове­ден­че­ско­го и аффек­тив­но­го типа, но не решил эту зада­чу для выска­зы­ва­ний когни­тив­но­го типа. Поскольку на этом эта­пе рабо­ты про­грамм­ные сред­ства учи­ты­ва­ют толь­ко мак­си­маль­но отвле­чен­ную семан­ти­ку моде­ли пред­ло­же­ния, оче­вид­но, что даль­ней­шее совер­шен­ство­ва­ние мето­ди­ки иссле­до­ва­ния пред­по­ла­га­ет вклю­че­ние в авто­ма­ти­че­ский ана­лиз структурно-семантических вари­ан­тов мно­го­знач­ных моде­лей предложения.

Необходимо учи­ты­вать так­же осо­бен­но­сти исполь­зо­ван­но­го мате­ри­а­ла. Вопервых, семь рас­смот­рен­ных моде­лей пред­став­ле­ны толь­ко в 27 % кла­уз, выде­лен­ных авто­ма­ти­че­ски. Во-вторых, кол­лек­ция выска­зы­ва­ний когни­тив­но­го типа ока­за­лась в изу­чен­ных сете­вых дис­кус­си­ях впя­те­ро боль­ше кол­лек­ции выска­зы­ва­ний аффек­тив­но­го типа и вдвое боль­ше кол­лек­ции выска­зы­ва­ний пове­ден­че­ско­го типа. Соответственно, мож­но ожи­дать, что при уве­ли­че­нии чис­ла раз­ме­чен­ных сете­вых дис­кус­сий и при уве­ли­че­нии чис­ла моде­лей, рас­по­зна­ва­е­мых авто­ма­ти­че­ски спе­ци­аль­но создан­ны­ми про­грамм­ны­ми сред­ства­ми, харак­те­ри­сти­ка выска­зы­ва­ний аффек­тив­но­го типа уточ­нит­ся, а для выска­зы­ва­ний когни­тив­но­го типа будут най­де­ны спе­ци­фи­ци­ру­ю­щие их моде­ли предложений.

В заклю­че­ние хоте­лось бы отме­тить мето­до­ло­ги­че­скую осо­бен­ность линг­ви­сти­че­ских иссле­до­ва­ний, про­во­ди­мых в инте­ре­сах пси­хо­ди­а­гно­сти­ки. В тако­го рода зада­чах тек­сто­вый «порт­рет» выска­зы­ва­ний состав­ля­ет­ся линг­ви­стом для пси­хо­ло­ги­че­ско­го поня­тия, нашед­ше­го свою реа­ли­за­цию в тек­сте. Это зна­чит, что опи­са­нию под­ле­жит не сама реаль­ность, а ее науч­ная модель. Доступ к этой моде­ли линг­вист полу­ча­ет из дефи­ни­ции, пред­ла­га­е­мой пси­хо­ло­ги­ей, и из раз­ме­чен­но­го пси­хо­ло­га­ми кор­пу­са. Можно ска­зать, что в меж­дис­ци­пли­нар­ных иссле­до­ва­ни­ях по ана­ли­зу тек­стов сете­вых обсуж­де­ний линг­вист иссле­ду­ет инту­и­тив­ные реше­ния эксперта-психодиагноста, а спе­ци­а­лист по искус­ствен­но­му интел­лек­ту моде­ли­ру­ет неосо­зна­ва­е­мые «рас­суж­де­ния» пси­хо­ло­га, выно­ся­ще­го на осно­ве доступ­ных ему тек­стов суж­де­ние о свой­ствах их авто­ров (отдель­ных людей или групп). Как пока­за­ло пило­таж­ное иссле­до­ва­ние, поня­тие атти­тю­да и пред­став­ле­ние о его аспек­тах может быть успеш­но опе­ра­ци­о­на­ли­зи­ро­ва­но как грам­ма­ти­че­ский «про­филь» тек­стов сете­вых обсуж­де­ний, где в каче­стве пока­за­те­лей высту­па­ют моде­ли предложений.

Выводы

Для линг­во­ста­ти­сти­ки боль­шое зна­че­ние име­ет выбор пара­мет­ров ана­ли­за речи. Представляется важ­ным вве­сти в их состав моде­ли (струк­тур­ные схе­мы) пред­ло­же­ния, явля­ю­ще­го­ся основ­ной еди­ни­цей выра­же­ния мыс­ли. Поскольку ака­де­ми­че­ские грам­ма­ти­ки рус­ско­го язы­ка содер­жат пол­ный и закры­тый спи­сок струк­тур­ных схем пред­ло­же­ния как его пре­ди­ка­тив­но­го мини­му­ма, счи­та­ем целе­со­об­раз­ным их про­грам­ми­ро­ва­ние и исполь­зо­ва­ние в инстру­мен­тах авто­ма­ти­че­ско­го ана­ли­за тек­ста. От мини­маль­ных струк­тур­ных схем в необ­хо­ди­мых слу­ча­ях воз­мо­жен пере­ход к рас­ши­рен­ным струк­тур­ным схе­мам (к номи­на­тив­но­му мини­му­му пред­ло­же­ния) и пра­ви­лам их распространения.

Включенность меха­низ­мов син­так­си­са в рече­вое мыш­ле­ние и важ­ная роль моде­лей пред­ло­же­ния в пере­хо­де от внут­рен­ней речи к внеш­ней явля­ют­ся осно­ва­ни­ем для пред­по­ло­же­ния о том, что ста­ти­сти­че­ский ана­лиз реа­ли­за­ции син­так­си­че­ских моде­лей в текстах может стать эффек­тив­ным сред­ством сете­вой пси­хо­ди­а­гно­сти­ки. Поставлена зада­ча авто­ма­ти­че­ско­го раз­ли­че­ния трех кол­лек­ций, состав­лен­ных из выска­зы­ва­ний, вопло­ща­ю­щих эмо­ци­о­наль­ное, позна­ва­тель­ное или пове­ден­че­ское отно­ше­ние к объ­ек­ту (один из этих ком­по­нен­тов аттитюда).

В пило­таж­ном иссле­до­ва­нии выбра­ны семь моде­лей пред­ло­же­ния, семан­ти­ка кото­рых соот­вет­ству­ет содер­жа­нию какого-либо из ука­зан­ных ком­по­нен­тов. Качественный ана­лиз мате­ри­а­ла пока­зал, что мно­го­знач­ные моде­ли реа­ли­зу­ют в раз­ных кол­лек­ци­ях раз­лич­ные семан­ти­че­ские вари­ан­ты — имен­но те, кото­рые сов­па­да­ют с содер­жа­ни­ем атти­тю­да. Количественный ана­лиз, ори­ен­ти­ро­ван­ный на дан­ном эта­пе рабо­ты толь­ко на наи­бо­лее отвле­чен­ное зна­че­ние син­так­си­че­ской моде­ли (без уче­та ее семан­ти­че­ско­го варьи­ро­ва­ния), поз­во­лил диф­фе­рен­ци­ро­вать кол­лек­ции пове­ден­че­ско­го и аффек­тив­но­го типа, но не решил эту зада­чу для кол­лек­ции выска­зы­ва­ний, вопло­ща­ю­щих когни­тив­ный ком­по­нент. Дополнение коли­че­ствен­но­го ана­ли­за мате­ри­а­ла каче­ствен­ным обес­пе­чи­ло интер­пре­ти­ру­е­мость полу­чен­ных ста­ти­сти­че­ских дан­ных. Совершенствование оха­рак­те­ри­зо­ван­ной мето­ди­ки пред­по­ла­га­ет вклю­че­ние в иссле­до­ва­ние фор­маль­ных при­зна­ков, обна­ру­жи­ва­е­мых у реа­ли­за­ций семан­ти­че­ских вари­ан­тов син­так­си­че­ской модели.

Впоследствии раз­лич­ные меди­а­тек­сты смо­гут быть пред­став­ле­ны как содер­жа­щие выска­зы­ва­ния, реа­ли­зу­ю­щие пре­иму­ще­ствен­но одни моде­ли пред­ло­же­ний и не реа­ли­зу­ю­щие дру­гие, а сами тек­сты в этом слу­чае мож­но будет рас­смат­ри­вать как про­яв­ля­ю­щие аффек­тив­ное, когни­тив­ное или пове­ден­че­ское отно­ше­ние кол­лек­тив­но­го субъ­ек­та к обсуж­да­е­мым соци­аль­ным объ­ек­там. Появление тако­го инстру­мен­та авто­ма­ти­че­ско­го социально-психологического ана­ли­за меди­а­тек­стов поз­во­лит про­во­дить иссле­до­ва­ние отно­ше­ния поль­зо­ва­те­лей соц­се­тей и ком­мен­та­то­ров элек­трон­ных СМИ к соци­аль­но зна­чи­мым объ­ек­там и событиям.

1 Журнал «Информационные тех­но­ло­гии и вычис­ли­тель­ные систе­мы». Электронный ресурс http://​www​.jitcs​.ru/; Журнал «Искусственный интел­лект и при­ня­тие реше­ний». Электронный ресурс https://​www​.aidt​.ru/​r​u​/​s​c​o​p​e​/​s​u​b​j​e​cts; Журнал «Труды Институт систем­но­го ана­ли­за РАН». Электронный ресурс http://​www​.isa​.ru/​p​r​o​c​e​e​d​i​n​gs/.

2 МyStem. Электронный ресурс https://​yandex​.ru/​d​e​v​/​m​y​s​t​em/.

Статья посту­пи­ла в редак­цию 19 сен­тяб­ря 2023 г.;
реко­мен­до­ва­на к печа­ти 7 апре­ля 2024 г.

© Санкт-Петербургский госу­дар­ствен­ный уни­вер­си­тет, 2024

Received: September 19, 2023
Accepted: April 7, 2024