Разработка методов анализа сценариев поведения (на материале инструктивных интернет-текстов)

by В. А. Мишланов (Пермь, Россия), А. А. Чуганская, И. В. Смирнов, М. И. Суворова (Москва, Россия), И. А. Курузов (Долгопрудный, Россия)

Аннотация

Abstract

Об авторах

About the authors

Для цитирования

For citation

Индекс

Аннотация

Abstract

Об авторах

About the authors

Для цитирования

For citation

Индекс

Работа выполнена при частичной поддержке РФФИ (гранты № 17–07-00651 «Разработка моделей и методов конструирования сценариев поведения на основе анализа текстов» и № 18–29-22027 «Персональные когнитивные ассистенты, сопровождающие деятельность человека в информационном пространстве»)

Постановка проблемы

Развитие средств массовой коммуникации в современном информационном обществе обусловило весьма значительные изменения в психологических и лингвистических механизмах общения [Баранов 2001]. Степень этих изменений в новой коммуникативной среде достигает значительных масштабов, позволяющих говорить о формировании новых моделей речевого взаимодействия. Для выявления сущности происходящих изменений в различных сферах коммуникации стоит обратиться к анализу сценариев речевого поведения человека в определенных ситуациях.

Представляя в словесной форме сценарий поведения, человек опирается на приобретенный им коммуникативный опыт — знание принятых в социуме стереотипов речевого взаимодействия [Кузнецова 2019]. Анализ сценариев дает ценный материал для решения значимой психологической и лингвистической задачи объективации знания в сфере социальных отношений [Кузнецова 2018]. В частности, сценарные тексты позволяют получить представления о принятых нормах речевого поведения в различных ситуациях социального взаимодействия [Кузнецова и др. 2019a]. В исследовательском плане особо значимыми, на наш взгляд, являются обобщенные сценарии, представленные в «виртуальном» общении: они дают богатый материал для проведения исследований в интересах различных когнитивных дисциплин [Кузнецова, Чудова 2008].

Целью статьи является описание особенностей анализа инструктивных текстов (на примере текстов, связанных с ситуацией покупки автомобиля) [Смирнов и др. 2018], направленного на построение модели «сценарного» речевого поведения и создание оптимальных методов извлечения сценариев и их компонентов из текстового материала.

История вопроса

В когнитивных науках сценарий, наряду с понятиями фрейма, ситуативной модели и другими [Волосухина 2010], рассматривается в качестве научного конструкта, с помощью которого можно осуществить моделирование ментальных состояний субъекта [Демьянков 1994].

Одним из наиболее известных направлений в исследовании сценарных моделей поведения является фреймовый подход, опирающийся на предложенное М. Минским понятие «фрей» [Минский 1979] как структуры данных, предназначенной для описания стереотипной ситуации.

Наряду с фреймами, содержащими декларативные (дескриптивные) знания, было предложено понятие сценария, хранящего знания о динамических явлениях, которые поэтому могут быть представлены как ряд сменяющих друг друга состояний.

Ч. Филмор рассматривает сценарий как фиксированную в языке когнитивную структуру, которая включает варианты привычных межличностных интеракций, реализуемых согласно нормам той или иной культуры, а также институциональных структур, аккумулирующих опыт профессионального взаимодействия (см. [Кузнецова 2018]). Р. Шенк и Р. Абельсон в сходном значении используют термин «скрипт», понимая под ним предопределенную последовательность стереотипных действий, характерных для общеизвестной ситуации (см. [Полатовская 2013]).

В качестве особого типа выделяются коммуникативные сценарии, или сценарии речевого поведения. По определению В. И. Шляхова, они представляют собой статико-динамические структуры, включающие несколько речевых действий, которые связаны между собой иерархическими отношениями. Автор подчеркивает конвенциональную ценность коммуникативных сценариев: «Социум выработал правила и схемы речевого поведения и ожидает от индивида определенных действий в определенных обстоятельствах» [Шляхов 2007: 26].

Отметим в этой связи, что лингвистика в союзе когнитивных наук приобретает все возрастающую роль не только потому, что она представляется «филиалом когнитивной психологии» и использует «арсенал переработки языковой информации для построения моделей, имитирующих внешние проявления человеческого поведения при решении интеллектуальных задач» [Демьянков 1994: 18], но и в силу того особого обстоятельства, которое в человеческой деятельности занимает речевая коммуникация. В сущности, текст как воплощение (объективация) деятельности, реализуемой в дискурсе, пока едва ли не единственный источник сценарного моделирования поведения, поэтому оптимальным материалом для исследования сценарного поведения становятся не просто тексты на естественном языке, а такие речевые произведения, которые по своей иллокутивной природе и являются самой деятельностью (тексты политико-административной, педагогической, массмедийной, рекламной и тому подобной деятельности).

Неслучайно сценарный подход привлек большое внимание в рамках нарративного направления коммуникативистики и гуманитарного знания в целом (Э. Эббот, Л. Гриффин и др.) [Брокмейер, Харре 2000]. Методологической особенностью этого направления стало стремление исследовать социальные феномены как представленные в тексте (нарративе) последовательности событий [Abbot 1992], которые только так, в текстовом воплощении, отражающем точку зрения рассказчика, и могут стать предметом научного осмысления [Брокмейер, Харре 2000]. Из этого следует, что к «текстоцентрическим» наукам относится не только филология, для которой «исходной реальностью» является «текст во всей совокупности своих внутренних аспектов и внешних связей» [Аверинцев 1979: 372], но и все другие гуманитарные дисциплины.

В нарративном направлении стоит выделить подход Х. Олкера, который предложил использовать для аналитического описания международных событий инструментарий, ведущий свое происхождение от работ отечественного филолога В. Я. Проппа [Чуганская 2019]. Исследуя тексты русских волшебных сказок, В. Я. Пропп выделяет устойчивую структуру: определенный круг основных действующих лиц и определенное множество (более 30) их основных функций [Пропп 1998]. По мнению Х. Олкера, аналогичный каркас обнаруживается в структуре сценария тех или иных событий общественной жизни [Олкер 1987: 33].

В лингвистических работах когнитивистского направления понятие «сценарий» включает такие признаки содержания текста, как типизированность, наличие определенного набора участников описываемого действия, динамичность, связанность с тем или иным видом социальной практики [Кузнецова и др. 2019б]. Важной характеристикой является также иерархичность структуры сценария, в которой компоненты верхнего уровня отражают устойчивые признаки, обязательные с точки зрения содержания сценария, а элементы низших уровней наполняются в зависимости от конкретной ситуации [Кузнецова 2018].

Будучи регулятором коммуникативного поведения, сценарий реализуется в конкретной проблемной ситуации, разрешение которой требует формирования некоего плана действий для адаптации имеющихся сценариев к конкретной ситуации [Кузнецова и др. 2019б]. В отличие от сценария, план связан с конкретной ситуацией. При формировании плана существенно важным оказывается влияние картины мира субъекта, частью которой является сценарий [Осипов и др. 2017].

Связь сценариев с естественным языком определяет такое их качество, как культуроспецифичность. Используемые языковыми коллективами в разных ситуациях общения коммуникативные стратегии, по мнению А. Вежбицкой, представляют собой речевое выражение скрытой (неписаной) системы культурных правил, или культурных сценариев, отражающих этнические установки и нормы поведения [Вежбицкая 1999].

В настоящей работе предпринята попытка использования сценарного подхода к анализу инструктивных текстов, содержание и коммуникативный смысл (интенции) которых в наибольшей степени отвечают базовому понятию сценария. Такие тексты содержат, как правило, прямые наименования основных действий, состояний, признаков ситуации, в которой инструктируемый (коллективный адресат) мыслится автором текста как исполнитель определенной роли. Коммуникативная цель текста-инструкции заключается в том, чтобы донести до адресата содержание тех стандартов действий, соблюдение которых признается социумом существенно важным для успешного осуществления различных жизненных практик. Четкие и недвусмысленные формулировки, наличие эксплицитной мотивирующей составляющей, усиливающей побудительную модальность текста, важны с точки зрения минимизации поведенческой вариативности, что в итоге обеспечивает деятельность, необходимую для поддержания социума. Человек, не имеющий доступа к инструктивным текстам, может испытывать сложности в регламентированных ситуациях, в которых владеющий сценариями обычно решает задачи автоматически [Кузнецова и др. 2019a].

Представляется целесообразным использовать сценарный подход при изучении потребительского поведения (например, покупки автомобиля). В основе подхода лежит лингвистический (интенциональный, лексико-семантический и грамматический) анализ инструктивных текстов, который может быть осуществлен в трех аспектах:

функциональном (коммуникативном), предусматривающем выявление коммуникативной интенции, предметной цели, композиции текстовых фрагментов;
структурном, состоящем в выделении действующих лиц и операндов: предметов-целей и предметов-условий;
процессуальном, имеющем целью описание «шагов» и «развилок», или точек выбора (анализ в этом аспекте может быть проведен с ориентацией на идеи В. Я. Проппа и Х. Олкера [Чуганская 2019]).

Описание методики исследования

В качестве материала анализа используются извлеченные из Интернета инструкции по покупке автомобиля. Корпус насчитывает 100 уникальных текстов (объемом 147 445 слов), содержащих поэтапное описание процесса приобретения автомобиля. Тексты были размечены вручную тремя экспертами, результаты разметки использовались при создании общей модели сценария.

В контексте задач автоматического анализа текстов (в нашем случае идентификации фрагментов инструктивных текстов как определенных шагов сценария) особое значение приобретает метод реляционно-ситуационного анализа [Смирнов и др. 2018], основной задачей которого является «выявление значений синтаксем и семантических связей между ними» [Осипов и др. 2008: 5]. В основу метода положен анализ глаголов и других предикатных слов, определяющих сочетаемость с синтаксемами и структуру предложения в целом. Такой анализ важен и в аспекте изучения строения деятельности, в частности он позволяет адекватно определить целевой компонент того или иного действия в сценарии.

В решении задачи автоматического построения сценария можно выделить два этапа: анализ структуры инструктивного текста в означенных выше трех аспектах и синтез сценария на основе полученной сценарной информации. В нашей работе рассматривается первый этап, предполагающий сегментацию текста на фрагменты, каждый из которых посвящен достижению какой-либо одной цели (анализ структурного аспекта). Внутри каждого фрагмента автоматический анализ выявляет фрагменты, описывающие условия, в которых дана цель, их вариации и операции, отвечающие обсуждаемым в тексте условиям (анализ процессуального аспекта). Фрагменты, содержащие коммуникативные цели автора инструктивного текста, при ручной разметке были отделены от основного корпуса, в котором содержатся фрагменты, описывающие цели инструктируемого читателя (в нашем случае — потенциального покупателя автомобиля), так что на данном этапе исследования для функционального анализа методы автоматического извлечения сценарной информации не разрабатывались. В рамках психологической структуры сценарного поведения каждый шаг сценария, представленный выделяемым фрагментом текста, может быть определен как отдельное действие в составе деятельности по покупке автомобиля. Таким образом, метод автоматического анализа структурного и процессуального аспектов инструктивного текста представляет собой автоматизированную процедуру выделения единиц деятельности — действий и операционального состава деятельности [Леонтьев 1974].

Рассмотрим подробнее общую модель сценария, принятую в исследовании. Обобщенная структура данных, предложенная авторами статьи, представлена на рисунке. В основу ее лег метод представления знаний из области искусственного интеллекта, основывающийся на понятии фрейма [Минский 1979]. Данный фреймсценарий представляет собой вложенную структуру, где каждый шаг является отдельным фреймом.

На основе анализа инструктивных текстов были выделены три вида сценариев:

Простое действие, представляющее собой один конкретный сценарий, который необходимо выполнить (например, поиск объявлений о продаже подержанных авто или выбор функционала автомобиля).
Ветвления, или множество сценариев, включающих альтернативные шаги, необязательно в определенной последовательности. Примерами ветвлений являются сценарии, предусматривающие покупку иномарки или отечественной машины, в кредит или за наличные средства, нового или подержанного автомобиля.
Цепочка шагов, или множество сценариев, которые необходимо выполнить в строго заданной последовательности (выбор конкретной модели, осмотр автомобиля в салоне, оформление покупки). Этот вид сценария допускает возвращение на предыдущие шаги (если при осмотре автомобиля выявились серьезные недостатки, можно выбрать новый вариант).

К другим компонентам фрейма относятся активные участники сценария (покупатель, продавец, страховой агент, представитель ГИБДД) и операнды: автомобиль, его внешние свойства (лакокрасочное покрытие, кузов и др.), договор купли-продажи, а также цель, т. е. желаемая ситуация, которая будет достигнута после выполнения действий сценария (описывается хранящимися в рабочей памяти «фактами о мире»), и условия, в которых событие происходит.

Для начала выполнения любого сценария необходимо осуществить определенные предусловия (также в рабочей памяти представленные фактами о мире): принять решения (купить новый автомобиль), найти необходимую информацию, оценить ресурсы (покупатель имеет информацию о марках автомобиля, официальных представителях фирмы, располагает средствами и временем на покупку автомобиля и др.).

Первым этапом обработки текстов инструкций, как уже было сказано, является сегментация, в результате которой исходный текст разделяются на фрагменты, соответствующие отдельным шагам сценария.

Сегментацию можно разделить условно на четыре стадии. На первой осуществляется разбиение текста на цельные смысловые единицы, под которыми понимаются предложения и списки, т. е. однородные компоненты предложения, выделенные в тексте таким образом, что каждый из них находится на отдельной строке.

Вторая стадия состоит в том, чтобы среди смысловых единиц выделить элемент «рекомендуемое действие» — центры будущих сегментов, к которым мы относим предикативные основы высказываний: глаголы или глагольные сочетания, выражающие (лексическим значением и формой) тот или иной вид побудительной модальности — совет, рекомендацию, призыв и т. п. Такими центрами являются, например, словоформы 2 л. мн. ч. повелительного наклонения глаголов (определитесь, сделайте), модальные наречия или безличные глаголы с инфинитивом (можно сделать, нужно выбрать, следует оформить и т. п.) и др.

Несмотря на то что смысловые центры сегментов (предикаты побудительной модальности) содержат важнейшую информацию о сценарном действии, использовать для создания сценария только эти данные недостаточно. Это связано с тем, что, как показали эксперименты, при рассмотрении множества таких центров без учета контекста соответствующие им векторные представления оказываются слабо разделимыми, при этом снижается качество классификации сегментов.

На третьей стадии каждому элементу, полученному при разбиении текста, необходимо поставить в соответствие некоторое векторное представление. В рамках исследования сценариев в инструктивных текстах каждому слову мы ставили в соответствие вектор, используя готовые модели word2vec из RusVectores [Kutuzov, Kuzmenko 2017], а вектор для элемента текста находили как среднее арифметическое векторов для слов, входящих в этот элемент, кроме стоп-слов. Подобное векторное представление позволяет представить большинство элементов как достаточно короткие тексты. Как было показано в более ранних исследованиях [Mikolov et al. 2013], данный методический прием оправдан.

Поставив в соответствие каждому элементу текста вектор, мы можем в дальнейших рассуждениях отождествлять понятия «элемент текста» и «вектор». Все элементы перед первым центром мы относим к первому центру, все элементы после последнего — к последнему. Остальные элементы находятся между двумя центрами, и для всех пар соседних центров мы находим разбиение предложений между ними на два непересекающихся множества: контекст первого центра и контекст второго центра. Естественно предположить, что элементы различных контекстов не должны чередоваться. Поэтому мы ставим дополнительное условие: разбиение должно быть таким, что все элементы второго множества в тексте находятся после первого множества.

Формализуем задачу нахождения этого разбиения. Пусть расстояние от контекста до центра — это сумма расстояний от предложений контекста до центра. Тогда найдем разбиение, минимизирующее расстояние между соответствующими центрами и контекстами. Эта задача решается путем перебора всевозможных разбиений за линейное время от количества предложений между центрами. В качестве расстояния от предложения до центра мы использовали евклидово расстояние между соответствующими векторными представлениями.

Последней, четвертой, стадией сегментации является объединение фрагментов, которые составляют один и тот же шаг в рамках сценария. Мы получаем векторные представления для сегментов аналогично векторным представлениям для элементов, которые описаны выше. Для каждой пары соседних сегментов было посчитано расстояние между ними и объединены в группу соседствующих сегментов, если расстояние между парами соседних сегментов в этой группе было меньше порога, устанавливаемого экспериментально.

В качестве расстояния мы использовали взвешенную линейную комбинацию из WMdistance и сигмоида от суммы длин сегментов, где WMdistance — Word Mover’s Distance, один из множества вариантов измерения семантической близости между двумя текстами [Kusner et al. 2015], а сигмоид понимается как монотонно возрастающая ограниченная функция. Использование WMdistance обусловлено тем, что для сегментов, которые являются относительно большими текстами, он показал лучшие результаты, чем остальные метрики. Мы предполагаем также, что короткие сегменты, скорее всего, не представляют сами по себе большой ценности, поэтому мы используем сигмоид, который поощряет объединение коротких и штрафует объединение длинных сегментов, причем штраф практически не различается для длинных и сверхдлинных текстов.

Полученные сегменты используются для формирования нового сценария или улучшения уже существующего. Во втором случае имеется уже схема шагов, а для каждого шага — некоторая коллекция соответствующих сегментов, и может быть поставлена задача интерпретировать шаги как классы, по которым необходимо распределить наши объекты (это стандартная задача классификации и возможности ее решения будут обсуждены ниже).

Результаты

Перейдем к анализу результатов решения сформулированных выше задач — выделения сегментов, воплощающих определенный шаг сценария, их классификации.

При автоматическом анализе сценариев в инструктивных текстах важно учитывать, в какой мере может быть формализовано разграничение соседних шагов одного текста-сценария и насколько достижимо отождествление фрагментов разных текстов как представляющих один и тот же шаг сценария.

Мы предположили, что множество шагов в векторном пространстве имеет довольно простую структуру, а именно: каждый шаг имеет свой центр (вектор), и разбиение Вороного [Aurenhammer 1991], построенное на этих центрах, задает корректное разделение векторного пространства на шаги.

С целью проверки этого предположения проведен следующий эксперимент: вручную выбранные и размеченные сегменты были отображены в векторное пространство, для каждого шага оценен соответствующий центр как среднее арифметическое векторов для выбранных сегментов, для каждого сегмента определен шаг по ближайшему центру и проведено сравнение полученной разметки с исходной.

На основе анализа инструктивных текстов было выделено 12 шагов, для каждого из которых найдено от трех до девяти текстовых сегментов:

1. Ваши деньги.
2. Цены.
3. Объявления.
4. Телефонный разговор.
5. Документы на машину.
6. Мониторинг сайтов.
7. ДКП.
8. Осмотр.
9. Тест-драйв.
10. Марка и модель машины.
11. Диагностика.
12. Год выпуска.

В наших экспериментах для оценки качества каждого класса мы использовали F‑меру с параметром 0.5, т. е. среднее геометрическое полноты (Recall) и его чистоты (Presicion) полученного класса, давая последней больший вес [Hastie, Tibshirani, Friedman 2009]. Для суммарной оценки качества мы использовали усредненную F‑меру.

При анализе вручную выделенных сегментов из инструктивных текстов были получены неплохие, на наш взгляд, результаты:

среднее значение F‑меры — 89.6,
минимальное значение F‑меры: — 68.2.

Следует, однако, заметить, что некоторые шаги (например, четвертый) распознаются хуже. Это связано с тем, что такие шаги имеют существенное пересечение, так как включают однотипную лексику.

Исследование показало также, что если при автоматическом выделении шагов сценария инструктивных текстов центры оцениваются не на всем множестве размеченных текстов, а только на части, то качество классификации на оставшейся выборке сколько-нибудь существенно не снижается (так, если мы отложим треть данных как тестовую, значение F‑меры падает лишь до 80 %).

Добавим, что полученные в ходе эксперимента результаты позволяют считать обоснованным предположение о том, что структура выявляемых в тексте шагов сценария не отличается сложностью. В рамках исследования на вручную выделенных сегментах мы показали, что выделенные экспертами части текста можно классифицировать вполне качественно, имея разметку даже для небольшого количества сегментов.

Одной из целей эксперимента была оценка возможностей решения задачи классификации автоматически выделенных объектов. Сегменты, полученные программой, были промаркированы, в результате чего была получена выборка, включающая 490 фрагментов. В этой выборке отсутствует пятый шаг (мониторинг сайтов), поскольку для него нашлось только два сегмента. Выборка оказалась не вполне сбалансированной, в частности седьмой шаг (осмотр) составляет почти половину выборки (225 сегментов).

Обсудим методы решения задачи автоматической классификации сегментов, начав с рассмотрения «наивного» классификатора, основанного на оценке центров. Наивная классификация предполагает применение той же модели, которая была использована в предыдущем разделе. Каждому сегменту ставится в соответствие вектор как среднее арифметическое векторов предложений, которые, в свою очередь, есть среднее арифметическое векторов слов. По размеченным данным мы получаем центр каждого класса как среднее арифметическое соответствующих векторов из обучающей выборки. Для новых объектов класс определяется по ближайшему вектору.

Далее рассмотрим логистическую регрессию [Hastie, Tibshirani, Friedman 2009] с l2-регуляризацией, которая показала один из наилучших результатов среди различных методов. Параметр регуляризации подбирался с учетом кросс-валидации по пяти блокам.

Для измерения качества использовалась вышеописанная F‑мера. Качество наивной классификации определялось на кросс-валидации по пяти блокам. Для логистической регрессии качество модели измерялось на тестовой выборке, составляющей 15 % от исходной. Были получены следующие результаты среднего значения F‑меры:

наивный классификатор: 52 %;
логистическая регрессия: 59 %.

Наивная классификация, строящая разбиение Вороного на основе оценки центра, дает результат лучше, чем вышеописанный константный классификатор. Это говорит о том, что структура шагов, рассмотренная для выделенных человеком сегментов, имеет место и для шагов, построенных на программно выделенных сегментах. Отметим, что логистическая регрессия заметно повышает качество на большинстве шагов (в среднем на 7 %).

Выводы

Нами предложена конкретная структура фрейма, которая схематически описывает сценарий. Одним из достоинств данной структуры является ее универсальность. Практическая значимость такой структуры данных состоит в операционализируемости, т. е. в возможности быть использованной при анализе сценарного поведения субъекта, в том числе для автоматического извлечения сценария из текстов на естественном языке с использованием технологий искусственного интеллекта.

Кроме того, была предложена методика автоматического решения задачи сегментации инструктивного текста, позволяющая выделить шаги сценария, которые отражают основные параметры действия как подчиненного определенной цели, и классификации полученных сегментов. Исследование показало, что предложенная схема сегментации достаточно эффективна, позволяет получать фрагменты, содержащие необходимую и достаточную информацию об одном шаге сценария. Проведенные эксперименты показали, что множество шагов имеют в векторном представлении довольно простую структуру, и продемонстрировали приемлемое качество классификации полученных сегментов.

ЛИТЕРАТУРА

REFERENCES