Как увидеть, что говорят люди

Е. Клещенко
(«ХиЖ», 2014, №11)

Тем, кто жалуется на тотальную глупость интернет-пользователей, интересующихся только смешными картинками и котиками: нет правил без исключений. Кандидат биологических наук Георгий Юрьевич Любарский много лет ведет блог в Живом Журнале (ivanov-petrov.livejournal.com). Смешные картинки там бывают, однако главная особенность этого блога — тексты, по нынешним меркам не короткие и далеко не всегда простые. Проблемы современной теории эволюции, история науки, образование, общество, литература; тысячи читателей, сотни комментариев. Не помню, чтобы этот блогер беспокоился о рейтинге, бонусах и прочих важных для «тысячника» вещах, — он просто рассказывает интересное, а слушатели собираются сами.

Два года назад в блоге Г.Ю.Любарского появилась статья о разработанном им методе исследования общественного мнения — когнитометрии. На сайте polit.ru был опубликован результат его применения (что говорят блогеры о вере, религии и церкви и, не менее важное, — какие темы почему-то НЕ обсуждаются в связи с этими понятиями, хотя теоретически должны бы; http://www.polit.ru/article/2012/07/10/cognitometry_church1/). Некоторые другие результаты мы покажем в этой статье.


Устная письменная речь


С тем, как Интернет изменил жизнь человечества, еще долго предстоит разбираться. Это доступ к полезной и бесполезной информации, возможности для общения — то и другое в изобилии, которое сперва восхищает, потом пугает и подавляет, а затем вызывает адаптацию и/или зависимость со всеми характерными симптомами. Это шанс услышать и быть услышанным, достигнуть числа Данбара, а то и выйти за его пределы. (Робин Данбар, профессор эволюционной антропологии из Оксфорда, установил, что предельное количество устойчивых социальных связей, которое может поддерживать индивид, примерно равняется 150. Существенно превысить этот предел, по-видимому, нельзя, однако у большинства людей в реале и 150 постоянных собеседников не набирается...) Общение происходит в новом формате, еще лет двадцать назад невозможном и невообразимом. Лучше самого Г.Ю.Любарского тут, пожалуй, не скажешь. (Здесь и далее цитаты курсивом из его статьи, посвященной данному методу.)

«Разговор в Интернете — это очень специфическая культурная реалия (при том, что чрезвычайно распространенная). Это новая и неустоявшаяся граница между приватностью и публичностью. Это разговор двоих или троих на ярко освещенной сцене перед совершенно темным зрительским залом — а в зале может никого не быть, а может быть несколько тысяч человек, которые внимательно слушают каждую реплику и следят за поведением говорящих. Это внепространственность — говорить могут люди из ЮАР, Москвы и Канберры — в одном разговоре. Это чрезвычайная разнесенность во времени. Иногда разговор заканчивается, а через пять лет приходит человек, обращается с вопросами к говорившим — и ему отвечают, разговор продолжается с паузой в пять лет. Это разговор на новом виде, новом формате языка — "устная письменная" речь, использующая как устные обороты, так и очень изощренные литературные конструкции. Это разговор, подкрепленный огромным количеством глубоких примеров — даваемых ссылками, которые требуют многих часов для своего изучения».

Выделим тут удобные условия общения. В Интернете меньше вероятность, что кто-то будет не услышан из-за тихого голоса или медленного подбора аргументов, что договорить будет некогда (некогда сегодня — продолжим завтра), что сказанное в начале забудется к концу разговора (все записано). При этом люди, как и в офлайне, стремятся высказать свою точку зрения, обсудить ее с другими, по возможности доказать свою правоту или — значительно реже, но все-таки бывает — признать неправоту. И добавим «неустоявшуюся границу между приватностью и публичностью», что проявляется в том числе как «эффект палатки»: собеседники не всегда помнят, что их беседу в уютном виртуальном пространстве личного блога может услышать кто угодно «снаружи», если хозяин не озаботился сделать свою публикацию закрытой.

Из всего этого следует, что разговоры в Интернете — сокровище для социологов, вероятно, также и для других исследователей человека и общества. Почти домашний уровень откровенности; отсутствие вопросов интервьюера (а вопрос плох тем, что так или иначе подсказывает ответ); сниженное, хотя и не исчезающее полностью, стремление высказываться «как принято», соответствовать чьим-то ожиданиям; условия самовыражения, максимально комфортные для каждого; практически не ограниченный круг обсуждаемых тем... И огромное, сказочное изобилие этого нового материала. Словом, просто праздник. Как у ботаников в XVII—XVIII веках, когда человек мог отправиться в Ост-Индию или на Антильские острова по совершенно другому поводу, между делом собрать и привезти в Европу сотни доселе невиданных образцов и навсегда остаться в истории науки.

Но изобилие материала — оно же и недостаток. Тысячи, миллионы людей в эту самую минуту говорят о чем хотят и где хотят — на форумах, в личных блогах, в комментариях к статьям электронных СМИ. Как найти нужные нам разговоры — это еще полбеды, есть технические средства, но как анализировать сотни и тысячи сетевых разговоров, возникающих спонтанно и ведущихся в свободной форме? Может, не так уж наивны те, кто думают, что их никто не слышит. Лист прячут в лесу, камень на морском берегу, а голос — в шуме голосов.

На самом деле ничего невозможного в этом нет. Анализ неупорядоченных данных — задача, которую постоянно приходится решать и естественным, и гуманитарным наукам. Метод, предложенный Георгием Любарским, позволяет составить на основе сетевых разговоров картину общественного мнения по тому или иному вопросу. Автор метода назвал его когнитометрией, а результаты исследований, посвященных конкретным темам, — «когнитивными схемами» (когнитивный»— имеющий отношение к разуму, мышлению), «картами концептов», «картами общественного мнения». (Не путать с когнитивными картами Эдварда Толмена, см. статью о Нобелевской премии по физиологии или медицине в этом же номере. Здесь речь идет не о нейронных сетях, а о связях между понятиями.) Короче говоря, на выходе получается объективный, представленный в сжатой форме ответ на вопрос: «Что говорят люди о?..»

Удивительно или нет, но разнообразие людских мнений не так уж безгранично и в значительной мере сводится к повторению того же самого другими словами. Конечно, существуют люди, которые мыслят не как все, имеют мнения, отличные от общественного. Как отмечает автор метода, они оказываются вне поля зрения когнитометрии по объективной причине: носителям необычных мнений труднее выразить свои мысли, быть понятыми и вступить в диалог, поэтому, исследуя разговоры, их редко можно встретить. Однако это действительно единицы, в прямом смысле слова. Если носители определенного мнения встретились в количестве, достаточном для беседы, — тем самым они становятся видимыми, по крайней мере в большой выборке.


Порядок действий


Чтобы запустить поиск, надо, как известно, задать ключевые слова, а чтобы сделать это — нужна предварительная гипотеза о том, что говорят люди. Не только о темах, но и о том, какие слова они могут употреблять, какие прилагательные подбирают к существительным и какими глаголами обозначают взаимодействия между ними. Можно использовать и другие возможности поиска — например, задать временные рамки, ведь бывает интересно узнать, что говорили люди до некоего события и после него, два года назад или прямо сейчас.

Во многих случаях было бы полезно на этом этапе привлекать экспертов, которые определят точнее, что и как будем искать, подскажут, «как люди это называют», — от точных словарных терминов до бытовых. И после того, как мы проведем поиск, необходимо, увы, вручную отфильтровать цитаты. Скажем, если нас интересует мнение людей о «перестройке» как периоде российской истории, придется отсеять разговоры об архитектуре и ремонте квартиры. Или возьмем любимый пример «Химии и жизни» — бытовое употребление слова «химия» в таких значениях, как «загрязнение окружающей среды» и «вредные пищевые добавки». Если мы захотим узнать, что говорят люди об экологической ситуации в мегаполисе, слово «химия» обязательно надо включить в поиск, но не как название науки о веществе.

Естественно, данный этап очень важен. Метод, как говорит Г.Ю.Любарский, следует отнести к «интеллектоемким», машина его не выполнит за нас. Но это нормально для научного исследования — хочешь получить умный ответ, спрашивай умно. И ЯМР-спектроскопия, и секвенирование ДНК требуют от пользователя солидных базовых знаний об изучаемых объектах, и всегда приветствуется наличие разумной гипотезы, которую можно подтверждать либо опровергать. К счастью, в когнитометрии число попыток практически не ограничено (разве что временем, которым располагает исследователь), и если первоначальная гипотеза явно не приводит к успеху, ее можно скорректировать.

Для сбора материала автор метода использовал поиск Яндекса по блогам (http://blogs.yandex.ru) — для русскоязычной блогосферы трудно предложить что-то лучшее. Машина ищет в разных социальных сетях, на форумах и в прочих «диалоговых ресурсах». Естественно, в эпоху всеобщего освоения функций «копировать» и «вставить» надо быть готовым к тому, что искомые слова окажутся внутри цитаты из книги или фрагмента журналистской статьи, которую один блогер показывает другому. Но это едва ли можно считать недостатком метода: ведь люди приводят цитаты в подтверждение своего мнения. И если поиск даст различные картины в зависимости от того, будут ли использованы книжные или разговорные синонимы одного и того же понятия, — это тоже интересно.

Итак, поисковый робот подобрал для нас ссылки на множество разговоров. Мы убрали явное не то, рекламу и прочий мусор, где нужно — раскрыли гиперссылки. (Еще одна особенность интернет-бесед: вместо обычного ответа на вопрос собеседника может стоять ссылка на реплику в другом разговоре, документ на сайте и т. п.; это не всегда считается дружественным поведением, но иногда бывает необходимо.) Выберем интересующие нас фрагменты разговоров — как правило, именно те, которые содержат наши ключевые слова, и получим подборку высказываний блогеров. Уже и это, как правило, достаточно любопытное чтение. Автор этих строк делала аналогичные подборки — например, о том, что говорят люди о ГМО сразу после очередного закона или высказывания официального лица на данную тему. Даже если не стремиться к созданию полной картины, результаты бывают поучительными.

Но для когнитометрии это только предварительный этап. Теперь нужно вычленить в «устной письменной речи» структурные элементы — объекты обсуждения, их свойства и функции: «что», «какое оно», «что оно делает». Естественно, с учетом того, что говорить об одном и том же можно различными способами. И снова это работа, которую нельзя передоверить машине: «в некотором разговоре слово "ж*па" может быть полным синонимом выражения "дела со здравоохранением в области обстоят неважно"». Структура, которую ищет исследователь, во многом определяется предварительной гипотезой и задачами: например, мы можем искать все возможные определения некоего понятия, его синонимы или эпитеты.

Более сложный вариант — проследить, как, согласно утверждениям собеседников, одно влияет на другое, какие отмечаются причинно-следственные связи; какие встречаются противопоставления, устойчивые ассоциации, что в связи с чем вспоминают. Можно узнать, что из вышеперечисленного стереотипно — встречается часто, говорится на автомате, а что, напротив, оригинально. Мысли респондента (возможно, не все им высказанные, а только интересующие нас в данный момент; живой разговор редко бывает строго сосредоточен на одной теме) теперь можно представить в виде скелета, элементов и связей между ними, и затем фрагменты таких схем, проявившиеся в отдельных разговорах, объединить в общую сеть.

Метод новый, подобного до него не существовало (было бы удивительно, если бы существовал, ведь раньше не было и блогосферы). Однако подходы, позволяющие сводить безграничное разнообразие к постижимой схеме, применялись в других областях; один из примеров — классификация мифов по используемым в них сюжетам, разработанная Ю.Е.Березкиным (см. «Химию и жизнь», 2006, № 3).

И вот наконец получается некая обобщенная структура разговоров на интересующую нас тему, представленная графически, — необозримый материал становится обозримым. Посмотрим на примеры таких структур.


Результаты


Изумительно выглядит карта концепта «демократия». Все разговоры о демократии в Рунете, все «движения смыслов» идут от положительно оцениваемых понятий и явлений, связанных с демократией, к «плохим», негативным — и в конце концов к диктатуре. Начните рассуждать о демократии, и через некоторое время темой разговора станет диктатура. Это не шутка, не парадокс, а объективный результат исследования, проведенного по только что описанной методике (рис. 1).


s20141151 lubarsky1.jpg
1. Ловушка диктатуры в семантической сети концепта «демократия».


Карта концепта «неравенство, обсуждаемого в связи с событиями 90-х годов (рис. 2), не так эффектна, но тоже довольно интересна.


s20141151 lubarsky2.jpg
Концепт «неравенство» по разговорам в блогах в связи с событиями в России 90-х годов.


Не все респонденты судят одинаково о причинах и следствиях того или иного явления, о вреде или пользе от него. Поэтому на картах концептов к одному и тому же узлу могут идти несколько стрелок (одни считают причиной экономического кризиса общемировые процессы или законы экономики, другие — действия конкретных правительств или даже отдельных личностей) или же две стрелки могут расходиться из одного узла (по мнению одних, технический прогресс уничтожает неравенство, по мнению других — усугубляет его, как мы видим на рис. 2). Это нормально: противоречия — часть картины мира, важная характеристика общественного мнения.

Конечно, противоречия могут быть разными. По какому-то вопросу можно проследить два противоборствующих мнения, причем представители каждого знакомы с позицией оппонентов и активно занимаются ее опровержением, тем самым включая оппонента в свою картину мира. А в каких-то случаях получается путаная карта, богатая развилками противоречий, взаимоисключающими утверждениями (которые могут встречаться даже у одного и того же респондента). Такой результат означает, что устойчивого мнения по данному вопросу в обществе нет.

А вот по концепту «либералы» оно есть или, во всяком случае, было в начале 2000-х, когда проводилось исследование. (Сейчас картина может оказаться иной — ландшафт мнений изменчив, как все живое.) На рис. 3 представлена карта концепта «либералы», полученная при анализе разговоров о событиях 90-х годов. Респонденты на редкость единодушны, давая резко отрицательную оценку либералам, при этом словарное значение слова «либерализм» не обсуждается вообще.


s20141151 lubarsky3.jpg
Концепт "либералы"


Отметим, что метод когнитивных карт не позволяет «доказать все, что угодно». Несмотря на кажущуюся свободу, которую он предоставляет исследователю, — из совокупности текстов нельзя извлечь то, чего в ней нет, или проигнорировать то, что в ней есть. (Конечно, если не жульничать, подделывая результаты.) Бывали случаи, когда когнитивная карта оказывалась совсем не похожей на стартовую гипотезу — люди говорили не так, как предполагал исследователь. И конечно, результаты поддаются проверке.

Методы работы с высказываниями можно описать достаточно четко, чтобы исследование повторил другой человек, показав воспроизводимость результата. Для этого полезно сохранять сырые данные — исходную совокупность текстов, предоставленную поисковиком, чтобы можно было к ним вернуться и перепроверить результаты. Возможно, какие-то высказывания были неверно поняты и соответственно неправильно представлены (в среде общения, где «дадада» не означает согласие, этого никогда нельзя исключать). Другой способ проверки, опять-таки общепринятый в науке, — увеличить выборку, например, с 2000—3000 ссылок до 10 000 ссылок. По опыту автора, если какого-то мнения нет в выборке на десяти тысячах, то, скорее всего, его не появится и на тридцатитысячной выборке. Другое дело, что 10 000 — это очень большой объем работы.


Как это можно использовать?


«После того как получен результат, сформулирована карта концептов, из нее можно сделать ряд рекомендаций для других методов исследования - например, для массовых опросов или глубинных интервью. Скажем, анализ блогосферы показывает, что многие люди полагают, будто перестройка не закончилась еще и в 90-х годах и говорят даже о 2000-х как о времени перестройки. Этого факта можно не знать, но можно его проверить, устроив массовый опрос и убедившись, что около 20% респондентов полагают, будто перестройка все еще продолжается». (Такой опрос проводил фонд «Общественное мнение», http://soc.fom.ru/Proshloe/10704 в рамках проекта «Историческая память. Кстати, при подготовке этого проекта использовались когнитивные карты.)

Использовать метод построения когнитивных карт как предварительную стадию при подготовке массовых опросов, глубинных интервью и т. п., вероятно, было бы полезно. Традиционные социологические методы требуют серьезной подготовки и стоят дорого. Если перед выбором вопросов у исследователей будет возможность посмотреть на когнитивную карту по данной теме, такая «пристрелка» позволила бы подобрать более точные вопросы и при тех же затратах значительно улучшила бы результат.

Традиционные методы опросов респондентов и когнитометрия, в сущности, прекрасно дополняют друг друга. О людях, чьи разговоры в Интернете мы видим, мы, как правило, не знаем ничего, кроме того, что они написали вот эти слова. Для некоторых можно найти их биографические данные, но для многих по очевидным причинам этого сделать не удастся. А значит, к тем сведениям, которые социолог легко получает при анкетировании (возраст, профессия, уровень дохода и т. п.), у когнитометрии доступа нет. Схемы не показывают и количественного соотношения различных утверждений, ходов мысли — здесь нет привычных нам по соцопросам подсчетов «за», «против», «скорее за», «скорее против» и «затрудняюсь ответить» с точностью до долей процента. (То есть можно подсчитать, сколько каких высказываний встретилось, но трудно сказать, чему соответствует этот результат в несетевой жизни, — к примеру, большему числу сторонников некоторого мнения или более активному обсуждению.)

Однако преимущества когнитометрии, которые рассматривались в начале статьи — невысокая стоимость исследования, ширина охвата и «незаметность» для исследуемых и др., — делают ее полноправным партнером традиционных методов. Когнитивные карты нельзя использовать для численных прогнозов типа «кто победит на выборах», но они хорошо предсказывают качественный расклад мнений. Более того, карты показывают логику, которая порождает мнения, — каким путем люди от имеющихся у них фактов приходят к выводам, зачастую неожиданным.

Разные разности
Иммунитет и грязный воздух
Без всякой науки мы понимаем, что воздух должен быть чистым и свежим. Но где взять такой воздух в городах, особенно в крупных, в той же самой Москве, например?
Парадокс золотых самородков
Недавно австралийские ученые решили повнимательнее присмотреться к кварцу, в котором зарождаются золотые слитки. Какие у него есть необычные свойства? Одно такое свойство мы знаем — способность под давлением порождать пьезоэлектричество. Так, мо...
Пишут, что...
…за четыре года, прошедших с момента возвращения «Чанъэ-5» на Землю, ученые проанализировали доставленный лунный грунт и нашли в нем минерал (NH4)MgCl3·6H2O, который содержит более 40% воды… …у людей с успешным фенотипом старения, то есть у до...
Лучшее дерево для города
Немецкие ученые обследовали 5600 городских деревьев и их взаимодействие с окружающей средой. На основе этих данных исследователи создали интерактивную программу «Городское дерево». Она учитывает местоположение, состояние почвы и освещенность в&n...