Валерий Соловьёв: «На темпы языковых изменений влияют исторические события»

05.12.2014

Текст: Галина Хасанова

В популярном научном интернет-издании INSIDE SCIENCE NEWS SERVICE опубликован материал “Massive Study Shows How Languages Change”, посвящённый исследованию, выполненному в Лаборатории квантитативной лингвистики Института филологии и межкультурной коммуникации Казанского федерального университета (КФУ).

О многолетней работе лингвистов, проводивших компьютерный анализ больших массивов данных (около 500 миллиардов слов), и об изменении языка рассказал один из авторов статьи, профессор, главный научный сотрудник научно-образовательного центра по лингвистике им. И. А. Бодуэна де Куртенэ Института филологии и межкультурной коммуникации КФУ Валерий Соловьев.

— Валерий Дмитриевич, кто вошёл в ваш творческий коллектив?

— Авторами напечатанной в британском Journal of The Royal Society Interface статьи “Universals versus historical contingencies in lexical evolution” стали учёные из нескольких стран и университетов. Иностранным автором исследования выступил Сорен Вихман, датчанин, работающий в Институте эволюционной антропологии общества Макса Планка в Германии. Россию представили два учёных Казанского университета — физик Владимир Бочкарёв и я. Хочу отметить, чтоисследование проводилось в Казанской лингвистической лаборатории.

— Почему именно в Казанской лингвистической лаборатории? Чем обоснован этот выбор?

— В Казанском университете исследования на стыке лингвистики и компьютерных технологий начались почти полвека назад. Особенно интенсифицировались они после создания в 2005 году (совместно сИнститутом языкознания РАН, Институтом русского языка РАН и Научно-исследовательским вычислительным центром МГУ) научно-образовательного центра по лингвистике им. И. А. Бодуэна де Куртенэ. Практически сразу же наш научно-образовательный центр стал победителем конкурса грантов Минобрнауки РФ среди НОЦ по лингвистике, а затем выиграл ещё и два гранта министерства. В рамках этих проектов проводились исследования по компьютерной и квантитативной лингвистике. Так что у нас накоплен большой опыт в этой области.

— Лёгшее в основу статьи исследование посвящено изучению общих закономерностей эволюции лексики языков в последние два столетия. На какой массив данных вы опирались?

— Для исследования была выбрана Google Books Ngram Viewer.

— Насколько мне известно, в сумме во всех отсканированных книгах Google Books Ngram содержится более 500 миллиардов слов, в том числе 50 миллиардов на русском языке. Не скрою, меня смутили цифры, указанные в статье. Откуда взялось такое гигантское количество слов?

— Да, действительно, Google проделал гигантскую работу, переведя в цифровую форму 8 миллионов, то есть более 6% всех изданных в мире книг между 1500 и 2008 годами (хотя они и столкнулись при этом с проблемой авторского права). И этот корпус продолжает пополняться, а значит, количество слов – увеличиваться. К тому же в нашей работе разные словоформы оценивались как разные слова.

— Видимо, это и стало причиной того, что авторы статьи посчитали, что «выучить русский сложнее английского».

— Журналист в этой статье не совсем точно определил «сложность» русского языка по нашему исследованию. Русский язык совсем не прост для изучения: в нём сложные правила склонений, спряжений со всеми исключениями, множественные морфемы, позволяющие образовывать новые слова. Однако подтверждение «сложности» при изучении какого-либо языка мы совершенно не ставили ни целью, ни задачей нашего исследования.

— Как проводилось исследование?

— Мы отталкивались от общего набора слов и словоформ, уделяя внимание данным за последние 180 лет. Серьёзно осложняли исследование реформы орфографии, проведённые за это время в русском и немецком языках, поэтому полученные результаты следует принимать с определёнными оговорками. Однако мы пришли к выводу об относительной стабильности скорости изменений лексики на больших промежутках времени.

— Анализировали только письменные языки?

— Конечно. В нашей статье акцент сделан на шести основных европейских языках – английском, итальянском, немецком, русском, французском, испанском.

— О чём говорят изменения словарного состава языка?

— Самое очевидное: изменения словарного состава говорят об изменении окружающего нас мира. Далее во многих случаях язык заимствует слово из другого языка, даже если обозначающее то же самое понятие слово в языке уже есть. Чаще всего (хотя и не всегда) заимствуемое слово короче уже существующего в языке. Это является проявлением стремления языка к экономии, к обеспечению возможности сказать больше за единицу времени. Например, слова 'стараться' и 'пытаться' за последние 200 лет практически не изменили свою семантику и по-прежнему остаются синонимами. Однако если 200 лет назад слово 'стараться' употреблялось в 100 раз чаще, чем 'пытаться', то в последние годы уже 'пытаться' употребляется несколько чаще. Это оказалось связано с глубокими перестройками когнитивных структур, которые не так-то просто объяснить. Специальная статья именно по этому вопросу выйдет в конце года в когнитивном сборнике в издательстве «Языки русской культуры» (Москва).

— А есть ли примеры, когда слово, которое раньше было специальным, может приобрести более широкое значение и заменить собой другое слово, имевшее ранее более широкий смысл?

— Раньше слово 'мусор' имело очень специальное значение. Согласно словарю Даля это 'остатки от каменной кладки и печной работы; мелкие остатки каменного угля'. Для бытовых отходов употреблялось слово 'сор'.

Теперь 'мусор' относится к любым мелким отбросам и стало значительно более частотным, чем 'сор'.

Кроме подобного рода закономерностей общего характера, корпус Google Books Ngram позволяет обнаруживать интересные тенденции в развитии отдельных слов. Например, в последнее время слово divorce (развод) используется чаще, чем marry (брак, женитьба), а слово information (информация) чаще, чем wisdom (мудрость). Есть о чём задуматься.

— Что влияет на изменение словарного состава языка?

— На темпы языковых изменений влияют исторические события. Например, в викторианскую эпоху, характеризующуюся стабильностью, английский язык менялся медленно. Во время войн и социальных революций темпы языковой эволюции резко ускоряются.

— И какова средняя скорость изменения слов в языке?

— Отвечу на этот вопрос, напомнив, что такое глоттохронология. Это раздел исторической лингвистики, который позволяет определить возраст языков. Хорошо, если на каком-то языке сохранились древние и надёжно датированные книги, по которым можно оценить и возраст языка. А если книг не сохранилось или язык вообще не имеет письменности, что тогда делать? Оказывается, сопоставляя число общих слов в родственных языках, можно достаточно точно подсчитать, когда они разошлись от общего предка.

И подсчитать это стало возможным благодаря сделанному американским учёным Моррисом Сводешом наблюдению, что ядро языков меняется с постоянной скоростью. Тут уместно провести аналогию с радиоуглеродным методом датировки археологических находок, основанном на постоянстве скорости радиоактивного распада атомов. Эта идея как раз и привела Сводеша к открытию глоттохронологии.

Сводеш изучал ядро лексики — 100 или 200 наиболее стабильных слов. Он показал, что за 1000 лет в любом языке меняется приблизительно 14% слов ядра. Это, по сути, единственная на сегодняшний день надёжно установленная количественная оценка скорости изменения слов.

— Какие у вас дальнейшие планы?

— В своем исследовании мы сделали только первый шаг. Надеемся, что к нам присоединятся наши коллеги, и работа по анализу большой базы данных будет продолжена.

Все новости