Google изучил эволюцию языка за двести лет

Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет New Scientist.

До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту - всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов - их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь - поиск по словам осуществляется на базе алгоритмов Google.

Проанализировав полученные данные, авторы смогли сделать большое количество разнообразных выводов. В частности, они установили, что за последние сто лет число часто используемых слов возросло вдвое - если в 1900 году использовалось около 544 тысяч слов, то в 2000 году это число возросло до одного миллиона, причем 52 процента новых слов стало активно употребляться после 1950-х годов.

Кроме того, специалисты изучили, как сказывалась на использовании тех или иных слов цензура. Ученые установили, что после 1989 года словосочетание "площадь Тяньаньмень" практически перестало встречаться в литературе, изданной в Китае. То же самое произошло с именем Лев Троцкий в СССР в 1940-е годы и с именами голливудских актеров, уличенных в связях с Советским Союзом в США.

Авторы и их коллеги полагают, что новый инструмент позволит ученым исследовать слова и лингвистические тенденции, используя те же подходы и методы, что и специалисты по естественным наукам.

Google изучил эволюцию языка за двести лет

Найдены признаки жизни на далекой суперземле. На этой планете год длится 33 дня

ВСУ совершили 10 атак за сутки на российские энергообъекты

Юрий Лоза отказался от бесплатных выступлений на 9 Мая

В Кремле рассказали об осведомленности Трампа о переговорах с Путиным

Осужденного за расправу над настоятелем храма оставили в колонии

У 33-летней россиянки дважды останавливалось сердце во время отпуска в Таиланде

В России прокомментировали подрыв ВСУ строений Горнальского монастыря под Курском

Недавно освободившегося россиянина задержали за изнасилование своей дочери

Лавров посетит Узбекистан

Бывшему замглавы Генштаба России дали семь лет за взятки на 36 миллионов рублей