Группа лингвистов из Италии, США и Израиля провела статистический анализ корпусов текстов иврита, английского, и испанского языков и пришла к выводу, что скорость фиксации новых слов за последнее время существенно отстает от скорости утраты старых, в результате чего происходит сокращение словарного разнообразия. Статья опубликована в журнале Scientific Reports группы Nature.
Исследователи использовали тексты, оцифрованные компанией Google Inc. в рамках проекта по сканированию книг. Размер коллекции компании к настоящему моменту приблизительно оценивается в 4 процента от всего количества изданных человечеством книг. Авторами было проанализировано употребление около 10 миллионов слов за период с 1800 по 2008 годы. Различные варианты написания (например, color и colour) трактовались как разные слова, так как авторам был интересен процесс их взаимовлияния и вытеснения.
Главный вывод, сделанный на основе анализа употребления слов, говорит о том, что, несмотря на возрастающий поток новых феноменов, появление новых слов в последние 10-20 лет не успевает за исчезновением старых, и в целом язык становится словарно беднее. Лингвисты частично объясняют это влиянием автоматических систем проверки правописания, замедляющим образование новых слов. Также они говорят о тенденции использовать более узкий словарный запас при электронной переписке и отмечают увеличившуюся роль английского языка в академической среде.
Однако, новые слова, появление которых лингвисты зафиксировали в цифровую эпоху, имеют свойство распространяться существенно быстрее, чем это происходило раньше. Исследователи оценили время, которое необходимо новому слову для широкого признания и фиксации в сорок лет. Если к этому моменту широкого распространения не происходит, слово с большой вероятностью исчезает. Исследователи также отмечают тот факт, что сильные изменения языковой динамики происходят во время войн и объясняют это возрастанием информационного потока и более сильной международной интеграцией.