Математики по-новому взглянули на изменение языков

Исследователи с помощью модифицированной математической функции изучили английские произведения 1850-1950-х годов. Эта методика помогла ученым впервые определить главные отличия текстов разных временных отрезков.© Fotolia/ felix

МОСКВА, 18 апр — РИА Новости. Ученые разработали новый метод сравнения больших объемов данных для изучения языка, ДНК и других объектов, представляющих собой последовательность символов, пишет Physics. Полная версия статьи опубликована в издании Physical Review X. © Fotolia/ SSilver Ученые: мозг воспринимает слова не по буквам, а в виде единого целого

Ученые для исследования того, как меняются языки, прибегли к данным сервиса Google Ngram, который анализирует книги из базы Google Books. Как отмечают математики, исследовать книги можно было двумя способами: посчитать слова, которые есть в одном произведении, но отсутствуют в другом, или подсчитать частоту использования тех или иных слов.

Ученые использовали второй метод и проанализировали произведения на английском языке, опубликованные в 1850, 1900 и 1950-х годах. Они применили модифицированную математическую функцию — расстояние Йенсена — Шеннона, которая используется для анализа сходства и различий наборов символов, в качестве которых в том числе могут выступать и слова.

Как выяснили ученые, больше всего тексты различаются редко используемыми словами, а не часто используемыми — методы исследования, применяемые ранее, выяснить это не могли. Математики полагают, что результаты могут быть верны не только для английского, но и для русского и испанского языков. 

Спасибо! Ваше мнение учтено.

Оцените статью

Статья легко читается

1 2 3 4 5

Объем статьи оптимальный

1 2 3 4 5

Статья была информативна

1 2 3 4 5

Тема статьи полностью раскрыта

1 2 3 4 5

Материал излагается ясно, последовательно

1 2 3 4 5

Статья слишком пространная, в ней много лишней информации, «воды»

1 2 3 4 5

Комментарии запрещены.