Description
Векторые репрезентации слов – мощный инструмент для изучения закономерностей языка, который привел к множеству прорывов в сфере natural language processing. Возможность измерять семантическую близость слов позволяет не только конструировать лучшие модели языка, но и отслеживать изменения смысла слов во времени. Я покажу результаты некоторых экспериментов с динамическими векторными моделями английского и русского языков, трехмерные визуализации макроструктуры якыка, траектории движения слов и кластеров слов за последние 70 лет, опишу процес создания временных датасетов для языков, конструкции векторных репрезентаций с помощю нейронных сетей, инструментарий для анализа движения векторов слов и уменьшения размерности модели языка до трех измерений, а также создания интерактивных визуализаций языка и семантических облаков Википедии.