Об определении сложности мультимодальных текстов сайтов российских университетов (на материале корпуса PolyLing)
Краткое описание
Веб-сайты университетов, представляющие собой сложные мультимодальные конструкции, играют очень важную роль в современном образовательном пространстве: являясь неотъемлемой частью электронной информационно-образовательной среды университета, они осуществляют коммуникацию вуза с внешней и внутренней средой и служат инструментом формирования имиджа вуза. С момента своего появления в 1990-х гг они привлекают внимание исследователей. Однако, анализ публикаций, посвященный этой теме выявил, что лишь немногие авторы занимались оценкой сложности/удобочитаемости мультимодальных текстов, размещенных на сайтах университетов. Данное исследование, целью которого является оценка сложности сайтов ведущих российских университетов, частично восполняет этот пробел. Для реализации поставленной цели на первом этапе исследования был собран корпус из 1000+ текстов путем парсинга новостных разделов сайтов отобранных университетов. Тематический состав собранного корпуса, названного PolyLing, был определен методом кластерного анализа. Оценка сложности текстов проводилась автоматически с помощью программы, написанной на Python на основе индексов сложности текстов, и 132 респондентами, которые оценивали представительную выборку из корпуса по 10 критериям, относящимся к 3-м категориям (лингвистические, структурно-логические и вызывающие заинтересованность читателя), отвечая на вопросы специально разработанной анкеты. Корреляционный анализ показал удовлетворительное согласие между автоматическим человеческим оцениванием текстов средней сложности и отрицательную корреляцию между более легкими и более сложными текстами. В статье предлагается возможное объяснение выявленного расхождения в оценке сложности текста, и намечаются направления для дальнейшего исследования.
Ключевые слова
Автоматическое определение сложности текстов, Индексы читабельности, Корпус PolyLing, Мультимодальные сайты российских университетов, Оценка сложности текстов респондентами