Разработка сервиса для оценки удобочитаемости текста с применением технологий машинного обучения
Системный анализ в проектировании и управлении. В 3 ч. Ч. 2: сборник научных трудов XXVI Международной научно-практической конференции, 13–14 октября 2022 г. СПб.: ПОЛИТЕХ-ПРЕСС, 2023. С. 232-240.
Краткое описание
Целью настоящего проекта стала разработка сервиса для оценки удобочитаемости и воспринимаемости электронного текста как способ повышения качества новостного, образовательного и научного контента веб-сайта высшего учебного заведения. В статье рассмотрены подходы к оценке удобочитаемости, рассчитано соответствие классических метрик оценки сложности текста и экспертных оценок, предложен комбинированный подход к определению уровня удобочитаемости текста. Представлен алгоритм градиентного бустинга XGBoost как инструмент для реализации нейросетевого подхода к оценке удобочитаемости. Описаны этапы создания нейросетевой модели и полученные результаты.
Ключевые слова
УДОБОЧИТАЕМОСТЬ, МАШИННОЕ ОБУЧЕНИЕ, ГРАДИЕНТНЫЙ БУСТИНГ, НЕЙРОСЕТЕВАЯ МОДЕЛЬ
Ссылка при цитировании
Никулина Е.Р., Черкас А.В., Козина Е.Д., Бойко А.В., Дмитриева Л.А. Разработка сервиса для оценки удобочитаемости текста с применением технологий машинного обучения // Системный анализ в проектировании и управлении. В 3 ч. Ч. 2: сборник научных трудов XXVI Международной научно-практической конференции, 13–14 октября 2022 г. СПб.: ПОЛИТЕХ-ПРЕСС, 2023. С. 232-240.