КЛАСТЕРИЗАЦІЙНІ ПАРАМЕТРИ ДЛЯ ВИЗНАЧЕННЯ КЛЮЧОВИХ СЛІВ ПРИРОДНИХ ТЕКСТІВ ІЗ УРАХУВАННЯМ ПОПРАВОК НА РАНДОМНІ ТЕКСТИ
Ключові слова:
комп'ютерна лінгвістика, визначення ключових слів, штучний інтелект, кластеризаціяАнотація
Кластеризаційні методи є ефективним інструментом для виявлення ключових слів у природних текстах. Ми пропонуємо метод коригування параметрів релевантності слів, отриманих такими методами, за допомогою даних, отриманих із рандомних текстів і моделюємо залежність цих параметрів від абсолютних і відносних частот слів.
Посилання (Бібліографія)
M. Ortuño, P. Carpena, P. Bernaola-Galván, E. Muñoz, A. M. Somoza, Europhys. Lett., 57, 759 (2002).
J. P. Herrera, P. A. Pury, Eur. Phys. J. B, 63, 135 (2008).
H. Zhou, G. W. Slater, Physica A, 329, 309 (2003).
P. Carpena, P. Bernaola-Galván, M. Hackenberg, A. V. Coronado, J. L. Oliver, Phys. Rev. E, 79, 035102(R) (2009).
P. Carpena, P. A. Bernaola-Galván, C. Carretero-Campos, A. V. Coronado, Phys. Rev. E, 94, 052302 (2016).