СРАВНЕНИЕ ФУНКЦИЙ ДЛЯ ИЗМЕРЕНИЯ СХОДСТВА МЕЖДУ ТЕКСТОВЫМИ ДОКУМЕНТАМИ
dc.contributor.author | Бакиев Б. | |
dc.date.accessioned | 2023-04-07T08:16:43Z | |
dc.date.available | 2023-04-07T08:16:43Z | |
dc.date.issued | 2014 | |
dc.description.abstract | Идея измерения сходства текстовых документов получила широкий резонанс в ряде направлений, в частности, в секторе «разработка и извлечение данных». Преобразовать данные в числовые векторы – скрупулезный труд, поскольку мы используем и разметки слов, и фильтрацию стоп-слов, и превращения в корневые слова, а окончательным звеном является расчет по функции TF-IDF. На сегодняшний день существуют результаты исследований многих идей по измерению сходства, но большей популярностью пользуются Джакарт, Косинус, Дайс, Овэрлап. Цель работы: сравнить все известные нам функции для поиска дополнительного сходства текстовых документов. В заключение анализа, на основе полученных результатов выведем градацию и ранжирование аналогий. | |
dc.identifier.citation | СРАВНЕНИЕ ФУНКЦИЙ ДЛЯ ИЗМЕРЕНИЯ СХОДСТВА МЕЖДУ ТЕКСТОВЫМИ ДОКУМЕНТАМИ, Бакиев Б.,старший преподаватель, 2014 | |
dc.identifier.uri | https://repository.sdu.edu.kz/handle/123456789/389 | |
dc.publisher | Suleyman Demirel University | |
dc.subject | измерения сходства текстовых документов | |
dc.subject | исследования Джакарт, Косинус, Дайс, Овэрлап | |
dc.title | СРАВНЕНИЕ ФУНКЦИЙ ДЛЯ ИЗМЕРЕНИЯ СХОДСТВА МЕЖДУ ТЕКСТОВЫМИ ДОКУМЕНТАМИ | |
dc.type | Article | |
dspace.entity.type |