СРАВНЕНИЕ ФУНКЦИЙ ДЛЯ ИЗМЕРЕНИЯ СХОДСТВА МЕЖДУ ТЕКСТОВЫМИ ДОКУМЕНТАМИ

dc.contributor.authorБакиев Б.
dc.date.accessioned2023-04-07T08:16:43Z
dc.date.available2023-04-07T08:16:43Z
dc.date.issued2014
dc.description.abstractИдея измерения сходства текстовых документов получила широкий резонанс в ряде направлений, в частности, в секторе «разработка и извлечение данных». Преобразовать данные в числовые векторы – скрупулезный труд, поскольку мы используем и разметки слов, и фильтрацию стоп-слов, и превращения в корневые слова, а окончательным звеном является расчет по функции TF-IDF. На сегодняшний день существуют результаты исследований многих идей по измерению сходства, но большей популярностью пользуются Джакарт, Косинус, Дайс, Овэрлап. Цель работы: сравнить все известные нам функции для поиска дополнительного сходства текстовых документов. В заключение анализа, на основе полученных результатов выведем градацию и ранжирование аналогий.
dc.identifier.citationСРАВНЕНИЕ ФУНКЦИЙ ДЛЯ ИЗМЕРЕНИЯ СХОДСТВА МЕЖДУ ТЕКСТОВЫМИ ДОКУМЕНТАМИ, Бакиев Б.,старший преподаватель, 2014
dc.identifier.urihttps://repository.sdu.edu.kz/handle/123456789/389
dc.publisherSuleyman Demirel University
dc.subjectизмерения сходства текстовых документов
dc.subjectисследования Джакарт, Косинус, Дайс, Овэрлап
dc.titleСРАВНЕНИЕ ФУНКЦИЙ ДЛЯ ИЗМЕРЕНИЯ СХОДСТВА МЕЖДУ ТЕКСТОВЫМИ ДОКУМЕНТАМИ
dc.typeArticle
dspace.entity.type

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Бакиев Б.,.pdf
Size:
571.11 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Лицензия.pdf
Size:
217.41 KB
Format:
Adobe Portable Document Format
Description: