МОДЕЛИ И АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ КЛАССИФИКАЦИЙ ВИДА ПРЕСТУПЛЕНИЯ

Loading...
Thumbnail Image

Date

2018

Journal Title

Journal ISSN

Volume Title

Publisher

СДУ хабаршысы - 2018

Abstract

Аннотация. В статье рассмотрено два алгоритма, которые классифицируют преступления на классы. Алгоритм Support vector machines (SVM) и Логистическая регрессия приведены в сравнительном анализе по критерию «точность». Преступления выглядят в виде текстовых сообщений. Рассмотрены методы tf-idf и GloVe для преобразования текстовых сообщений в машинный вид. Данный процесс также называется векторизацией. Взята выборка данных, по преступлениям имеющая свыше одного миллиона фабул для обучения моделей с участием учителя. Описаны действия препроцессинга данных для улучшения итогового и объективно верного результата. С этой целью были произведены такие действия как нормализация, случайная ротация и разделение данных на тестовую и обучающую выборку. Путем сравнительного анализа была определена наиболее точно классифицирующая модель для классификации преступлений.

Description

Keywords

логистическая регрессия, метод вспомогательных векторных машин, классификация, классификация преступлений, текстовая классификация, машинное обучение, векторизация текста., СДУ хабаршысы - 2018, №3

Citation

А.А.Шойынбек , Д.Н. Куанышбай , К.Т. Кожахмет / МОДЕЛИ И АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ КЛАССИФИКАЦИЙ ВИДА ПРЕСТУПЛЕНИЯ / СДУ хабаршысы - 2018