МОДЕЛИ И АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ КЛАССИФИКАЦИЙ ВИДА ПРЕСТУПЛЕНИЯ
Loading...
Date
2018
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
СДУ хабаршысы - 2018
Abstract
Аннотация. В статье рассмотрено два алгоритма, которые классифицируют преступления на классы. Алгоритм Support vector machines (SVM) и Логистическая регрессия приведены в сравнительном анализе по критерию «точность». Преступления выглядят в виде текстовых сообщений. Рассмотрены методы tf-idf и GloVe для преобразования текстовых сообщений в машинный вид. Данный процесс также называется векторизацией. Взята выборка данных, по преступлениям имеющая свыше одного миллиона фабул для обучения моделей с участием учителя. Описаны действия препроцессинга данных для улучшения итогового и объективно верного результата. С этой целью были произведены такие действия как нормализация, случайная ротация и разделение данных на тестовую и обучающую выборку. Путем сравнительного анализа была определена наиболее точно классифицирующая модель для классификации преступлений.
Description
Keywords
логистическая регрессия, метод вспомогательных векторных машин, классификация, классификация преступлений, текстовая классификация, машинное обучение, векторизация текста., СДУ хабаршысы - 2018, №3
Citation
А.А.Шойынбек , Д.Н. Куанышбай , К.Т. Кожахмет / МОДЕЛИ И АЛГОРИТМЫ МАШИННОГО ОБУЧЕНИЯ ДЛЯ КЛАССИФИКАЦИЙ ВИДА ПРЕСТУПЛЕНИЯ / СДУ хабаршысы - 2018