Сравнение классификационных возможностей алгоритмов С4.5 и С5.0

Автор: Пальмов Сергей Вадимович, Мифтахова Альфия Асхатовна

Журнал: Инфокоммуникационные технологии @ikt-psuti

Рубрика: Управление и подготовка кадров для отрасли инфокоммуникаций

Статья в выпуске: 4 т.13, 2015 года.

Бесплатный доступ

В статье проводится сравнение возможностей алгоритмов деревьев решений C4.5 и C5.0 - одних из наиболее эффективных инструментов классификации интеллектуального анализа данных. Для этого были выбраны две их программные реализации - отечественная аналитическая платформа Deductor и система See5. Чтобы повысить качество сравнительного анализа, использовались три разных набора данных. Как показали результаты эксперимента, утверждения автора-разработчика обоих алгоритмов Куинлана о том, что новая версия алгоритма во всём превосходит старую, оказались несколько излишне оптимистичными. C5.0, действительно, строит, как и заявлено, более компактные деревья решений, но скорость его работы осталась сопоставимой с C4.5, а достоверность получаемой классификационной модели снизилась. Однако, авторы статьи не исключают, что вышеуказанные результаты объясняются, тем, что в их распоряжении имелась демонстрационная версия системы See5, которая может обрабатывать файлы, содержащие не более 400 записей.

Еще

Дерево решений, с4.5, с5.0

Короткий адрес: https://sciup.org/140191800

IDR: 140191800   |   DOI: 10.18469/ikt.2015.13.4.18

Список литературы Сравнение классификационных возможностей алгоритмов С4.5 и С5.0

  • Большие данные (Big Data)//URL: http://www.tadviser.ru/index.php (д.о. 10.10.2015).
  • Data Mining -интеллектуальный анализ данных//URL: http://www.inftech. webservis.ru/it/database/datamining/ar2.html (д.о. 10.10.2015).
  • Топ-10 data mining-алгоритмов простым языком//URL: http://habrahabr.ru/company/itinvest/blog/262155/(д.о. 11.10.2015).
  • Деревья решений -общие принципы работы//URL: http://www.gotai.net/documents/doc-msc-006.aspx (д.о. 12.10.2015).
  • The ID3 Algorithm//URL: http://www.cise. ufl.edu/~ddd/cap6635/Fall-97/Short-papers/2. htm (д.о. 12.10.2015).
  • Сидоров А.В. Алгоритмы создания дерева принятия решений//URL: http://econf.rae. ru/pdf/2014/03/3245.pdf (д.о. 13.10.2015).
  • Is See5/C5.0 Better Than C4.5?//URL: http://rulequest.com/see5-comparison.html. (д.о. 15.10.2015).
  • Deductor -описание аналитической платформы//URL: http://bitconsulting. ru/product/olap/(д.о. 17.10.2015).
  • Studio//URL: http://basegroup.ru/deductor/components/studio (д.о. 17.10.2015).
  • Data Mining Tools See5 and C5.0//URL: http://rulequest.com/see5-info.html (д.о. 17.10.2015).
  • Iris Data Set//URL: http://archive. ics.uci.edu/ml/datasets/Iris (д.о. 19.10.2015).
Еще
Статья научная