Анализ ip-трафика методами Data Mining проблема кластеризации

Автор: Щербакова Наталья Григорьевна

Журнал: Проблемы информатики @problem-info

Рубрика: Средства и системы обработки и анализа данных

Статья в выпуске: 1 (18), 2013 года.

Бесплатный доступ

Представлен подход к решению задачи классификации IP-трафика, основанный на методах интеллектуального анализа данных. С использованием статистических параметров потоков, извлекаемых из характеристик, не зависящих от полезной нагрузки IP-пакетов, проводится идентификация сетевых приложений. Для решения задачи применяется анализ данных, обес­печивающий автоматическое выявление скрытых закономерностей. Рассмотрен ряд алгорит­мов кластеризации, проведен их сравнительный анализ.

Классификация ip-трафика, p2p-трафик, методы машинного обучения, кластеризация, эффективность.

Короткий адрес: https://sciup.org/14320191

IDR: 14320191

Список литературы Анализ ip-трафика методами Data Mining проблема кластеризации

  • Щербакова Н. Г. Анализ IP-трафика методами Data Mining//Пробл. информатики. 2012. № 4. С. 30-46.
  • Барсегян А. А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, Olap/А. А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод. СПб.: БХВ-Петербург, 2007.
  • Mitchell T. Machine learning. N. Y.: McGraw-Hill, 1997.
  • Гмурман В. Е. Теория вероятностей и математическая статистика. М.: Юрайт, 2011.
  • McGregor A., Hall M., Lorier P., Brunskill J. Flow clustering using machine learning techniques//Passive and active measurement workshop (PAM 2004): Proc. Lecture Notes in Computer Science. V. 3015, Antibes Juan-les-Pins (France), Apr. 2004. N. Y.: Springer, 2004. P. 205-214.
  • Zander S., Nguyen T., Armitage G. Self-learning IP tra.c classi.cation based on statistical.ow characteristics//Passive and active measurement workshop (PAM 2005): Proc. Lecture Notes in Computer Science. V. 3431, Boston, USA, March -Apr. 2005. N. Y.: Springer, 2005. P. 325-328.
  • ZanderS., NguyenT., ArmitageG. Automated tra.c classi.cation and application identi.­cation using machine learning//30th Annual IEEE conf.on local computer networks (LCN 2005):Proc. IEEE Computer Soc., Sydney (Australia), Nov.2005. Washington:IEEE Computer Soc.,2005. P.250-257.
  • Cheeseman P., Stutz J. Bayesian classi.cation (AutoClass): theory and results//Advances in knowledge discovery and data mining. Palo Alto (CA, USA): AAAI/MIT Press, 1996. P. 61-68.
  • Erman J., Arlitt M., Mahanti A. Tra.c classi.cation using clustering algorithms//Special interest group on data communication (SIGCOMM) 2006 workshops: Proc. of the 2006 SIGCOMM workshop on Mining network data, Pisa (Italy), Sept. 11-15, 2006. N. Y.: ACM, 2006. P. 281-286.
  • Ester M., Kriegel H., Sander J., Xu X. A density-based algorithm for discovering clusters in large spatial databases with noise//Proc. of the 2nd Intern. conf. on knowledge discovery and data mining (KDD-96), Portland (USA), 1996. Palo Alto: AAAI/MIT Press, 1996. P. 226-231.
  • Witten I. H. Data mining: practical machine learning tools and techniques/I.H.Witten, E.Frank. San Francisco: Morgan Kaufmann, 2005. P. 560.
  • Paxson V. Empirically-derived analytic models of wide-area TCP connections//IEEE/ACM Trans. Network. 1994. V. 2, N 4. P. 316-336.
  • Erman J., Mahanti A., Arlitt M., Williamson C. Identifying and discriminating between web and peer-to-peer tra.c in the network core//Proc. of the 16th Intern. conf. on world wide web (WWW) 2007, Ban. (Alberta, Canada), May 8-12, 2007. N. Y.: ACM, 2007. P. 883-892.
  • Sen S., Spatscheck O., Wang D. Accurate, scalable in-network identi.cation of P2P tra.c using application signatures//Proc. of the 13th Intern. world wide web conf., New York (USA), May 2004. N. Y.: ACM, 2004. P. 512-521.
  • Karagiannis T., Papagiannaki K., Faloutsos M. BLINK: multilevel tra.c classi.cation in the dark//ACM SIGCOMM Computer Comm. Rev. 2005. V. 35, iss. 4. P. 229-240.
  • Erman J., Mahanti A., Arlitt M., et al. Semi-supervised network tra.c classi.cation//Proc. of the Intern. conf. on measurement and modeling of computer systems (SIGMETRICS’07), San Diego (USA), June 12-16, 2007. N. Y.: ACM, 2007. P. 369-370.
  • Mahanti A., Arlitt M., Cohen I., Williamson C. O.ine/realtime tra.c classi.cation using semi-supervised learning: Tech. rep. Univ. of Calgary. 2007. V. 64. P. 1194-1213.
  • Guyon I., Elisseeff A. An introduction to variable and feature selection//J. Machine Learn. Res. 2003. V. 3. P. 1157-1182.
  • Paxson V. Bro: a system for detecting network intruders in real-time//Computer Networks. 1999. V. 31, iss. 23/24. P. 2435-2463.
  • Chen Z., Yang B., Chen Y., et al. Online hybrid tra.c classi.er for Peer-to-Peer systems based on network processors//Appl. Soft Comput. 2009. V. 9, N 2. P. 685-694.
  • Karagiannis T., Broido A., Faloutsos M., Mc Claffy. Transport layer identi.cation of P2P tra.c//Proc. of the 4th ACM SIGCOMM conf. on Internet measurement (IMC’04), Taormina (Sicily, Italy), Oct. 25-27, 2004. N. Y.: ACM, 2004. P. 121-134.
  • Chen Y., Yang B., Dong J. Nonlinear systems modelling via optimal design of neural trees//Intern. J. Neural Systems. 2004. V. 14. P. 125-138.
Еще
Статья научная