Модель нейронной сети для преодоления деградации результатов классификации текстов по тональности

Автор: Рубцова Юлия

Журнал: Проблемы информатики @problem-info

Рубрика: Прикладные информационные технологии

Статья в выпуске: 2 (39), 2018 года.

Бесплатный доступ

В данной работе описан алгоритм построения классификатора текстов по тональности, использующий пространство распределенных представлений слов и нейронную языковую модель Skip-gram. Экспериментально показано, что построенная модель классификатора текстов может быть перенесена на коллекции, собранные в другой временной промежуток без потери качества классификации.

Короткий адрес: https://sciup.org/143167049

IDR: 143167049

Список литературы Модель нейронной сети для преодоления деградации результатов классификации текстов по тональности

  • Loukachevitch N.V., Blinov P.D., Kotelnikov E.V., Rubtsova Y.V., Ivanov V.V., Tutubalina E.V. SentiRuEval: testing object-oriented sentiment analysis systems in Russian//Proceedings of International Conference Dialog. 2015. P. 3-9.
  • Loukachevitch N., Rubtsova Y. Entity-Oriented Sentiment Analysis of Tweets: Results and Problems//Text, Speech, and Dialogue. Springer International Publishing, 2015. P. 551-559.
  • Chetviorkin I., Braslavskiy P., Loukachevitch N. Sentiment Analysis Track at ROMIP 2011//Computational Linguistics and Intellectual Technologies: Annual International Conf. „Dialogue", CoLing&InTel. N 11 (18). 2012. P. 739-716.
  • Chetviorkin I., Loukachevich N. 2013. Sentiment analysis track at romip 2012//In Proceedings of International Conference Dialog. V. 2. 2012. P. 40-50.
  • Amigo E. et al. Overview of RepLab 2012: Evaluating Online Reputation Management Systems//CLEF (Online Working Notes/Labs/Workshop). 2012.
  • Amigo E. et al. Overview of replab 2013: Evaluating online reputation monitoring systems//International Conference of the Cross-Language Evaluation Forum for European Languages. Springer Berlin Heidelberg. 2013. P. 333-352.
  • Loukachevitch, N., Rubtsova, Y. SentiRuEval-2016: Overcoming Time Gap and Data Sparsity in Tweet Sentiment Analysis//In Proceedings of International Conference on Computational Linguistics and Intellectual Technologies Dialog-2016. 2016. P. 375-384.
  • Rosenthal, S., Farra, N., k, Nakov, P. SemEval-2017 task 4: Sentiment analysis in Twitter//In Proceedings of the 11th International Workshop on Semantic Evaluation (SemEval-2017). 2017. P. 502-518.
  • Pang В., Lee L., Vaithyanathan S. Thumbs up?: sentiment classification using machine learning techniques//Proceedings of the ACL-02 conference on Empirical methods in natural language processing. V. 10. Association for Computational Linguistics, 2002. P. 79-86.
  • Turney P. D. Thumbs up or thumbs down?: semantic orientation applied to unsupervised classification of reviews//Proceedings of the 40th annual meeting on association for computational linguistics. Association for Computational Linguistics, 2002. P. 117-121.
  • Wilson Т., WTiebe J., Hoffmann P. Recognizing contextual polarity in phrase-level sentiment analysis//Proceedings of the conference on human language technology and empirical methods in natural language processing. Association for Computational Linguistics, 2005. P. 317-351.
  • Jiang L. et al. Target-dependent twitter sentiment classification//Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. V. 1. Association for Computational Linguistics, 2011. P. 151-160.
  • Лукашевич H., Рубцова Ю. Объектно-ориентированный анализ твитов по тональности: результаты и проблемы//Труды Международной конференции DAMDID/RCDL-2015. Обнинск, 2015. С. 499-507.
  • Клековкина М. В., Котельников Е. В. Метод автоматической классификации текстов по тональности, основанный на словаре эмоциональной лексики//Труды конференции RCDL. 2012. С.118-123.
  • Read J. Using emoticons to reduce dependency in machine learning techniques for sentiment classification//In Proceedings of ACL-05, 43nd Meeting of the Association for Computational Linguistics. Association for Computational Linguistics, 2005.
  • Рубцова Ю. В. Метод построения и анализа корпуса коротких текстов для задачи классификации отзывов//Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды XV Всероссийской научной конференции RCDL'2013, Ярославль, Россия, 1 I 17 октября 2013 г. Ярославль: ЯрГУ, 2013. С. 269-275.
  • Рубцова Ю. В. Разработка и исследование предметно независимого классификатора текстов по тональности//Труды СПИИРАН 11. 2014. Т. 5. № 36. С. 59 77.
  • Рубцова Ю. Автоматическое построение и анализ корпуса коротких текстов (постов микроблогов) для задачи разработки и тренировки тонового классификатора//Инженерия знаний и технологии семантического веба. 2012. Т. 1. С. 109-116.
  • Rubtsova Y. Reducing the Degradation of Sentiment Analysis for Text Collections Spread over a Period of Time//International Conference on Knowledge Engineering and the Semantic Web. Springer, Cham, 2017. P. 3-13.
  • Рубцова Ю. В. Преодоление деградации результатов классификации текстов по тональности в коллекциях, разнесенных во времени//Системная информатика. 2016. С. 45-68.
  • Titov, I. Modeling Online Reviews with Multi-grain Topic Models//Proceedings of the 17th International Conference on World Wide Web (WWW'08). 2008. P. 111-120.
  • Levy, O. Improving Distributional Similarity with Lessons Learned from Word Em-beddings//Transactions of the Association for Computational Linguistics. 2015. P. 211-225.
  • Mikolov, Т., Chen, K., Corrado, С, k, Dean, J. Efficient estimation of word representations in vector space. arXiv preprint arXiv: 1301.3781. 2013.
  • Mikolov Т., Sutskever I., Chen K., Corrado C, and Dean J. Distributed Representations of Words and Phrases and their Compositionality//In Proceedings of NIPS, 2013. P. 3111-3119.
Еще
Статья научная