DOI 10.17586/0021-3454-2019-62-12-1060-1065
УДК 004.415.2
ВЕКТОРНОЕ ПРЕДСТАВЛЕНИЕ СЛОВ ПРИ ПОМОЩИ АППАРАТА КВАНТОВОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ
Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация; доцент
Бессмертный И. А.
Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация; профессор
Королёва Ю. А.
Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация; преподаватель
Читать статью полностью
Аннотация. Рассмотрена проблема моделирования семантики текстовых документов на основе векторного представления слов в гильбертовом пространстве. Векторное представление отражает семантику слов, окружающих данное (контекст). Если слово встречается в исследуемом документе неоднократно, множество контекстов слова образует его обобщенный контекст. Можно рассматривать разные контексты слова как разные проекции, а обобщенный контекст — как восстановленный многомерный объект. Целью исследования является повышение качества восстановления контекста слова за счет учета дополнительных факторов, в частности, возможной неортогональности контекстов. Использована квантовая теория вероятностей. Восстановление контекста соответствует задаче квантовой томографии в квантовой физике. Задача восстановления контекста слова, или в терминах квантовой математики — матрицы плотности вероятностей, решается методом градиентного спуска с помощью машинного обучения. Набор регуляризаторов обеспечивает сходимость процесса по критерию дивергенции Кульбака—Лейблера.
Ключевые слова: естественно-языковой текст, семантика, контекст, квантовая теория вероятностей, квантовая томография
Список литературы:
Список литературы:
- Harris Z. Distributional structure // Word. 1954. P. 146—162.
- Chomsky N. Three models for the description of language // IRE Transactions on Information Theory. 1956. P. 113—124.
- Levy O., Goldberg Y. and Dagan I. Improving distributional similarity with lessons learned from word embeddings // Transactions of the Association for Computational Linguistics. 2015. Vol. 3. P. 211—225.
- Deerwester S., Dumais S. T., Furnas G. W., Landauer T. K. and Harshman R. Indexing by latent semantic analysis // J. of the American Society for Information Science. 1990. Vol. 41, N 6. P. 391—407.
- Hofmann T. Probabilistic latent semantic indexing // Proc. of the 22nd Annual Intern. ACM SIGIR Conf. on Research and Development in Information Retrieval. NY, USA, 1999. P. 50—57.
- Mikolov T., Chen K., Corrado G. and Dean J. Efficient estimation of word representations in vector space // CoRR. arXiv:1301.3781v3. 2013.
- Aerts D., Czachor M. and Sozzo S. Quantum Interaction Approach in Cognition, Artificial Intelligence and Robotics // CoRR. arXiv:1104.3345v1. 2011.
- 8. Barros J., Toffano Z., Meguebli Y., Doan B.-L. Contextual Query Using Bell Tests // Quantum Interaction. Berlin—Heidelberg: Springer, 2014. P. 110—121.
- Хренников А. Ю. Введение в квантовую теорию информации. М.: Физматлит, 2008. 284 с.
- Frommholz I., Larsen B., Piwowarski B., Lalmas M., Ingwersen P. and van Rijsbergen K. Supporting polyrepresentation in a quantum-inspired geometrical retrieval framework // Proc. of the 3rd Symp. on Information interaction in context. ACM, New Brunswick, USA, 2010. Р. 115—124. ISBN: 978-1-4503-0247-0.
- Piwowarski B., Frommholz I., Lalmas M., and van Rijsbergen K. What can quantum theory bring to information retrieval // Proc. of the 19th ACM Intern. Conf. on information and knowledge management. CIKM'10. 2010. NY, USA, 2010. P. 59—68.
- Melucci M. and Piwowarski B. Quantum mechanics and information retrieval: from theory to application // Proc. of the 2013 Conf. on the Theory of Information Retrieval. NY, USA, 2013.
- Sadrzadeh M. and Grefenstette E. A compositional distributional semantics, two concrete constructions, and some experimental evaluations // Quantum Interaction. Berlin—Heidelberg: Springer, 2011. P. 35—47. Electronic ISBN: 978-3-642-24971-6
- Sordoni A., Nie J. and Bengio Y. Modeling Term Dependencies with Quantum Language Models for IR // Proc. of the 36th Intern. ACM SIGIR Conf. on Research and Development in Information Retrieval. SIGIR '13. NY, USA, 2013. P. 653—662.
- Khrennikov A. Classical and quantum probability for biologists-introduction // Quantum Probability and White Noise Analysis. 2010. P. 179—192.
- Piwowarski B. and Lalmas M. A quantum-based model for interactive information retrieval // Advances in information retrieval theory. Berlin—Heidelberg: Springer, 2009. P. 224—231. ISBN: 9781450300995