ISSN 0021-3454 (печатная версия)
ISSN 2500-0381 (онлайн версия)
Меню

7
Содержание
том 63 / Июль, 2020
СТАТЬЯ

DOI 10.17586/0021-3454-2019-62-12-1060-1065

УДК 004.415.2

ВЕКТОРНОЕ ПРЕДСТАВЛЕНИЕ СЛОВ ПРИ ПОМОЩИ АППАРАТА КВАНТОВОЙ ТЕОРИИ ВЕРОЯТНОСТЕЙ

Платонов А. В.
Университет ИТМО; факультет программной инженерии и компьютерной техники;


Бессмертный И. А.
Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация; доцент


Королёва Ю. А.
Университет ИТМО; аспирант


Аннотация. Рассмотрена проблема моделирования семантики текстовых документов на основе векторного представления слов в гильбертовом пространстве. Векторное представление отражает семантику слов, окружающих данное (контекст). Если слово встречается в исследуемом документе неоднократно, множество контекстов слова образует его обобщенный контекст. Можно рассматривать разные контексты слова как разные проекции, а обобщенный контекст — как восстановленный многомерный объект. Целью исследования является повышение качества восстановления контекста слова за счет учета дополнительных факторов, в частности, возможной неортогональности контекстов. Использована квантовая теория вероятностей. Восстановление контекста соответствует задаче квантовой томографии в квантовой физике. Задача восстановления контекста слова, или в терминах квантовой математики — матрицы плотности вероятностей, решается методом градиентного спуска с помощью машинного обучения. Набор регуляризаторов обеспечивает сходимость процесса по критерию дивергенции Кульбака—Лейблера.
Ключевые слова: естественно-языковой текст, семантика, контекст, квантовая теория вероятностей, квантовая томография

Список литературы:
  1. Harris Z. Distributional structure // Word. 1954. P. 146—162.
  2. Chomsky N. Three models for the description of language // IRE Transactions on Information Theory. 1956. P. 113—124.
  3. Levy O., Goldberg Y. and Dagan I. Improving distributional similarity with lessons learned from word embeddings // Transactions of the Association for Computational Linguistics. 2015. Vol. 3. P. 211—225.
  4. Deerwester S., Dumais S. T., Furnas G. W., Landauer T. K. and Harshman R. Indexing by latent semantic analysis // J. of the American Society for Information Science. 1990. Vol. 41, N 6. P. 391—407.
  5. Hofmann T. Probabilistic latent semantic indexing // Proc. of the 22nd Annual Intern. ACM SIGIR Conf. on Research and Development in Information Retrieval. NY, USA, 1999. P. 50—57.
  6. Mikolov T., Chen K., Corrado G. and Dean J. Efficient estimation of word representations in vector space // CoRR. arXiv:1301.3781v3. 2013.
  7. Aerts D., Czachor M. and Sozzo S. Quantum Interaction Approach in Cognition, Artificial Intelligence and Robotics // CoRR. arXiv:1104.3345v1. 2011.
  8. 8. Barros J., Toffano Z., Meguebli Y., Doan B.-L. Contextual Query Using Bell Tests // Quantum Interaction. Berlin—Heidelberg: Springer, 2014. P. 110—121.
  9. Хренников А. Ю. Введение в квантовую теорию информации. М.: Физматлит, 2008. 284 с.
  10. Frommholz I., Larsen B., Piwowarski B., Lalmas M., Ingwersen P. and van Rijsbergen K. Supporting polyrepresentation in a quantum-inspired geometrical retrieval framework // Proc. of the 3rd Symp. on Information interaction in context. ACM, New Brunswick, USA, 2010. Р. 115—124. ISBN: 978-1-4503-0247-0.
  11. Piwowarski B., Frommholz I., Lalmas M., and van Rijsbergen K. What can quantum theory bring to information retrieval // Proc. of the 19th ACM Intern. Conf. on information and knowledge management. CIKM'10. 2010. NY, USA, 2010. P. 59—68.
  12. Melucci M. and Piwowarski B. Quantum mechanics and information retrieval: from theory to application // Proc. of the 2013 Conf. on the Theory of Information Retrieval. NY, USA, 2013.
  13. Sadrzadeh M. and Grefenstette E. A compositional distributional semantics, two concrete constructions, and some experimental evaluations // Quantum Interaction. Berlin—Heidelberg: Springer, 2011. P. 35—47. Electronic ISBN: 978-3-642-24971-6
  14. Sordoni A., Nie J. and Bengio Y. Modeling Term Dependencies with Quantum Language Models for IR // Proc. of the 36th Intern. ACM SIGIR Conf. on Research and Development in Information Retrieval. SIGIR '13. NY, USA, 2013. P. 653—662.
  15. Khrennikov A. Classical and quantum probability for biologists-introduction // Quantum Probability and White Noise Analysis. 2010. P. 179—192.
  16. Piwowarski B. and Lalmas M. A quantum-based model for interactive information retrieval // Advances in information retrieval theory. Berlin—Heidelberg: Springer, 2009. P. 224—231. ISBN: 9781450300995