Отличная новость — научную статью наших специалистов по data science процитировали исследователи из Google Research.
Речь идет о задаче поиска документов, близких по смыслу. Обычно в больших документах содержится сразу несколько тем, что затрудняет поиск.
Наша R&D-команда предложила такое решений этой проблемы: разбить документ на несколько сегментов, каждый их которых относится к одной теме. По таким тематически однородным кусочкам текста алгоритму проще производить поиск.
Похожую проблему решали и инженеры из Google Research — и в своей работе сослались на наше исследование.
Саму работу можно найти здесь — впервые она была представлена на конференции SECR-2018 в Москве.