2021
Communications in Computer and Information Science, Scopus
Article
Communications in Computer and Information Science
Springer, Cham
Geltser B. et al. (2021) Chomsky Was (Almost) Right: Ontology-Based Parsing of Texts of a Narrow Domain. In: Kravets A.G., Shcherbakov M., Parygin D., Groumpos P.P. (eds) Creativity in Intelligent Technologies and Data Science. CIT&DS 2021. Communications in Computer and Information Science, vol 1448. Springer, Cham. https://doi.org/10.1007/978-3-030-87034-8_7.
Общий подход к анализу естественных текстов подразумевает, что семантический анализ должен следовать за этапом синтаксического анализа. Однако медицинские тексты известны как очень сложные и написанные на очень специфическом языке. Традиционные парсеры демонстрируют здесь относительно небольшую производительность. В этой статье мы демонстрируем противоположный подход: онтологическое влечение слов в сочетании с простыми правилами поверхностного синтаксического анализа. Это позволяет нам увеличить показатели UAS с 0,82 для SpaCy до 0,834 для нашего подхода.