Biomedical entities recognition in Spanish combining word embeddings

  1. LÓPEZ ÚBEDA, PILAR
Dirigida por:
  1. Luis Alfonso Ureña López Director
  2. María Teresa Martín Valdivia Codirectora
  3. Manuel Carlos Díaz Galiano Codirector

Universidad de defensa: Universidad de Jaén

Fecha de defensa: 22 de abril de 2021

Tribunal:
  1. Rafael Muñoz Guillena Presidente/a
  2. Paloma Martínez Fernández Secretario/a
  3. Manuel Montes Gomez Vocal
Departamento:
  1. INFORMÁTICA

Tipo: Tesis

Teseo: 665953 DIALNET

Resumen

El reconocimiento de entidades con nombre (NER) es una tarea importante en el campo del Procesamiento del Lenguaje Natural que se utiliza para extraer conocimiento significativo de los documentos textuales. El objetivo de NER es identificar trozos de texto que se refieran a entidades específicas. En esta tesis pretendemos abordar la tarea de NER en el dominio biomédico y en español. En este dominio las entidades pueden referirse a nombres de fármacos, síntomas y enfermedades y ofrecen un conocimiento valioso a los expertos sanitarios. Para ello, proponemos un modelo basado en redes neuronales y empleamos una combinación de word embeddings. Además, nosotros generamos unos nuevos embeddings específicos del dominio y del idioma para comprobar su eficacia. Finalmente, demostramos que la combinación de diferentes word embeddings como entrada a la red neuronal mejora los resultados del estado de la cuestión en los escenarios aplicados.