El grupo se concibe como un espacio de aprendizaje colectivo entre personas con o sin conocimientos sobre lingüística computacional mediante la experimentación con discursos de diversa índole (narrativa, poesía, textos cortos como los presentes en twitter o instagram; textos legales o laborales, etc) y herramientas de lingüística computacional (spacy, nltk) y de machine learning (scikit learn, etc).
La lingüística computacional se entiende como una intersección entre dos subramas de la inteligencia artificial (machine learning y procesado del lenguaje natural (NLProc)) y la lingüística de corpus.
La lingüística de corpus ha venido tradicionalmente etiquetando textos de forma manual para que las máquinas pudieran procesarlo. En los últimos años, bajo el influjo del machine learning y el NLProc, la lingüística de corpus ha variado su enfoque.
Podemos hablar de tres acercamientos:
¿Cómo ha evolucionado la traducción automática en los últimos años?
Carla Parra Escartín. La Lintera del Traductor (Revista multilingüe de ASETRAD)
Librería spaCy de NLProc:
spaCy 2ª parte (en preparación)
Contacto
El grupo lo coordina Alejandro Martín, investigador-mediador en el centro en los cursos 2019-18 y 2019-20. Su proyecto de investigación versa sobre la lingüística computaciona, el procesado del lenguaje natural y busca crear una herramienta de gestión de corpus que sirva para análisis lingüísticos complejos, al estilo del periodismo de datos, de manera que genere gráficas complejas de múltiples dimensiones y análisis automáticos en texto.
Esta investigación busca trasladar al ámbito público y comunitario el debate y el desarrollo de la lingüística computacional que en esta última oleada de impulso a la inteligencia artificial está sirviendo de negocio principal para las principales empresas tecnológicas como, entre otras, Google, Facebook, Apple y Microsoft, dedicadas ferozmente a la minería de datos con el objetivo de monetizar cada faceta de nuestras relaciones.