EUSKORPORA, el Centro de Datos Lingüísticos para las Tecnologías Digitales del Euskera, una nueva asociación con sede en Donostia/San Sebastián, busca un/a experto/a senior en tecnologías de IA aplicadas al procesamiento del lenguaje natural, con experiencia, para liderar tareas clave relacionadas con las tecnologías del lenguaje aplicadas a la lengua vasca.
La persona seleccionada formará parte de un equipo interdisciplinar y participará en proyectos que incluyen la recopilación, análisis y anotación de datos lingüísticos, así como el desarrollo de modelos fundacionales de lenguaje de código abierto (ASR, TTS, MT, NLP) orientados al euskera, en un contexto de investigación y desarrollo estrechamente conectado con la industria.
Funciones principales:
- Supervisar y optimizar los procesos de recopilación, anotación y gestión de corpus lingüísticos.
- Liderar el diseño y desarrollo de modelos fundacionales de lenguaje aplicados al euskera (reconocimiento y síntesis de voz, traducción, procesamiento de texto, etc.).
- Contribuir al diseño y a la evolución futura de la arquitectura tecnológica del centro.
- Garantizar la calidad técnica y metodológica de los desarrollos. Coordinar equipos internos y externos y mentorizar al personal técnico junior.
- Identificar oportunidades de innovación tecnológica y nuevas líneas de trabajo. Colaborar en propuestas, informes técnicos, documentación y difusión de resultados.
- Construir relaciones estratégicas con agentes clave del ecosistema (academia, industria, centros tecnológicos)
Requisitos:
- Titulación universitaria superior (Grado + Máster o Doctorado) en Lingüística Computacional, PLN, Inteligencia Artificial, Ingeniería Informática, Ciencia de Datos o campos afines.
- Al menos 5 años de experiencia en tecnologías del lenguaje o proyectos de IA aplicada al lenguaje.
- Participación demostrable en el desarrollo de modelos ASR, TTS, MT o NLP
- Experiencia en entornos de investigación aplicada o desarrollo tecnológico avanzado.
Conocimientos técnicos:
- Programación avanzada en Python.
- Uso profesional de librerías y frameworks como Hugging Face, PyTorch, TensorFlow, spaCy, Kaldi, ESPnet, Fairseq, etc.
- Experiencia con pipelines de procesamiento del lenguaje y gestión de corpus.
- Conocimientos de MLOps, control de versiones (Git) y buenas prácticas en ciencia de datos reproducible.
- Familiaridad con repositorios de datos abiertos y licencias (Creative Commons, etc.).
Idiomas:
- Euskera: deseable, nivel intermedio (B2 o superior).
- Español: fluido.
- Inglés: nivel alto (especialmente técnico)
Experiencia adicional valorable:
- Experiencia liderando proyectos técnicos y coordinando equipos.
- Conocimientos actualizados del ecosistema de PLN de código abierto.
- Participación en publicaciones científicas o congresos.
- Habilidades de comunicación, síntesis y pensamiento estratégico.
- Conexión con redes europeas o internacionales de investigación en tecnologías del lenguaje.
Ofrecemos:
- Integración en un centro de nueva creación, dinámico e innovador, con una misión clara: posicionar la lengua vasca en el ámbito digital global.
- Participación en proyectos estratégicos con impacto científico, tecnológico y cultural.
- Entorno de trabajo interdisciplinar, colaborativo y de alto nivel.
- Flexibilidad laboral, formación continua y desarrollo profesional.
- Salario competitivo acorde con la experiencia y las responsabilidades.
