ES | EU | EN | FR

EUSKORPUS

La gran biblioteca digital del euskera.

Desarrollamos la biblioteca digital que las máquinas necesitan para entender y hablar euskera. Generamos corpus masivos y modelos de código abierto para asegurar un euskera funcional y competitivo.

DESCRIPCIÓN

Corpus Digital.

Un corpus digital es como una biblioteca infinita, pero para entrenar inteligencias artificiales. Incluye desde conversaciones cotidianas hasta textos especializados.

El proyecto contribuye a la conservación y mantenimiento del euskera en entornos digitales.

¿Por qué es vital?

Porque sin datos, no hay IA. Y sin IA, el euskera se queda fuera del mapa digital. Euskorpus es la base que permitirá desarrollar asistentes de voz, traductores automáticos, chatbots y mil aplicaciones más en euskera, fomentando al mismo tiempo un impacto positivo tanto en el tejido industrial como en el ámbito social, y alineándose con el marco europeo de recursos lingüísticos digitales.

LAS 3 FASES

Un plan claro.
Un impacto seguro.

Fase 1.
Generación.

Recopilamos, seleccionamos y etiquetamos contenidos ricos y diversos en euskera (textos y audios), y los organizamos para crear un corpus digital sólido y reutilizable.

Fase 2.
Entrenamiento.

Desarrollamos y entrenamos modelos de IA en euskera, de código abierto, preparados para integrarse en aplicaciones y tecnologías reales.

Fase 3.
Transferencia.

Ponemos estos corpus y modelos al servicio de la industria, las instituciones y la sociedad, facilitando su uso en soluciones concretas y de impacto.

Nº EXPEDIENTE
TÍTULO
IMPORTE
DURACIÓN
(N. 2025/00744)(A/20250244)
Acuerdo de concesión de subvención directa de la asociación Euskorpora para la puesta en marcha en iniciativas en el ámbito de las tecnologías del lenguaje en euskera, en el marco del proyecto Euskorpus.
10.550.000€
2025 – 2027

Mikeletegi Pasealekua 65
20009 Donostia / San Sebastián
Gipuzkoa - SPAIN

+34 611 02 81 72 
info@euskorpora.eus