
EUSKORPUS

La gran biblioteca digital del euskera.
Desarrollamos la biblioteca digital que las máquinas necesitan para entender y hablar euskera. Generamos corpus masivos y modelos de código abierto para asegurar un euskera funcional y competitivo.
DESCRIPCIÓN

Corpus Digital.
Un corpus digital es como una biblioteca infinita, pero para entrenar inteligencias artificiales. Incluye desde conversaciones cotidianas hasta textos especializados.
El proyecto contribuye a la conservación y mantenimiento del euskera en entornos digitales.

¿Por qué es vital?
Porque sin datos, no hay IA. Y sin IA, el euskera se queda fuera del mapa digital. Euskorpus es la base que permitirá desarrollar asistentes de voz, traductores automáticos, chatbots y mil aplicaciones más en euskera, fomentando al mismo tiempo un impacto positivo tanto en el tejido industrial como en el ámbito social, y alineándose con el marco europeo de recursos lingüísticos digitales.
LAS 3 FASES

Un plan claro.
Un impacto seguro.
Recopilamos, seleccionamos y etiquetamos contenidos ricos y diversos en euskera (textos y audios), y los organizamos para crear un corpus digital sólido y reutilizable.

Desarrollamos y entrenamos modelos de IA en euskera, de código abierto, preparados para integrarse en aplicaciones y tecnologías reales.

Ponemos estos corpus y modelos al servicio de la industria, las instituciones y la sociedad, facilitando su uso en soluciones concretas y de impacto.

