ES | EU | EN | FR

EUSKORPUS

La grande bibliothèque numérique de la langue basque.

Nous développons la bibliothèque numérique dont les machines ont besoin pour comprendre et parler le basque. Nous générons des corpus massifs et des modèles open source pour garantir un basque fonctionnel et compétitif.

DESCRIPTION

Corpus numérique.

Un corpus numérique est comme une bibliothèque infinie, mais destinée à entraîner l’intelligence artificielle. Il comprend aussi bien des conversations quotidiennes que des textes spécialisés.

Le projet contribue à la conservation et au maintien de la langue basque dans les environnements numériques.

Pourquoi est-ce essentiel ?

Parce que sans données, il n’y a pas d’IA. Et sans IA, le basque reste en dehors de la carte numérique. Euskorpus est la base qui permettra de développer des assistants vocaux, des traducteurs automatiques, des chatbots et bien d’autres applications encore en basque, tout en favorisant un impact positif tant sur le tissu industriel que dans le domaine social, et en s’alignant sur le cadre européen des ressources linguistiques numériques.

LES 3 PHASES

Un plan clair.
Un impact garanti.

Phase 1.
Génération.

Nous collectons et étiquetons des contenus riches et variés.

Phase 2.
Formation.

Nous développons et entraînons des modèles d’IA open source en basque, prêts à être intégrés dans des applications et technologies du monde réel.

Phase 3.
Transfert.

Nous les mettons au service de l’industrie et de la société.

Nº DOSSIER
TITRE
MONTANT
DURÉE
(N. 2025/00744)(A/20250244)
Accord d’octroi d’une subvention directe à l’association Euskorpora pour la mise en œuvre d’initiatives dans le domaine des technologies du langage en euskera, dans le cadre du projet Euskorpus.
10.550.000€
2025 – 2027

Mikeletegi Pasealekua 65
20009 Donostia / San Sebastián
Gipuzkoa - ESPAGNE

+34 611 02 81 72 
info@euskorpora.eus