Archives historiques de l'Union européenne

Recherche et traitement des sources d’archives par l’intelligence artificielle

Les Archives historiques de l’Union européenne ont mené un projet pilote visant à tester l’usage de l’intelligence artificielle pour la création de plateformes de données consultables à des fins académiques.

11 March 2026

En 2025, les Archives historiques de l’Union européenne (AHUE) ont ainsi lancé une étude pilote marquant leur entrée dans l’ère de l’intelligence artificielle (IA) appliquée à l’archivage et plus particulièrement à la description archivistique. Ce projet consistait à utiliser l’IA pour convertir des fichiers de documents numérisés en ensembles de données structurés et interrogeables. Pour cette première phase du projet, l’expérimentation s’est concentrée sur un corpus de documents déjà bien organisé : les ordres du jour du Conseil des ministres de la Communauté économique européenne (CEE), extraits des fonds d’archives.

Les AHUE ont fait appel à une société spécialisée, reconnue pour son expertise et son expérience dans la gestion des archives européennes.

Dans une première étape, les archivistes ont collaboré étroitement avec le prestataire externe afin d’extraire les informations contenues dans les ordres du jour du Conseil des ministres. Malgré quelques difficultés initiales — notamment la coexistence de plusieurs versions des ordres du jour et de résumés — cet exercice a permis aux Archives d’élaborer des lignes directrices pour guider le travail du partenaire.

L’étude pilote a porté sur un corpus de 10 000 pages, soit environ 400 fichiers couvrant les années 1972, 1973, 1975 et 1976. La société externe avait pour mission de convertir les fichiers électroniques en texte exploitable par machine, d’en extraire les champs clés et de créer une interface de recherche dédiée aux chercheur.euses.

Selon Mary Carr, archiviste aux AHUE qui a supervisé le projet, « les avantages potentiels de l'extraction de métadonnées structurées à partir des archives pour nos chercheur.euses ne peuvent être sous-estimés. Nous comptons poursuivre activement cette démarche en 2026».

Si pour l’instant l’IA se révèle surtout performante pour l’extraction de données répétitives, l’enjeu des prochaines années consistera à évaluer son efficacité face à des informations plus hétérogènes, comme celles provenant des archives/dépôts privées.

« Nous devrons peser le pour et le contre lors de cette phase expérimentale et collaborer avec des experts de l’IA appliquée aux archives afin d’adapter cette technologie à la gamme de fichiers conservés dans nos dépôts », a expliqué Mme Carr. Si les résultats s’avèrent concluants, l’équipe des archivistes de Florence pourrait concentrer davantage son travail sur des tâches à forte valeur ajoutée, telles que le contrôle qualité et l’analyse du contexte historique et scientifique, en confiant les opérations les plus répétitives aux outils d’intelligence artificielle.