En collaboration avec des collègues italiens, des chercheuses et chercheurs de l'EPFL construisent une machine à remonter le temps qui permet d'explorer la Venise historique. L'équipe dirigée par Frédéric Kaplan a déjà numérisé pour cela deux millions de documents et d'images. Des moteurs de recherche spécialement développés pour ce projet donnent vie à cet héritage numérique.

Le prof. Frédéric Kaplan, responsable du projet Venice Time Machine (à g.) et sa collaboratrice scientifique Isabella di Lenardo. (Photo: Kellenberger Kaminski Photographie)

«J'étais récemment à Venise, sur le pont Rialto, devant l'une des boutiques à touristes et je n'ai pas pu m'empêcher de penser qu'en 1740, à cet endroit précis, Francesco Raspi vendait des vêtements dans sa bottega, comme le fit aussi, encore des décennies plus tard, son petit-fils du même nom», raconte Frédéric Kaplan. «Le fait de pouvoir se promener à travers la ville tout en étant lié à l'esprit, à la vie et aux réalisations d'une personne défunte est très impressionnant.» Une expérience que chacun sera bientôt en mesure de faire.

Frédéric Kaplan est professeur en humanités digitales à l'EPFL et il dirige le projet Venice Time Machine. Pour ce projet, plus de 20 collaborateurs numérisent des documents historiques des archives d'Etat de Venise, de la Fondazione Giorgio Cini et des bibliothèques de la ville de Venise. A elles seules, les archives d’Etat couvrent mille ans d'histoire et s'étendent sur 80 kilomètres d'étagères. En deux ans, l'équipe a déjà numérisé deux millions d'écrits, de cartes et d'images. Pour cela, elle a utilisé un scanner spécialement conçu à cet effet, doté d'une table pivotante de deux mètres de large et capable de traiter simultanément plusieurs documents en format A3. Cette machine, la plus rapide au monde, numérise jusqu'à 8000 images par jour. «Nous touchons ici à de la matière noire, c'est-à-dire à des documents que très peu de personnes ont étudiés avant nous», déclare l'informaticien.

Le prof. Frédéric Kaplan (à g.) et sa collaboratrice scientifique Isabella di Lenardo. (Photo: Kellenberger Kaminski Photographie)

Des moteurs de recherche permettent de rendre accessible le matériel historique numérisé. Un système appelé Replica analyse les images et trouve, par exemple, des vues de la Place Saint-Marc, même si la perspective a changé, ou reconnaît des motifs de styles différents mais du même genre. Frédéric Kaplan montre comment, en quelques secondes, Replica identifie toutes les peintures qui représentent un élément sélectionné en amont – par exemple le garçon au pied de la Madone – et les regroupe en fonction de ces informations. Ceci est rendu possible grâce au deep learning, une technique qui a révolutionné le traitement des données ces dernières années.

Relier des sources historiques

Un deuxième moteur de recherche appelé Linked Books établit des liens entre les documents d'archive, les livres ou les articles. A l'aide d'un scanner robotisé qui tourne automatiquement les pages de livres, les chercheurs ont numérisé 3000 volumes sur Venise. Ainsi, on peut trouver toutes les notices bibliographiques dans lesquelles un document est cité ou, à l'inverse, tous les documents cités dans une source secondaire. Après avoir été testés par des historiens, ces moteurs de recherche seront accessibles au public dès 2018.

L'une des tâches les plus complexes est la reconnaissance automatique des écritures anciennes. Dans le cadre du projet européen «READ», les chercheurs ont mis au point un procédé qui permet de reconnaître des mots entiers grâce au deep learning. Des documents sont ainsi analysés et leurs principales caractéristiques – des informations comme les noms et les lieux – sont associées sous forme graphique. Elles constituent le cœur d'un réseau social qui peut être élargi de manière quasi illimitée à l'aide d'autres documents: un Facebook du passé permettant de retracer la vie d'innombrables artisans, commerçants ou fonctionnaires.

«Tout l'enjeu consiste à intégrer l'histoire dans le monde numérique», dit Frédéric Kaplan.

«Notre machine à remonter le temps va transformer la recherche en donnant accès aux sources historiques et en les démocratisant», explique Frédéric Kaplan. Selon lui, il est essentiel que les plus jeunes en particulier réalisent qu'un monde a aussi existé avant Google. Toutefois, des voix critiques s'élèvent également, qui mettent en garde contre une manipulation des données numériques ou craignent de voir les connaissances sur les ancêtres affecter notre mode de vie. «C'est là le plus grand défi: comment notre société va-t-elle réagir face à cette évolution?», s'interroge Frédéric Kaplan. Des projets similaires sont d'ores et déjà prévus à Paris, Budapest et Jérusalem. Et un consortium regroupant 15 institutions en plus de l'EPFL est candidat auprès de la Commission européenne pour le prochain programme phare concernant la construction d'une machine temporelle européenne. «Tout l'enjeu consiste à intégrer l'histoire dans le monde numérique», résume l'inventeur de la Venice Time Machine.