Présentation

  • Développeurs

    La conception et le développement de la plateforme sont réalisés par une équipe d'étudiants en 4INFO à l'INSA Rennes.

  • Client

    Les archives départementales d'Ille et Vilaine numérisent d'énormes quantités de documents pour les mettre à disposition du public.

  • Partenaire

    L'équipe IntuiDoc (Intuitive User Interaction for Document) développe des outils d’analyse et reconnaissance de documents manuscrits numérisés.

  • Partenaire

    Doptim est une start up bretonne spécialisée dans l’analyse de données et les technologies Big Data. Elle travaille notamment sur un produit qui permettra permettra aux généalogistes de gagner du temps dans la fouille et le décryptage fastidieux de millions de documents numérisés.

Contexte

Les archives départementales d'Ille et Vilaine ont pour mission de garder une trace des documents du département et de les mettre à disposition du public. Pour faire face au très grand volume de données (40km linéaires d'archives) ainsi qu'à la grande diversité de documents, les archives ont engagé une grande campagne de numérisation. Le projet Gutemberg a été initié pour développer une plateforme collaborative permettant la mise à disposition du public de ces documents numérisés, et leur recherche par contenu.

  • Volume Gros volume de données
  • Pluralité Types de documents très différents
  • Consultation Mise à disposition du public
  • Ergonomie Consultation et recherche simple
  • Collaboratif Partager les connaissances

L'application

Le projet Gutemberg est une application web permettant de consulter des documents anciens numérisés, mis à disposition par les archives départementales d'Ille et Vilaine. L'application est centrée sur la consultation grâce à son interface permettant une utilisation simplifiée sur ordinateurs, smartphones et tablettes.

Gutemberg est une application web centrée sur la consultation de documents de manière simple et ergonomique afin qu’un maximum d’acteurs de conservation du patrimoine puissent contribuer à l’enrichissement de la plateforme. Nous proposons une solution généraliste, applicable à tous types de documents, et collaborative en accordant une part importante aux annotations. La contribution d’utilisateurs permettra de compléter des informations manquantes là où un outil de reconnaissance de caractères n’aurait pas ou mal interprété du texte à cause d’une écriture manuscrite peu lisible ou de l’emploi de vocabulaire particulier. Ces données seront précieuses pour effectuer des recherches par mots clé sur les documents.

La généricité du stockage permettra à des acteurs comme Doptim d’exploiter facilement le contenu des documents de la plateforme à des fins généalogiques par exemple. C’est pour ce type d’applications que l’intérêt de cette plateforme se justifie : une simple requête permettrait d’éviter des heures de fouille de registres aux archives.

Finies les longues heures de recherche entre les rayons des archives départementales. L’outil de recherche sert à obtenir de façon rapide et efficace les documents souhaités par l’utilisateur. L'application propose également un outil de recherche avancée qui permet de spécifier les critères de la requête.

Gutemberg est une application multi-documents, elle permet donc de mettre à disposition du public un grand nombre de documents de tous types : presse ancienne, registre matricule, décret de naturalisation ou encore registre paroissiaux.

Le choix d’une interface responsive et épurée fait de Gutemberg un outil élégant pour la consultation de documents aux tailles variables. L'utilisateur peut consulter, annoter ou simplement lire un document, que ce soit via une souris ou un appareil tactile.

Le système d'annotation fait de Gutemberg une application collaborative, permettant de partager et de confronter des interprétations différentes d'un même document et d'offrir ainsi plusieurs lectures possibles à l'utilisateur.

L'application permet à tout lecteur de s'enregistrer pour commencer à collaborer au projet en proposant ses propres annotations. Ces dernières seront alors visibles par le reste des utilisateurs lors de la consultation de document.

Le système d'utilisateur de Gutemberg permet aux archives d'offrir un véritable aspect collaboratif aux lecteurs tout en gardant un système souple permettant, via des modérateurs et des administrateurs, de gérer cette communauté très facilement. Une interface administrateur intuitive permet aux administrateurs de gérer ces comptes utilisateurs, l'ajout de nouveaux documents et les formats de fiches d'annotation.

Gutemberg a été pensée pour supporter un grand nombre de documents, et utilise donc la base de données NoSQL MongoDB ou ou encore le moteur d'indexation et de recherche ElasticSearch.

L'Équipe

 
 

Nolwenn

 

Clément

 
 

Lucas

 

Maxime