Scanner de livres, piloté par un opérateur qui tourne les pages.
OCR (reconnaissance des caractères), zones et corrections nécessitant le recours à l'image.
Structuration et stylage avec un traitement de textes.
Structuration et stylage avec un traitement de textes.
Texte structuré avec des styles (notes, chapitrage)
Validation et correction du XML/TEI généré automatiquement.
écrans
(HTML, epub)
Labex OBVIL, chaîne de numérisation
livre
Scanner à chargeur pour livres dont on peut sacrifier la reliure
Images de pages pour reconnaissance des caractères (OCR)
Obtenir un texte qui ne nécessite plus le recours aux images pour être compris.
Transformation automatique d’odt vers TEI