Warning: include(/var/www/obvil/html/developpements//odt2tei/Odt.php): failed to open stream: No such file or directory in /var/www/obvil/html/developpements/doc/index.php on line 45 Warning: include(): Failed opening '/var/www/obvil/html/developpements//odt2tei/Odt.php' for inclusion (include_path='.:/usr/share/pear:/usr/share/php') in /var/www/obvil/html/developpements/doc/index.php on line 45 stylage openDocument

Styler un document ODT avec Writer §

Ce tutoriel, expose les consignes de reprise d’un document ODT (OpenDocument) issu de l’OCR de la chaîne de numérisation de l’OBVIL, en vue de préparer l’export de ce document en XML-TEI.

NB 1. On peut utiliser indifféremment OpenOffice et LibreOffice 4, SAUF cas signalés (macros, Antidote).

NB 2. Il est IMPÉRATIF de suivre ces consignes dans leur ordre d’exposition.

Raccrocher les notes §

FineReader ne réussit pas toujours à raccrocher les notes de bas de page. C’est même impossible lorsque ces notes courent sur plusieurs pages (commencent en bas d’une page pour finir en bas de la suivante).

Cette tâche est fastidieuse si les notes sont nombreuses dans le texte. À chaque point d’appel de note du texte original (source PDF), il faut insérer un appel de note de bas de page (Insertion > Note de bas de page/de fin…) et copier/coller le texte de la note en bas de page dans la nouvelle note créée.

Inutile de reprendre la numérotation originale de la note, il suffit d’utiliser la numérotation automatique.

ASTUCES :

  • Si FineReader a identifié une note comme telle (c’est rare…), un signe d’appel de note apparaît dans le flux du texte, et le contenu de la note est rejeté en toute fin de document (vous pouvez cliquer sur l’appel de note pour accéder à son contenu en bas du document). Reste donc à copier/coller le contenu de cette note pour l’insérer en tant que note de bas de page au bon endroit.
  • Pensez à utiliser la fonction de recherche (CTRL+F ou Édition > Chercher & remplacer…) pour retrouver le contenu de la note dans le document.

Raccrocher les paragraphes §

FineReader traite un fichier PDF page à page. Les paragraphes courant sur deux pages sont donc traités comme 2 paragraphes distincts à l’export. $une capture d’écran serait bienvenue pour illustrer ce cas$ Il est donc nécessaire de les « raccrocher ».

La macro1 « Paragraphes » de la bibliothèque OBVIL permet de raccrocher automatiquement la plupart de ces paragraphes. Pour faciliter le travail de correction, elle surligne les bouts « raccrochés ».

Pour la lancer la macro « Paragraphes » : Outils > Macros > Exécuter la macro…

 

 

La boîte de dialogue « Sélecteur de macro » apparaît. Il suffit d’y sélectionner la macro puis de cliquer sur le bouton « Exécuter » :

 

 

La macro a besoin de quelques secondes pour s’exécuter complètement.

ATTENTION :

  • Lancer cette macro APRÈS le raccrochage des notes (sans quoi certaines notes pourraient se retrouver dans le flux du texte).
  • Ne JAMAIS lancer cette macro une fois le travail de stylage commencé. Tous les styles de paragraphe renseignés seraient perdus.

Styler les niveaux de titre §

Le stylage des niveaux de titre (de partie, de chapitre, sous-chapitre, article, acte, scène, titre de poème, etc.) permet de hiérarchiser le contenu et de générer la table des matière.

Ce niveau de stylage est REQUIS pour tous les documents de la chaîne de numérisation de l’OBVIL.

L’objectif est de reproduire la table des matières du document source.

  • NB 1. Rétablir chaque titre sur une seule et même ligne. Les sauts de paragraphes entre les bouts de titres induisent une multiplication des titres.
  • NB 2. Passer les titres en MAJUSCULES en minuscules. Pour cela, sélectionner la chaîne de caractères à modifier puis cliquez sur Format > Modifier la casse > bASCULER LA CASSE (ou CTRL+M sur les postes configurés de l’OBVIL). Attention aux caractères accentués… $Pour quelle raison faut-il passer les titres en minuscules? Est-ce une convention?$
Table des matières du livre source
Stylage des niveaux de titre dans le document ODT

Comment utiliser les styles ? §

Il faut ouvrir la fenêtre « Styles et formatage » :

  • Format > Styles et formatage
  • F11 (Windows)
  • cmd+T (OS X)

 

 

Pour appliquer un style à un paragraphe, il suffit de placer de curseur $le curseur$ dans ce paragraphe, puis de cliquer sur le style souhaité. Dans l’exemple ci-dessus, l’application du style « Titre 3 » au titre « I. Paradoxe sur la musique » a pour effet d’inscrire ce titre dans la table des titres du navigateur (F5 ou Affichage > Navigateur). $Il faudrait préciser un peu la notion de navigateur$

Numérotation des chapitres §

Il arrive parfois qu’un niveau de titre ne soit pas repris dynamiquement dans la table des titres du navigateur. Il suffit alors de bien spécifier le style correspondant au niveau de titre attendu :

Outils > Numérotation des chapitres…

 

Outils > Numérotation des chapitres…Sélectionner le Niveau « 3 » puis le style « Titre 3 » pour faire correspondre ce style « Titre 3 » au 3e niveau de titre de la table des matières.

Titre d’ouvrage, sous-titre, intertitre, titre dans une citation §

  • Le titre de l’ouvrage n’est pas à proprement parler un niveau de titre, puisqu’il est unique (impossible de rencontrer un second titre de même niveau). On le style en « Titre principal ».
  • Un sous-titre complète le titre sous-lequel il est placé et est donc de même niveau que ce dernier. On style les sous-titres à l’aide des styles personnalisés <h1.sub> (niveau 1), <h2.sub> (niveau 2), etc. Voir plus bas pour l’utilisation des styles personnalisés.
  • Un intertitre (rare) peut venir préciser le contenu d’un paragraphe sans s’inscrire véritablement dans la hiérarchie des niveaux de titre. On le style en « Titre ».
  • Une citation peut contenir un titre (par ex. le titre d’un poème cité) : un tel titre n’est pas un niveau de titre (il ne doit pas apparaître dans la table des matières du livre). On le style donc en tant que « Citation » et on le met en valeur typographiquement pour le distinguer du reste de la citation (voir plus bas pour le stylage des citations).

Synthèse §

Type de titre Style
Titre de l’ouvrage Titre principal
Niveaux de titre Titre 1, Titre 2, Titre 3, etc.
Sous-titre Styles personnalisés <h1.sub>, <h2.sub>, <h3.sub>, etc.
Intertitre Titre
Titre dans une citation Citation + mise en forme typographique

Normalisation de la ponctuation §

La macro « Ponctuation » de la bibliothèque OBVIL permet de normaliser automatiquement l’espacement autour de la ponctuation du texte.$Je pense qu’il faudrait expliquer un petit plus cette opération. Pour des esprits profanes, ça fait un peu coup de baguette magique.$

ATTENTION : cette macro ne fonctionne qu’avec OpenOffice ; NE PAS la lancer avec LibreOffice.

Pour lancer la macro « Ponctuation » :

  • Outils > Macro > Exécuter la macro…
    Dans la boîte de dialogue qui s’ouvre, sélectionner la macro (Mes macros > Standard > OBVIL > Ponctuation) ;
    Puis cliquer sur « Exécuter ».
    Sur les macros, voir plus haut (Raccrocher les paragraphes).
  • Sur les postes configurés de l’OBVIL, il suffit de cliquer sur le bouton Ponctuation de la barre d’outils.

Relecture supervisée (Optionnel, sur les postes de l’Obvil) §

Le logiciel de correction Antidote est installé sur les postes de numérisation de l’Obvil. Un tel outil est très précieux pour une correction rapide du texte. Il n’est disponible que sous LibreOffice 4. Pour lancer la correction, il suffit de placer le curseur tout en haut du fichier à corriger pour de cliquer sur l’icône verte placée sous le menu « Fichier ».

 

 

La fenêtre du correcteur s’ouvre et sous-ligne les fautes potentielles. Le relecteur doit les corriger une à une, soit en cliquant sur les suggestions faites par Antidote au survol de l’erreur éventuelle, soit en saisissant la correction directement dans la fenêtre du correcteur. Antidote se charge de reporter la correction dans le fichier ODT ouvert.

 

 

Antidote échoue parfois (rarement) à synchroniser le texte affiché dans le correcteur avec le fichier ODT. Dans ce cas, il faut retrouver l’erreur dans le fichier ODT et la corriger directement dedans.

Styler le document avec les styles Teibook §

Nous nous appuyons sur le bon stylage des documents pour récupérer l’information sémantique à l’export des fichiers XML-TEI. Nous avons déjà vu le cas des titres. D’autres composants textuels méritent d’être stylés, tels que les citations, les vers, les strophes, les tours de parole ou les didascalie au théâtre, etc.

Un document ODT embarque une série de styles par défaut, tels que les titres de niveau (Titre 1, Titre 2, etc.) ou le style Citation. Ces styles par défaut ne suffisent certains composants textuels plus spécifiques. Un modèle de document (Teibook) maintenu dans le cadre du projet permet de disposer de ces styles.

Récupérer les styles Teibook §

Pour utiliser les styles, il faut afficher la fenêtre des styles (cf plus haut, « Comment utiliser les styles ? ») : menu Format > Styles et formatage.

Dans le bandeau supérieur de cette fenêtre des styles cliquer sur la dernière icône, puis dans le menu contextuel qui s’affiche, cliquez sur Charger les styles...

 

 

La fenêtre "Charger les styles" apparaît ; Dans la colonne "Modèles", double-cliquez sur "Livre, modèle de document" : les nouveaux styles doivent apparaître à présent dans la fenêtre des styles, parmi les Styles personnalisés (cf les filtres disponibles dans le menu déroulant en bas de la fenêtre des styles).

Pour l’utilisation de ces styles, se référer au guide de stylage.

 

TODO : penser à bien corriger les chaînes en italique : vérifier leur bonne délimitation, éviter les espace avant et après l’expression.$à expliquer davantage$