Bonjour cher lecteur,
Aujourd’hui, innovation, je vais parler de code et de bonne pratique que tout éditeur/numériseur devrait adopter pour le bien de la lecture numérique et le plaisir des lecteurs.
Faisait suite à l’article d’un lecteur pas content sur la qualité des métadonnées des eBooks (à lire ici), voici donc les métadonnées essentielles ou bienvenues dans tout eBook commercial (un peu de tolérance pour les auto édités et les eBooks personnels même si un effort serait le bienvenu). Tous ces éléments se retrouvent dans le fichier content.opf de votre eBook, et selon la méthode de travail, une interface graphique vous permet généralement de compléter/modifier ces données à souhait. Personnellement je préconise l’usage de Sigil qui permet un nombre important de métadonnées, bien au-delà de la petite liste qui va suivre.
Les essentielles :
Voici les métadonnées qui sont obligatoires, et bien entendu de préférences correctes…
- Le titre de l’ouvrage
<dc:title>La Horde du Contrevent</dc:title>
- L’auteur
<dc:creator opf:role="aut">Alain Damasio</dc:creator>
- La langue du livre
<dc:language>fr</dc:language>
- L’éditeur
<dc:publisher>La Volte</dc:publisher>
- La classification du livre
<dc:subject>Fantastique</dc:subject>
- Un résumé/4ème de couverture
<dc:description>Ils sont les vingt-trois membres de la trente-quatrième Horde. Ils ont été formés depuis l’enfance à accomplir une tâche précise, qui permettra la survie de la Horde. Car la longue ligne droite qui les mène à l’extrême Amont est dangereuse. Aucune des expéditions précédentes n’a jamais réussi à mener la quête à terme, à atteindre la source du vent. Sur un monde balayé par les rafales, les tempêtes, les chrones (des bulles de vents aux effets étranges), les voilà lancés, relatant tour à tour leurs expériences, leurs doutes, leurs espoirs.</dc:description>
- Le numéro ISBN
<dc:identifier opf:scheme="ISBN">9782917157046</dc:identifier>
- La date de publication
<dc:date opf:event="publication">2012-XX-XX</dc:date>
Ce sont là les métadonnées qui me paraissent le strict minimum pour un eBook. Ce sont, et ce n’est pas un simple hasard, les métadonnées disponibles dans Calibre, gestionnaire de bibliothèque bien connu des lecteurs. Voici une copie d’écran si tu ne connais pas ce formidable outil :
Les bienvenues :
Bien que non exploitées par les outils de gestion de bibliothèque, du moins pour le moment, il est possible d’inclure beaucoup d’autres métadonnées dans un eBook. Cette liste est bien trop longue pour toutes te les citer, mais en voici quelques-unes que j’utilise dès que possible :
- Le traducteur
<dc:contributor opf:role="trl">test</dc:contributor>
- Le créateur de la couverture
<dc:contributor opf:role="cov">Sandrine Granon</dc:contributor>
- Le créateur de l’eBook
<dc:contributor opf:role="bkp">LEC Digital Books</dc:contributor>
- L’illustrateur
- L’auteur de la préface/introduction
- …
Je t’invite à ouvrir l’éditeur de métadonnées de Sigil pour en découvrir de nombreuses autres, ainsi que le site de référence de l’IDPF
Il existe une troisième catégorie de métadonnées, celle spécifique à un outil précis. C’est le cas de Calibre, qui permet de trier les ouvrages par série avec un numéro d’ordre dans cette série. Ces métadonnées ne sont pas « standard », mais pourtant tellement utiles que je les préconise comme « essentielles », mais comme elles requièrent la manipulation du fichier content.opf, seul un numériseur expérimenté s’y risquera.
<meta content="Le Waldgänger" name="calibre:series" />
<meta content="1" name="calibre:series_index" />
<dc:title>La vérité des fous</dc:title>
Amis éditeurs, vérifiez la présence de ces métadonnées dans vos livres, l’import dans Calibre est un moyen très simple de vérification. Si ce n’est pas le cas, exigez-les de vos numériseurs, afin que nous, vos lecteurs et clients n’ayons pas à faire votre travail !
Que la puissance de l’eBook t’offre le monde !


Je suis tout à fait d’accord sur les informations proposées. Mais deux questions :
Ne serait-il pas intéressant au niveau de l’IDPF de demander un ajout de la métadonnée N° dans série ?
De même proposer la saisie d’une ou plusieurs catégories genre BISAC ou CLIL, avec une hierarchie de classification très précise ?
A envisager effectivement, bien que je soupçonne déjà pas mal de monde d’avoir remonter ce genre de remarques, il faudra que je me penche là dessus un de ces jours
Attention à deux choses :
1- Dans les chaînes contenant des caractères accentués, il n’estpas possible de rentrer les caractères eux-mêmes ni leurs équivalents en HTML ou en ASCII. Seule l’utilisation d’une interface comme celle de SIGIL semble en mesure d’importer ces caractères en les transcrivant en une espèce d’abominable charabia que cependant l’interpréteur de l’ePub sait lire… et uniquement ça… Ainsi, le "É" doit-il être marqué comme ceci : "É"… Pas à la portée de tous les cerveaux, ça !
2- Dans le même ordre d’idée, ayant importé telles quelles les lignes de code ci-dessus proposées, j’ai vu que l’OPF plantait à cause des guillemets, qui sont, dans ce billet, à la française ; il faut les remplacer partout par du guillemet brutal de clavier basique.
En gros, la quatrième de couverture ne pouvant du coup être rentrée que par une interface SIGIL ou CALIBRE, celles et ceux qui, comme moi, préfèrent tripoter leur content.opf ligne à ligne en sont pour leurs frais : à moins d’avoir la grosse science des hiéroglyphes, les é, à, è, É etc. se teransformeront en d’abominables pièges. Et voilà pourquoi pour l’instant je ne mets pas de …
LEC, pour voir si j’ai bien tout compris, je t’envoie de suite la dernière version d’Impuissant vs. Insoumis, remise à jour ce matin-même. Je n’y ai donc changé que le content, le reste étant depuis longtemps OK.
Les exemples données dans l’article proviennent du fichier OPF, certe créé en Sigil mais pris directement dans l’OPF via Notepad++, donc sans l’interface Sigil, mais je vais tester sans passer par Sigil pour la création
Ton Sigil serait il configuré en Anglais ? Ou ton PC ?
Fichier OK
Je pense que ton soucis de hiéroglyphes vient du fait que l’encodage se fait en UTF-8 classiquement et que ton éditeur ne le prend pas forcément en compte. En tout cas c’est la première piste qui me vient à l’esprit.
Balises … Très difficiles dans le choix de leur nourriture, ces petites princesses ! Quand je leur file bêtement, via Notepad ou autre, une lettre accentuée, par exemple É, ou quand je rentre son équivalent É ou É, l’interpréteur de l’ePub bloque dessus. Comme s’il y avait, dans les limbes mais extrêmement puissant, un troisième style de code, inaccessible au clavier, unique aliment qu’accepterait, dans l’OPF, la balise .
On n’a pas ces problèmes dans le NCX avec les accentués : là au moins, les &xyz; sont acceptés et lus correctement. C’est déjà ça.
Mais bon c’est que je fais tout ça via Notepad++ et PsPad. Je ne touche à Sigil que très peu.
Désolé pour mon commentaire ci-dessous : WordPress a tout avalé sans broncher, du coup tu liras une collections de É assez comique, et incompréhensible. Le texte commençant par "Balises …" : il s’agissait ici des balises DC.
Pour les noms propres (auteur, traducteur, illustrateur…), il est bienvenue d’ajouter l’attribut "opf:file-as" qui permet un classement par ordre alphabétique plus intelligent (Classez des auteurs japonais et des "Le Truc" ou "Dumas fils" et vous aurez des cauchemars. Ça donne pour l’auteur
<dc:creator opf:role=”aut” opf:file-as="Damasio, Alain">Alain Damasio</dc:creator>
Effectivement, merci de le préciser, mais là on part dans le tripatouillage manuel du code, déjà que les éditeurs sont pas capables de mettre le nom correctement…
Là, c’est du Calibre pur jus, cette ligne. Très utile parfois, cet encodeur, même s’il laisse des traces stupides qui du coup filent des boutons à l’ami LEC. Mais là, cet opf:file-as est vraiment astucieux.
Ping: C’est quoi encore celui là ? De l’importance des métadonnées [dans un ebook] | Digital bibliothèques | Scoop.it
Ping: C’est quoi encore celui là ? De l’importance des métadonnées [dans un ebook] | IPad tablettes liseuses et ebooks | Scoop.it
Ping: C’est quoi encore celui là ? De l’importance des métadonnées | Tablettes et liseuses à la bibliothèque | Scoop.it
Il me semble qu’il y a un petit problème sur une métadonnée (mais je me trompe peut-être). Selon l’IDPF, subject sert pour "arbitrary phrase or keyword" alors que type regroupe "terms describing general categories, functions, genres, or aggregation levels for content". Du coup, il me semble que le genre d’ouvrage (documentaire, essai, science-fiction, etc.) relève plus du type alors que le subject est davantage pour les mots-clés des moteurs de recherche (même si le type d’ouvrage peut tout à fait être un des subject retenus).