Gestion informatisée des écritures anciennes: état des lieux et perspectives.

Orléans, 21-22 mai 2013
Bibliothèques virtuelles humanistes / Institut de recherche sur les Archéomatériaux

* Appel à communications *

Le développement des humanités numériquesoffre, depuis deux décennies, des perspectives stimulantes tant pour les travaux des spécialistes que pour la diffusion de leurs résultats auprès du grand public. Les projets impliquant le traitement informatisé de corpus de documents textuels ou iconographiques se multiplient. L’exploitation des  données et métadonnées ainsi produites constitue un enjeu important dont témoigne le développement d’outils et de formats d’indexation toujours plus performants. 

En amont des problèmes posés par l’indexation des données, un constat s’impose pourtant aux chercheurs: celui de l’inadéquation de la typographie numérique avec les formes graphiques présentes dans les documents anciens. Jeune technologie, l’informatique ne permet pas encore la mise en œuvre de pratiques de transcription satisfaisantes pour les textes anciens. Avant même leur indexation, les données numériques ne sont pas nécessairement codées de manière cohérente.

Si le standard Unicode entend prendre en charge l’ensemble des langues écrites, tant anciennes que modernes, les chercheurs constatent bien souvent son inadaptation aux besoins concrets de leurs travaux. Définissant le caractère comme pure entité linguistique, Unicode exclut d’emblée un grand nombre de variantes graphiques, de ligatures ou de signes abréviatifs dont la présence dans les documents originaux peut révéler une provenance, un état de langue, une pratique dont il importe de garder trace. Plusieurs domaines de recherche (tels l’étude des pratiques orthographiques, l’indexation des légendes monétaires, la transcription de documents épigraphiques, l’analyse des matériels typographiques anciens, le catalogage de manuscrits et d’imprimés…) nécessitent l’utilisation de caractères actuellement absents des codages numériques. Si le travail accompli par le consortium MUFI (Medieval Unicode Font Initiative) a permis de combler quelques-unes des lacunes dans le domaine spécifique des manuscrits médiévaux, de nombreux signes doivent encore être identifiés, codés et dessinés: 

L’identification des caractères nécessaires au traitement informatique de chaque objet d’étude est rarement menée à bien. Il importe pourtant de répertorier les caractères manquants en leur donnant une définition stricte, et en distinguant les glyphes signifiants des simples variantes graphiques.

– Le codage des caractères manquants doit être universel. Pour assurer la pérennité des
données numériques produites, il importe donc de veiller à l’harmonisation des pratiques de codage.

– Le dessin des caractères, c’est-à-dire la réalisation de polices numériques permettant l’affichage et l’impression des caractères nouvellement codés ne constitue que la partie la plus visible de l’iceberg; elle n’en est pas pour autant une étape négligeable.

En dépit de vingt années de développement des humanités numériques, et malgré les avancées décisives du consortium MUFI, le problème du codage des écritures anciennes demeure donc entier. C’est pourquoi le Centre d’Études supérieures de la Renaissance (CESR, Tours) et l’Institut de Recherche sur les Archéomatériaux (IRAMAT, Orléans) organisent les 21 et 22 mai 2013 à Orléans deux journées d’études consacrées à ces problématiques et destinées tant aux chercheurs issus des lettres, des sciences humaines et sociales, des bibliothèques ou des musées,  qu’à ceux exerçant dans le domaine du graphisme ou de l’informatique.

ThématiquesDifférentes sessions seront programmées. La liste définitive sera déterminée en fonction des propositions retenues. Nous donnons ci-dessous quelques pistes (cette liste n’étant évidemment pas limitative):
– Place des caractères anciens dans la représentation de la connaissance.
– État des lieux (1). Codages, polices: quelles technologies informatiques pour les
écritures anciennes?
– État des lieux (2). Programmes de recherches, réalisations, projets.
– Codage ou balisage?
– Que transcrire? Comment transcrire? Diversité des supports, variations graphiques
et états de langues.
– Besoins en caractères.
– Après le code, la fonte: polices existantes et polices manquantes.
Les communications, en français ou en anglais, ne devront pas excéder 30 minutes. Les actes des journées d’études feront l’objet d’une publication électronique en libre accès sur internet. Les propositions de communication pourront être adressées avant le 10 janvier 2013 par voie électronique à Rémi Jimenes et Guillaume Sarah.
Source: APILIST

Advertisements

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: