Un script python pour le français

J’ai écrit un petit script Python qui ajuste un texte aux règles de typographie française. Il ajoute des espaces insécables devant les signes de ponctuation, remplace les fractions par les caractères correspondants et insère les différentes ligatures. L’effet du script sur la longueur du texte est intéressant ; le nombre d’octets est généralement augmenté, car des caractères sur un octet en utf-8 sont remplacé par des caractères multi-octets. Le nombre de caractère d’un autre côté diminue, vu que plusieurs substitution remplacent plusieurs caractères par un seul (typiquement le cas des ligatures), d’un autre côté le script insère des espaces insécables avant et après les signes de ponctuation.
De toute manière, ce script est à considérer comme une expérience et pas comme un outil sérieux car de nombreux browsers sont incapables de gérer les caractères produits par ce script. L’utilisation est donc à vos propres risques.

One thought on “Un script python pour le français”

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.