[Haskell-fr] [Parsec] Analyser de l'UTF-8 ?

Stephane Bortzmeyer stephane+haskell-fr at bortzmeyer.org
Wed Jan 10 16:30:28 EST 2007


J'ai un programme (http://www.cosmogol.fr/shadok.html) qui utilise
Parsec pour l'analyse syntaxique. Le langage qu'il analyse est en
ASCII pur. Maintenant, des utilisateurs réclament de l'Unicode (encodé
en UTF-8).

Quelqu'un a déjà essayé ? Il faut pouvoir lire l'UTF-8 depuis Haskell
et pouvoir définir une grammaire avec de l'Unicode (voir
http://www.w3.org/TR/REC-xml/#NT-Letter pour un joli exemple : c'est
la liste des caractères légaux pour un identifiant XML).

Quelques références dont je ne sais pas ce qu'elles valent (on note
qu'il n'y a rien sur Parsec) :

http://www.haskell.org/pipermail/haskell-i18n/2004-February/000127.html
http://en.wikibooks.org/wiki/User:Newhoggy/UTF8_for_Haskell

http://sophos.berkeley.edu/macfarlane/pandoc/ semble savoir faire tout
ça, faut que je lise le source.


More information about the Haskell-fr mailing list