Lister les mots mal orthographiés dans un texte avec Aspell

La commande list du programme Aspell lit l’entrée standard et affiche la liste des mots mal orthographiés qui s’y trouvent :

$ echo "La Honte cheminait sur un cheuval pourit." | aspell list
cheuval
pourit

En redirigeant la sortie de cette commande vers sort puis uniq -c, on obtient une liste des différents mots du texte, dans laquelle chacun est précédé de son nombre d’occurrences :

$ echo "Karénine Karénine Karénine Karenine Karénine" | aspell list | sort | uniq -c
     1 Karenine
     4 Karénine

On repère au premier coup d’œil qu’une variante sans accent de Karénine s’est glissée dans notre texte, et qu’il faut unifier la graphie de ce nom.

Pour imprimer la liste disposée en colonnes :

< fichier aspell list | sort | uniq -c | column | lpr

Le dictionnaire utilisé pour les vérifications est celui de la langue définie dans les paramètres régionaux. Pour changer la langue sans toucher aux paramètres, utiliser l’option -l ou --lang :

$ echo "dog chien horse cheval" | aspell list
dog
horse
$ echo "dog chien horse cheval" | aspell list --lang=en
chien
cheval