Lister les mots mal orthographiés dans un texte avec Aspell
La commande list
du programme Aspell lit l’entrée standard et affiche la liste des mots mal orthographiés qui s’y trouvent :
$ echo "La Honte cheminait sur un cheuval pourit." | aspell list
cheuval
pourit
En redirigeant la sortie de cette commande vers sort
puis uniq -c
, on obtient une liste des différents mots du texte, dans laquelle chacun est précédé de son nombre d’occurrences :
$ echo "Karénine Karénine Karénine Karenine Karénine" | aspell list | sort | uniq -c
1 Karenine
4 Karénine
On repère au premier coup d’œil qu’une variante sans accent de Karénine
s’est glissée dans notre texte, et qu’il faut unifier la graphie de ce nom.
Pour imprimer la liste disposée en colonnes :
< fichier aspell list | sort | uniq -c | column | lpr
Le dictionnaire utilisé pour les vérifications est celui de la langue définie dans les paramètres régionaux. Pour changer la langue sans toucher aux paramètres, utiliser l’option -l
ou --lang
:
$ echo "dog chien horse cheval" | aspell list
dog
horse
$ echo "dog chien horse cheval" | aspell list --lang=en
chien
cheval