Stations de travail en ligne OnWorks Linux et Windows

Logo

Hébergement gratuit en ligne pour les postes de travail

<Précédent | Table des matières | Suivant>

un sort

Le dernier outil que nous examinerons est un sort, un correcteur orthographique interactif. Les un sort est le successeur d'un programme antérieur nommé épeler, et peut être utilisé, pour la plupart, comme remplacement instantané. Tandis que le un sort est principalement utilisé par d'autres programmes qui nécessitent une fonction de vérification orthographique, il peut également être utilisé très efficacement en tant qu'outil autonome à partir de la ligne de commande. Il a la capacité de vérifier intelligemment divers types de fichiers texte, y compris les documents HTML, les programmes C/C++, les messages électroniques et d'autres types de textes spécialisés.

Pour vérifier l'orthographe d'un fichier texte contenant de la prose simple, il peut être utilisé comme ceci :


vérification orthographique fichier texte

vérification orthographique fichier texte


De fichier texte est le nom du fichier à vérifier. Comme exemple pratique, créons un simple fichier texte nommé toto.txt contenant des fautes d'orthographe délibérées :


[moi@linuxbox ~]$ chat > ​​foo.txt

Le renard brun vif sauta sur le chien laxiste.

[moi@linuxbox ~]$ chat > ​​foo.txt

Le renard brun vif sauta sur le chien laxiste.


Ensuite, nous allons vérifier le fichier en utilisant un sort:


[moi@linuxbox ~]$ vérification orthographique foo.txt

[moi@linuxbox ~]$ vérification orthographique foo.txt


As un sort est interactif en mode vérification, nous verrons un écran comme celui-ci :



Le renard brun rapide sauté sur le chien laxy.

Le renard brun rapide sauté sur le chien laxy.


1) a sauté

2) guipé

3) compté

4) boitait

5) pimpé

J'ignore

r) Remplacer

a) Ajouter

b) Abandonner

6) mauviette

7) campé

8) bosse

9) entraver

0) umpé

I) Ignorer tout

R) Remplacer tout

l) Ajouter plus bas

x) Quitter

1) a sauté

2) guipé

3) compté

4) boitait

5) pimpé

J'ignore

r) Remplacer

a) Ajouter

b) Abandonner


?

?


image

En haut de l'écran, nous voyons notre texte avec un mot à l'orthographe suspecte mis en évidence. Au milieu, nous voyons dix suggestions orthographiques numérotées de zéro à neuf, suivies d'une liste d'autres actions possibles. Enfin, tout en bas, nous voyons une invite prête à accepter notre choix.

Si nous appuyons sur le 1 clé, un sort remplace le mot incriminé par le mot « jumped » et passe au mot mal orthographié suivant, qui est « laxy ». Si nous sélectionnons le remplacement "paresseux", un sort le remplace et se termine. Une fois que un sort a terminé, nous pouvons examiner notre dossier et constater que les fautes d'orthographe ont été corrigées :


[moi@linuxbox ~]$ chat foo.txt

Le rapide renard brun sauta par dessus le chien paresseux.

[moi@linuxbox ~]$ chat foo.txt

Le rapide renard brun sauta par dessus le chien paresseux.


Sauf indication contraire via l'option de ligne de commande --ne pas sauvegarder, un sort crée un fichier de sauvegarde contenant le texte original en ajoutant l'extension .bak au nom de fichier.

exhibant notre sed prouesse d'édition, nous allons remettre nos fautes d'orthographe afin de pouvoir réutiliser notre fichier :



[moi@linuxbox ~]$ sed -i 's/lazy/laxy/; s/jumped/jimped/' foo.txt

[moi@linuxbox ~]$ sed -i 's/lazy/laxy/; s/jumped/jimped/' foo.txt


Le sed option -i raconte sed pour modifier le fichier "sur place", ce qui signifie qu'au lieu d'envoyer la sortie modifiée vers la sortie standard, il réécrira le fichier avec les modifications appliquées. Nous voyons également la possibilité de placer plus d'une commande d'édition sur la ligne en les séparant par un point-virgule.

Ensuite, nous verrons comment un sort peut gérer différents types de fichiers texte. Utiliser un éditeur de texte tel que entrain (les aventuriers voudront peut-être essayer sed), nous allons ajouter du balisage HTML à notre fichier :



Fichier HTML mal orthographié

Le renard brun vif sauta sur le chien laxiste.

Fichier HTML mal orthographié

Le renard brun vif sauta sur le chien laxiste.


Maintenant, si nous essayons de vérifier l'orthographe de notre fichier modifié, nous rencontrons un problème. Si nous procédons ainsi :



[moi@linuxbox ~]$ vérification orthographique foo.txt

[moi@linuxbox ~]$ vérification orthographique foo.txt


nous obtiendrons ceci :



<html>

<html>



Fichier HTML mal orthographié

Fichier HTML mal orthographié



Le renard brun vif sauta sur le chien laxiste.

Le renard brun vif sauta sur le chien laxiste.




1)HTML

2) ml ml

3) html

4) Hamel

5) Hamil

6) hôtel

1)HTML

2) ml ml

3) html


J'ignore

r) Remplacer

a) Ajouter

b) Abandonner

I) Ignorer tout

R) Remplacer tout

l) Ajouter plus bas

x) Quitter

J'ignore

r) Remplacer

a) Ajouter

b) Abandonner


?

?


image

aspell verra le contenu des balises HTML comme mal orthographié. Ce problème peut être surmonté en incluant l'option de mode de vérification -H (HTML), comme ceci :


[moi@linuxbox ~]$ aspell -H vérifie foo.txt

[moi@linuxbox ~]$ aspell -H vérifie foo.txt


image

ce qui donnera ceci :




mal orthographié fichier HTML

mal orthographié fichier HTML



Le renard brun vif sauta sur le chien laxiste.

Le renard brun vif sauta sur le chien laxiste.




1) Mi épelé

2) mal orthographié

3) mal orthographié

4) Dissipée

5) épelé

J'ignore

r) Remplacer

6) Mal appliqué

7) Mal appelé

8) Respelé

9) Faute d'orthographe

0) Induit en erreur

I) Ignorer tout

R) Remplacer tout

1) Mi épelé

2) mal orthographié

3) mal orthographié

4) Dissipée

5) épelé

J'ignore

r) Remplacer


a) Ajouter

b) Abandonner

l) Ajouter plus bas

x) Quitter

a) Ajouter

b) Abandonner


?

?


image

Le code HTML est ignoré et seules les parties non marquées du fichier sont vérifiées. Dans ce mode, le contenu des balises HTML est ignoré et l'orthographe n'est pas vérifiée. Cependant, le contenu de ALT les balises, qui bénéficient de la vérification, sont vérifiées dans ce mode.


image

Remarque: Par défaut, un sort ignorera les URL et les adresses e-mail dans le texte. Ce comportement peut être remplacé par des options de ligne de commande. Il est également possible de spécifier quelles balises de balisage sont vérifiées et ignorées. Voir le un sort page de manuel pour plus de détails.


image


Meilleur système d'exploitation Cloud Computing chez OnWorks :