Il s'agit de l'indexeur de commandes qui peut être exécuté dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos nombreux postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.
PROGRAMME:
Nom
indexer - Générateur d'index de texte intégral Sphinxsearch
SYNOPSIS
indexeur [--config FICHIER DE CONFIGURATION] [--rotate] [--noprogress | --quiet] [--all | INDEX | ...]
indexeur --arrêts de construction FICHIER DE SORTIE COUNT [--config FICHIER DE CONFIGURATION] [--noprogress | --quiet]
[--tous | INDEX | ...]
indexeur --fusionner INDEX_PRINCIPAL INDEX_DELTA [--config FICHIER DE CONFIGURATION] [--rotation] [--noprogress |
--calmer]
DESCRIPTION
Sphinx est une collection de programmes qui visent à fournir une recherche plein texte de haute qualité.
indexeur est le premier des deux principaux outils du Sphinx. Invoqué depuis l'un ou l'autre
ligne de commande directement ou dans le cadre d'un script plus vaste, indexeur est seul responsable de
rassembler les données qui seront consultables.
La syntaxe d'appel pour l'indexeur est la suivante :
$ indexeur [OPTIONS] [nom d'index1 [nom d'index2 [...]]]
Essentiellement, vous listeriez les différents index possibles (que vous créeriez plus tard
disponible pour la recherche) dans sphinx.conf, donc lors de l'appel indexeur, au minimum, vous devez être
en lui indiquant quel index (ou quels index) vous souhaitez indexer.
Si sphinx.conf contenait des détails sur 2 index, monbigindex et monpetitindex, tu pourrais faire
ce qui suit:
$ indexeur mybigindex
$ indexeur monpetitindex mongrandindex
Dans le cadre du fichier de configuration, sphinx.conf, vous spécifiez un ou plusieurs index pour votre
données. Vous pourriez appeler indexeur pour réindexer l'un d'entre eux, ad hoc, ou vous pouvez lui dire de traiter
tous les index - vous n'êtes pas limité à l'appel d'un seul ou de tous à la fois, vous pouvez toujours choisir
une combinaison des index disponibles.
OPTIONS
La majorité des options pour indexeur sont donnés dans le fichier de configuration, cependant il y a
voici quelques options que vous devrez peut-être également spécifier sur la ligne de commande, car elles peuvent affecter
Comment l'indexation est effectuée. Ces options sont :
--tout
Dit indexeur pour mettre à jour chaque index répertorié dans sphinx.conf, au lieu de lister
index individuels. Ceci serait utile dans les petites configurations, ou de type cron ou
tâches de maintenance où l'ensemble de l'index sera reconstruit chaque jour, ou chaque semaine, ou
quelle que soit la période la plus appropriée.
Exemple d'utilisation:
$ indexer --config /home/myuser/sphinx.conf --all
--arrêts de construction fichier de sortie.txt NUM
Examine la source d'index, comme s'il indexait les données, et produit une liste des
termes indexés. Autrement dit, il produit une liste de tous les termes consultables.
termes qui font désormais partie de l'index. Remarque : l'index n'est pas mis à jour.
question, il traite simplement les données « comme si » il les indexait, y compris en les exécutant
requêtes définies avec sql_query_pre or requête_sql_post. outputfile.txt contiendra le
liste de mots, un par ligne, triés par fréquence, le plus fréquent en premier, et NUM
spécifie le nombre maximal de mots qui seront répertoriés ; s'il est suffisamment grand pour
englober tous les mots de l'index, seul ce nombre de mots sera renvoyé. Un tel
la liste de dictionnaires pourrait être utilisée pour les fonctionnalités de l'application client autour de « Vouliez-vous dire... »
fonctionnalité, généralement en conjonction avec --buildfreqs, Ci-dessous.
Exemple :
$ indexer monindex --buildstops word_freq.txt 1000
Cela produirait un document dans le répertoire actuel, word_freq.txt avec les 1,000 XNUMX
Mots les plus courants dans « myindex », classés par ordre décroissant de fréquence. Notez que le fichier
se rapportent au dernier index indexé lorsqu'il est spécifié avec plusieurs index ou --tout (c'est à dire
le dernier répertorié dans le fichier de configuration)
--buildfreqs
Utilisé en paire avec --arrêts de construction (et est ignoré si --arrêts de construction n'est pas spécifié). Comme
--arrêts de construction fournit la liste des mots utilisés dans l'index, --buildfreqs ajoute le
quantité présente dans l'indice, ce qui serait utile pour établir si certains
Les mots trop fréquents devraient être considérés comme des mots vides. Cela contribuera également à
développer des fonctionnalités « Vouliez-vous dire... » où vous pouvez voir à quel point un mot donné est plus courant
par rapport à un autre, similaire.
Exemple :
$ indexer monindex --buildstops word_freq.txt 1000 --buildfreqs
Cela produirait le fichier word_freq.txt comme ci-dessus, mais après chaque mot se trouverait le
nombre de fois où cela s'est produit dans l'index en question.
--config CONFIGURER, -c FICHIER DE CONFIGURATION
Utilisez le fichier fourni comme configuration. Normalement, le fichier sphinx.conf sera recherché dans le
répertoire d'installation (par exemple /usr/local/sphinx/etc/sphinx.conf s'il est installé dans
/usr/local/sphinx), suivi du répertoire actuel dans lequel vous vous trouvez lorsque vous appelez l'indexeur
depuis le shell. Ceci est particulièrement utile dans les environnements partagés où les fichiers binaires sont
installé quelque part comme /usr/local/sphinx/ mais vous souhaitez fournir aux utilisateurs le
possibilité de créer vos propres configurations Sphinx personnalisées, ou si vous souhaitez exécuter plusieurs
instances sur un seul serveur. Dans ce cas, vous pourriez leur permettre de créer leurs propres
propres fichiers sphinx.conf et les transmettre à indexeur avec cette option.
Par exemple :
$ indexer --config /home/myuser/sphinx.conf monindex
--dump-rows DOSSIER
Vide les lignes récupérées par les sources SQL dans le fichier spécifié, dans un fichier compatible MySQL
syntaxe. Les vidages résultants sont la représentation exacte des données reçues par l'indexeur.
et aider à répéter les problèmes de temps d'indexation.
--fusionner INDEX DST SRC-INDEX
Fusionner physiquement deux index. Par exemple, si vous avez un schéma principal + delta,
où l'indice principal change rarement, mais l'indice delta est reconstruit fréquemment, et
--fusionner serait utilisé pour combiner les deux. L'opération se déroule de droite à gauche - le
contenu de SRC-INDEX être examiné et physiquement combiné avec le contenu de
INDEX DST et le résultat est laissé dans INDEX DST. En pseudo-code, cela pourrait être exprimé
comme: INDEX DST += SRC-INDEX
Un exemple:
$ indexer --merge delta principal --rotate
Dans l'exemple ci-dessus, où le principal est le maître, l'index rarement modifié et le delta
est le moins fréquemment modifié, vous pouvez utiliser celui ci-dessus pour appeler indexeur à
combiner le contenu du delta dans l'index principal et faire pivoter les index.
--merge-dst-range ATTR MIN MAX
Exécutez la plage de filtres donnée lors de la fusion. Plus précisément, lorsque la fusion est appliquée à
index de destination (dans le cadre de --fusionner, et est ignoré si --fusionner n'est pas précisé),
indexeur filtrera également les documents se retrouvant dans l'index de destination, et uniquement
Les documents qui passeront par le filtre indiqué seront classés dans l'index final.
pourrait être utilisé par exemple, dans un index où il y a un attribut « supprimé », où 0
Signifie « non supprimé ». Un tel index pourrait être fusionné avec :
$ indexer --merge main delta --merge-dst-range supprimé 0 0
Tous les documents marqués comme supprimés (valeur 1) seront supprimés du document nouvellement fusionné.
l'index de destination. Il peut être ajouté plusieurs fois à la ligne de commande, pour ajouter
filtres successifs à la fusion, qui doivent tous être respectés pour qu'un document soit
faire partie de l'index final.
--merge-killlists, --merge-klists
Utilisé en paire avec --fusionner. Habituellement lors de la fusion indexeur utilise la liste de suppression de l'index source
(c'est-à-dire celui dans lequel est fusionné) comme filtre pour effacer les documents correspondants de
l'index de destination. En même temps, la liste de destruction de la destination elle-même n'est pas
touché du tout. Lors de l'utilisation --merge-killlists, (ou sa forme plus courte --merge-klists) la
indexeur ne filtrera pas les documents dst-index avec la killlist src-index, mais il fusionnera
leurs listes de victimes ensemble, donc l'index du résultat final contiendra la liste de victimes
contenant les listes de destruction des sources fusionnées.
--pas de progrès
N'affichez pas les détails de progression au fur et à mesure qu'ils se produisent ; affichez plutôt les détails de l'état final (tels que
à mesure que les documents sont indexés, la vitesse d'indexation, etc., ne sont signalées qu'à la fin de l'indexation.
indexation. Dans les cas où le script n'est pas exécuté sur une console (ou « tty »), cela
sera activé par défaut.
Exemple d'utilisation:
$ indexer --rotate --all --noprogress
--print-queries
Imprime les requêtes SQL que l'indexeur envoie à la base de données, ainsi que la connexion SQL
et les événements de déconnexion. Ceci est utile pour diagnostiquer et résoudre les problèmes liés à SQL.
sources.
--silencieux
Dit indexeur de ne rien afficher, sauf en cas d'erreur. Encore une fois, cette fonction est généralement utilisée pour
de type cron ou d'autres tâches de script dont la sortie n'est pas pertinente ou inutile, sauf
en cas d'erreur.
Exemple d'utilisation:
$ indexer --rotate --all --quiet
--tourner
Utilisé pour la rotation des index. Sauf si vous êtes dans une situation où vous pouvez effectuer la recherche.
fonctionner hors ligne sans déranger les utilisateurs, vous devrez presque certainement conserver
recherche en cours d'exécution lors de l'indexation de nouveaux documents. --tourner crée un deuxième index,
parallèle au premier (au même endroit, en incluant simplement .new dans les noms de fichiers).
Une fois terminé, indexeur travaillant XNUMX h sur XNUMX, recherché en envoyant le VUE D'ENSEMBLE signal, et recherché
tentera de renommer les index (en renommant les index existants pour inclure .old et
renommer le .new pour les remplacer), puis commencer à servir à partir des fichiers les plus récents.
En fonction du réglage de sans couture_rotation, il peut y avoir un léger retard avant de pouvoir
pour rechercher les index les plus récents.
Exemple d'utilisation:
$ indexer --rotate --all
--sighup-each
est utile lorsque vous reconstruisez de nombreux gros index et que vous souhaitez que chacun d'eux soit pivoté dans
recherché dès que possible. Avec --sighup-each, indexeur enverra un VUE D'ENSEMBLE signal à
recherché après avoir terminé avec succès le travail sur chaque index. (Le comportement par défaut est
envoyer un seul VUE D'ENSEMBLE après que tous les index aient été construits.)
--verbeux
Garantit que chaque ligne ayant causé des problèmes d'indexation (doublon, zéro ou manquant)
(ID de document ; problèmes d'E/S de champ de fichier ; etc.) seront signalés. Par défaut, cette option est activée.
est désactivé et des résumés de problèmes peuvent être signalés à la place.
Utiliser l'indexeur en ligne à l'aide des services onworks.net