Acesta este indexorul de comenzi care poate fi rulat în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS
PROGRAM:
NUME
indexer - Sphinxsearch generator de index text complet
REZUMAT
indexator [--config CONFIGFILE] [--rotate] [--noprogress | --liniște] [--toate | INDEX | ...]
indexator --oprește FISIER DE IESIRE COUNT [--config CONFIGFILE] [--noprogress | --Liniște]
[--toate | INDEX | ...]
indexator --combina MAIN_INDEX DELTA_INDEX [--config CONFIGFILE] [--rotate] [--noprogress |
--Liniște]
DESCRIERE
Sphinx este o colecție de programe care urmăresc să ofere căutare fulltext de înaltă calitate.
indexator este primul dintre cele două instrumente principale ca parte a Sphinx. Invocat fie de la
linia de comandă direct sau ca parte a unui script mai mare, indexator este singurul responsabil pentru
culegerea datelor care vor putea fi căutate.
Sintaxa de apelare pentru indexator este următoarea:
$ indexer [OPȚIUNI] [indexname1 [indexname2 [...]]]
În esență, ați enumera diferiții indici posibili (pe care i-ați face mai târziu
disponibil pentru căutare) în sphinx.conf, deci atunci când apelați indexator, ca minim trebuie să fii
spunându-i ce index (sau indici) doriți să indexați.
Dacă sphinx.conf conținea detalii pe 2 indecși, mybigindex și mysmallindex, ai putea face
următoarele:
$ indexer mybigindex
$ indexer mysmallindex mybigindex
Ca parte a fișierului de configurare, sphinx.conf, specificați unul sau mai mulți indecși pentru dvs
date. S-ar putea să suni indexator pentru a reindexa unul dintre ele, ad-hoc, sau îi puteți spune să proceseze
toate indexurile - nu vă limitați la a apela doar unul sau pe toți odată, puteți alege oricând
o combinație a indicilor disponibili.
OPŢIUNI
Majoritatea opțiunilor pentru indexator sunt date în fișierul de configurare, dar acolo
sunt câteva opțiuni pe care ar putea fi necesar să le specificați și pe linia de comandă, deoarece acestea pot afecta
modul în care se efectuează operația de indexare. Aceste opțiuni sunt:
--toate
Spune indexator pentru a actualiza fiecare index listat în sphinx.conf, în loc de listare
indici individuali. Acest lucru ar fi util în configurații mici, sau de tip cron sau
lucrări de întreținere în care întregul set de indexuri va fi reconstruit în fiecare zi, sau săptămână sau
orice perioadă este cea mai bună.
Exemplu de utilizare:
$ indexer --config /home/myuser/sphinx.conf --all
--oprește outfile.txt NUM
Examinează sursa indexului, ca și cum ar fi indexarea datelor și produce o listă cu
termeni care sunt indexați. Cu alte cuvinte, produce o listă a tuturor celor care pot fi căutate
termeni care devin parte din index. Notă; nu actualizează indexul în
întrebare, pur și simplu procesează datele „ca și cum” ar fi indexate, inclusiv rularea
interogări definite cu sql_query_pre or sql_query_post. outputfile.txt va conține fișierul
listă de cuvinte, câte unul pe rând, sortate după frecvență, cu cele mai frecvente mai întâi și NUM
specifică numărul maxim de cuvinte care vor fi listate; dacă este suficient de mare pentru a
cuprinde fiecare cuvânt din index, doar atâtea cuvinte vor fi returnate. Un astfel de
lista de dicționar ar putea fi folosită pentru caracteristicile aplicației client în jurul „Vrei să spui...”
funcționalitate, de obicei împreună cu --buildfreqs, De mai jos.
Exemplu:
$ indexer myindex --buildstops word_freq.txt 1000
Acest lucru ar produce un document în directorul curent, word_freq.txt cu 1,000
cele mai comune cuvinte din „myindex”, ordonate mai întâi după cele mai comune. Rețineți că fișierul va
se referă la ultimul index indexat atunci când este specificat cu mai mulți indecși sau --toate (de exemplu,
ultimul listat în fișierul de configurare)
--buildfreqs
Folosit in pereche cu --oprește (și este ignorat dacă --oprește nu este specificat). La fel de
--oprește furnizează lista de cuvinte folosite în index, --buildfreqs adaugă
cantitate prezentă în indice, ceea ce ar fi util pentru a stabili dacă este cert
cuvintele ar trebui considerate cuvinte oprite dacă sunt prea răspândite. De asemenea, va ajuta
dezvoltarea „Vrei să spui...” caracteristici în care poți cât de comun este un anumit cuvânt
comparativ cu altul, asemanator.
Exemplu:
$ indexer myindex --buildstops word_freq.txt 1000 --buildfreqs
Acest lucru ar produce word_freq.txt ca mai sus, totuși după fiecare cuvânt ar fi
de câte ori a apărut în indexul în cauză.
--config CONFIGRILĂ, -c CONFIGFILE
Utilizați fișierul dat ca configurație. În mod normal, va căuta sphinx.conf în fișierul
directorul de instalare (de ex./usr/local/sphinx/etc/sphinx.conf dacă este instalat în
/usr/local/sphinx), urmat de directorul curent în care vă aflați când apelați indexer
din coajă. Acesta este cel mai utilizat în mediile partajate în care sunt fișierele binare
instalat undeva, cum ar fi /usr/local/sphinx/, dar doriți să oferiți utilizatorilor
posibilitatea de a-și face propriile setări personalizate Sphinx sau dacă doriți să rulați mai multe
instanțe pe un singur server. În astfel de cazuri, le-ați putea permite să le creeze
propriile fișiere sphinx.conf și transmiteți-le către indexator cu această opțiune.
De exemplu:
$ indexer --config /home/myuser/sphinx.conf myindex
--dump-rânduri FILE
Deversează rândurile preluate de sursele SQL în fișierul specificat, într-un compatibil MySQL
sintaxă. Dumpurile rezultate sunt reprezentarea exactă a datelor primite de către indexator
și ajută la repetarea problemelor legate de timpul de indexare.
--combina DST-INDEX SRC-INDEX
Îmbinați fizic doi indici. De exemplu, dacă aveți o schemă principal+delta,
unde indicele principal se modifică rar, dar indicele delta este reconstruit frecvent și
--combina ar fi folosit pentru a combina cele două. Operația se deplasează de la dreapta la stânga - the
conținutul SRC-INDEX a fi examinat și combinat fizic cu conținutul
DST-INDEX iar rezultatul este lăsat înăuntru DST-INDEX. În pseudo-cod, ar putea fi exprimat
ca: DST-INDEX += SRC-INDEX
Un exemplu:
$ indexer --merge delta principală --rotate
În exemplul de mai sus, unde principalul este masterul, indexul rar modificat și delta
este cel mai puțin frecvent modificat, puteți folosi cel de mai sus pentru a apela indexator la
combinați conținutul deltei în indexul principal și rotiți indecșii.
--merge-dst-range ATTR MIN MAX
Rulați intervalul de filtrare dat la îmbinare. Mai exact, deoarece îmbinarea este aplicată la
index de destinație (ca parte a --combina, și este ignorat dacă --combina nu este specificat),
indexator va filtra și documentele care ajung în indexul de destinație și numai
documentele vor trece prin filtrul dat vor ajunge în indexul final. Acest
ar putea fi folosit, de exemplu, într-un index în care există un atribut „șters”, unde 0
înseamnă „neșters”. Un astfel de index ar putea fi îmbinat cu:
$ indexer --merge delta principală --merge-dst-range șters 0 0
Orice documente marcate ca șterse (valoarea 1) vor fi eliminate din documentul nou îmbinat
indice de destinație. Poate fi adăugat de mai multe ori la linia de comandă, pentru a adăuga
filtre succesive la îmbinare, toate acestea trebuie îndeplinite pentru ca un document să poată face acest lucru
devin parte a indexului final.
--merge-killlists, --merge-klists
Folosit in pereche cu --combina. De obicei la fuziune indexator folosește lista de eliminare a indexului sursă
(adică, cel care este îmbinat în) ca filtru pentru a șterge documentele care se potrivesc
indicele de destinație. În același timp, lista de ucidere a destinației în sine nu este
atins deloc. Atunci când se utilizează --merge-killlists, (sau o formă mai scurtă --merge-klists)
indexator nu va filtra documentele dst-index cu killlist src-index, dar se va îmbina
listele lor de ucidere împreună, astfel încât indexul de rezultat final va avea lista de ucidere
care conține listele de ucidere sursă îmbinate.
--nici un progres
Nu afișați detaliile progresului pe măsură ce apar; în schimb, detaliile privind starea finală (cum ar fi
ca documente indexate, viteza de indexare și așa mai departe sunt raportate doar la finalizarea
indexarea. În cazurile în care scriptul nu este rulat pe o consolă (sau „tty”), aceasta
va fi activat implicit.
Exemplu de utilizare:
$ indexer --rotate --all --noprogress
--print-queries
Imprimă interogări SQL pe care indexorul le trimite la baza de date, împreună cu conexiunea SQL
și evenimentele de deconectare. Acest lucru este util pentru a diagnostica și a remedia problemele cu SQL
surse.
--Liniște
Spune indexator să nu scoată nimic, decât dacă există o eroare. Din nou, cel mai folosit pentru
cron-type sau alte joburi script în care rezultatul este irelevant sau inutil, cu excepția
în cazul unui fel de eroare.
Exemplu de utilizare:
$ indexer --rotate --all --quiet
--roti
Folosit pentru rotirea indicilor. Dacă nu aveți situația în care puteți efectua căutarea
funcționa offline fără a deranja utilizatorii, aproape sigur va trebui să păstrați
căutarea rulează în timp ce se indexează documente noi. --roti creează un al doilea index,
paralel cu primul (în același loc, pur și simplu incluzând .new în numele fișierelor).
Odată terminat, indexator notificată cautat prin trimiterea LUMEA semnal, și cautat
va încerca să redenumească indecșii (redenumirea celor existenți pentru a include .old și
redenumirea .new pentru a le înlocui), apoi începeți să difuzați din fișierele mai noi.
În funcție de setarea de rotire_fară, poate exista o ușoară întârziere în a putea
pentru a căuta indecșii mai noi.
Exemplu de utilizare:
$ indexer --rotate --all
--sighup-fiecare
este util atunci când reconstruiți mulți indici mari și doriți ca fiecare să fie rotit în
cautat cât mai repede posibil. Cu --sighup-fiecare, indexator va trimite un LUMEA semnal către
cautat după finalizarea cu succes a lucrării la fiecare index. (Comportamentul implicit este
a trimite un singur LUMEA după ce au fost construiți toți indecșii.)
--verbos
Garantează că fiecare rând care a cauzat probleme la indexare (duplicat, zero sau lipsă
act de identitate; sau probleme de IO în câmpul fișierului; etc) vor fi raportate. În mod implicit, această opțiune
este dezactivat, iar rezumatele problemelor pot fi raportate în schimb.
Utilizați indexer online folosind serviciile onworks.net