EnglishFrenchSpanish

Jalankan server | Ubuntu > | Fedora > |


favorit OnWorks

pengindeks - Online di Cloud

Jalankan pengindeks di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows, atau emulator online MAC OS

Ini adalah pengindeks perintah yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


pengindeks - pembuat indeks teks lengkap Sphinxsearch

RINGKASAN


pengindeks [--konfigurasi FILE KONFIGURASI] [--putar] [--tidak ada kemajuan | --tenang] [--semua | INDEKS | ...]

pengindeks --buildstops BERKAS KELUARAN COUNT [--konfigurasi FILE KONFIGURASI] [--tidak ada kemajuan | --diam]
[--semua | INDEKS | ...]

pengindeks --menggabungkan MAIN_INDEX DELTA_INDEX [--konfigurasi FILE KONFIGURASI] [--putar] [--tidak ada kemajuan |
--diam]

DESKRIPSI


Sphinx adalah kumpulan program yang bertujuan untuk menyediakan pencarian teks lengkap berkualitas tinggi.

pengindeks adalah yang pertama dari dua alat utama sebagai bagian dari Sphinx. Dipanggil dari
baris perintah secara langsung, atau sebagai bagian dari skrip yang lebih besar, pengindeks bertanggung jawab penuh atas
mengumpulkan data yang akan dicari.

Sintaks pemanggilan untuk pengindeks adalah sebagai berikut:

$ pengindeks [OPSI] [nama indeks1 [nama indeks2 [...]]]

Pada dasarnya Anda akan membuat daftar kemungkinan indeks yang berbeda (yang nantinya akan Anda buat
tersedia untuk dicari) di sphinx.conf, jadi saat menelepon pengindeks, minimal Anda harus
memberi tahu indeks (atau indeks) apa yang ingin Anda indeks.

Jika sphinx.conf berisi rincian pada 2 indeks, mybigindex serta mysmalindex, Anda bisa melakukannya
berikut:

$ pengindeks mybigindex
$ pengindeks mysmalindex mybigindex

Sebagai bagian dari file konfigurasi, sphinx.conf, Anda menentukan satu atau lebih indeks untuk
data. Anda mungkin menelepon pengindeks untuk mengindeks ulang salah satunya, ad-hoc, atau Anda dapat memintanya untuk memproses
semua indeks - Anda tidak terbatas untuk memanggil hanya satu, atau sekaligus, Anda selalu dapat memilih
beberapa kombinasi dari indeks yang tersedia.

PILIHAN


Sebagian besar pilihan untuk pengindeks diberikan dalam file konfigurasi, namun ada
adalah beberapa opsi yang mungkin perlu Anda tentukan pada baris perintah juga, karena dapat memengaruhi
bagaimana operasi pengindeksan dilakukan. Opsi-opsi ini adalah:

--semua
Memberitahu pengindeks untuk memperbarui setiap indeks yang terdaftar di sphinx.conf, alih-alih daftar
indeks individu. Ini akan berguna dalam konfigurasi kecil, atau tipe cron atau
pekerjaan pemeliharaan di mana seluruh kumpulan indeks akan dibangun kembali setiap hari, atau minggu, atau
periode apa pun yang terbaik.

Contoh penggunaan:

$ pengindeks --config /home/myuser/sphinx.conf --all

--buildstops outfile.txt NUM
Meninjau sumber indeks, seolah-olah mengindeks data, dan menghasilkan daftar
istilah yang sedang diindeks. Dengan kata lain, ini menghasilkan daftar semua yang dapat dicari
istilah yang menjadi bagian dari indeks. Catatan; itu tidak memperbarui indeks di
pertanyaan, itu hanya memproses data 'seolah-olah' itu mengindeks, termasuk menjalankan
kueri yang didefinisikan dengan sql_query_pre or sql_query_post. outputfile.txt akan berisi:
daftar kata, satu per baris, diurutkan berdasarkan frekuensi dengan yang paling sering duluan, dan NUM
menentukan jumlah maksimum kata yang akan dicantumkan; jika cukup besar untuk
mencakup setiap kata dalam indeks, hanya banyak kata yang akan dikembalikan. Misalnya
daftar kamus dapat digunakan untuk fitur aplikasi klien di sekitar "Apakah maksud Anda ..."
fungsionalitas, biasanya dalam hubungannya dengan --buildfreqs, Di bawah ini.

Contoh:

$ pengindeks myindex --buildstops word_freq.txt 1000

Ini akan menghasilkan dokumen di direktori saat ini, word_freq.txt dengan 1,000
kata yang paling umum di 'myindex', diurutkan berdasarkan yang paling umum terlebih dahulu. Perhatikan bahwa file akan
berkaitan dengan indeks terakhir yang diindeks ketika ditentukan dengan beberapa indeks atau --semua (yaitu
yang terakhir tercantum dalam file konfigurasi)

--buildfreqs
Digunakan berpasangan dengan --buildstops (dan diabaikan jika --buildstops tidak ditentukan). Sebagai
--buildstops menyediakan daftar kata yang digunakan dalam indeks, --buildfreqs menambahkan
kuantitas yang ada dalam indeks, yang akan berguna dalam menentukan apakah
kata-kata harus dianggap sebagai stopword jika terlalu lazim. Ini juga akan membantu dengan
mengembangkan fitur "Apakah maksud Anda ..." di mana Anda dapat mengetahui seberapa lebih umum kata yang diberikan
dibandingkan dengan yang lain, yang serupa.

Contoh:

$ pengindeks myindex --buildstops word_freq.txt 1000 --buildfreqs

Ini akan menghasilkan word_freq.txt seperti di atas, namun setelah setiap kata akan menjadi
berapa kali itu terjadi dalam indeks yang bersangkutan.

--config KONFIGRIASI, -c FILE KONFIGURASI
Gunakan file yang diberikan sebagai konfigurasi. Biasanya, itu akan mencari sphinx.conf di
direktori instalasi (mis./usr/local/sphinx/etc/sphinx.conf jika diinstal ke dalam
/usr/local/sphinx), diikuti oleh direktori saat ini tempat Anda berada saat memanggil pengindeks
dari cangkang. Ini paling banyak digunakan di lingkungan bersama di mana file biner berada
diinstal di suatu tempat seperti /usr/local/sphinx/ tetapi Anda ingin memberi pengguna
kemampuan untuk membuat pengaturan Sphinx kustom mereka sendiri, atau jika Anda ingin menjalankan beberapa
contoh pada satu server. Dalam kasus seperti itu, Anda dapat mengizinkan mereka untuk membuat
memiliki file sphinx.conf dan meneruskannya ke pengindeks dengan opsi ini.

Sebagai contoh:

$ pengindeks --config /home/myuser/sphinx.conf myindex

--dump-baris FILE
Membuang baris yang diambil oleh sumber SQL ke dalam file yang ditentukan, dalam MySQL yang kompatibel
sintaksis. Dump yang dihasilkan adalah representasi data yang tepat seperti yang diterima oleh pengindeks
dan membantu mengulangi masalah waktu pengindeksan.

--menggabungkan INDEKS DST SRC-INDEX
Secara fisik menggabungkan dua indeks. Misalnya jika Anda memiliki skema utama+delta,
di mana indeks utama jarang berubah, tetapi indeks delta sering dibangun kembali, dan
--menggabungkan akan digunakan untuk menggabungkan keduanya. Operasi bergerak dari kanan ke kiri - the
Isi dari SRC-INDEX diperiksa dan digabungkan secara fisik dengan isi
INDEKS DST dan hasilnya tertinggal di INDEKS DST. Dalam pseudo-code, itu mungkin diekspresikan
sebagai: INDEKS DST += SRC-INDEX

Sebuah contoh:

$ pengindeks --merge delta utama --rotate

Pada contoh di atas, di mana mainnya adalah master, indeks yang jarang dimodifikasi, dan delta
adalah yang paling jarang dimodifikasi, Anda dapat menggunakan yang di atas untuk menelepon pengindeks untuk
menggabungkan isi delta ke dalam indeks utama dan memutar indeks.

--merge-dst-range ATTR MIN MAX
Jalankan rentang filter yang diberikan saat penggabungan. Secara khusus, saat penggabungan diterapkan ke
indeks tujuan (sebagai bagian dari --menggabungkan, dan diabaikan jika --menggabungkan tidak ditentukan),
pengindeks juga akan memfilter dokumen yang berakhir di indeks tujuan, dan hanya
dokumen akan melewati filter yang diberikan akan berakhir di indeks akhir. Ini
dapat digunakan misalnya, dalam indeks di mana ada atribut 'dihapus', di mana 0
berarti 'tidak dihapus'. Indeks semacam itu dapat digabungkan dengan:

$ pengindeks --merge delta utama --merge-dst-range dihapus 0 0

Dokumen apa pun yang ditandai sebagai dihapus (nilai 1) akan dihapus dari yang baru digabungkan
indeks tujuan. Itu dapat ditambahkan beberapa kali ke baris perintah, untuk menambahkan
filter berturut-turut untuk bergabung, yang semuanya harus dipenuhi agar dokumen dapat
menjadi bagian dari indeks akhir.

--merge-killlists, --merge-klists
Digunakan berpasangan dengan --menggabungkan. Biasanya saat penggabungan pengindeks menggunakan daftar pembunuh indeks sumber
(yaitu, yang digabungkan menjadi) sebagai filter untuk menghapus dokumen yang cocok dari
indeks tujuan. Pada saat yang sama daftar pembunuhan tujuan itu sendiri tidak
tersentuh sama sekali. Ketika menggunakan --merge-killlists, (atau bentuk yang lebih pendek --merge-klists)
pengindeks tidak akan memfilter dokumen indeks-dst dengan daftar pembunuh indeks-src, tetapi akan digabungkan
daftar pembunuhan mereka bersama-sama, sehingga indeks hasil akhir akan memiliki daftar pembunuhan
berisi daftar pembunuh sumber yang digabungkan.

--tidak ada perkembangan
Jangan tampilkan detail kemajuan saat terjadi; sebagai gantinya, detail status akhir (seperti
karena dokumen diindeks, kecepatan pengindeksan dan sebagainya hanya dilaporkan pada penyelesaian
pengindeksan. Dalam kasus di mana skrip tidak dijalankan di konsol (atau 'tty'), ini
akan aktif secara default.

Contoh penggunaan:

$ pengindeks --rotate --all --noprogress

--print-queries
Mencetak kueri SQL yang dikirim pengindeks ke database, bersama dengan koneksi SQL
dan peristiwa pemutusan hubungan. Itu berguna untuk mendiagnosis dan memperbaiki masalah dengan SQL
sumber.

--diam
Memberitahu pengindeks untuk tidak mengeluarkan apa pun, kecuali jika ada kesalahan. Sekali lagi, paling banyak digunakan untuk
cron-type, atau pekerjaan skrip lain di mana output tidak relevan atau tidak perlu, kecuali
jika terjadi beberapa jenis kesalahan.

Contoh penggunaan:

$ pengindeks --rotasi --semua --tenang

--memutar
Digunakan untuk memutar indeks. Kecuali Anda memiliki situasi di mana Anda dapat melakukan pencarian
berfungsi offline tanpa mengganggu pengguna, Anda hampir pasti harus tetap
pencarian berjalan saat mengindeks dokumen baru. --memutar membuat indeks kedua,
sejajar dengan yang pertama (di tempat yang sama, cukup sertakan .new di nama file).
Setelah selesai, pengindeks diberitahukan mencari melalui pengiriman SIGHUP sinyal, dan mencari
akan mencoba mengganti nama indeks (mengganti nama yang sudah ada untuk memasukkan .old dan
mengganti nama .new untuk menggantikannya), dan kemudian mulai melayani dari file yang lebih baru.
Tergantung pada pengaturan mulus_rotasi, mungkin ada sedikit keterlambatan untuk bisa
untuk mencari indeks yang lebih baru.

Contoh penggunaan:

$ pengindeks --putar --semua

--sighup-each
berguna ketika Anda membangun kembali banyak indeks besar, dan ingin masing-masing dirotasi menjadi
mencari secepat mungkin. Dengan --sighup-each, pengindeks akan mengirim SIGHUP sinyal ke
mencari setelah berhasil menyelesaikan pekerjaan pada setiap indeks. (Perilaku default adalah
untuk mengirim satu SIGHUP setelah semua indeks dibuat.)

--verbose
Menjamin bahwa setiap baris yang menyebabkan masalah pengindeksan (duplikat, nol, atau hilang
dokumen identitas; atau file bidang IO masalah; dll) akan dilaporkan. Secara default, opsi ini
nonaktif, dan ringkasan masalah dapat dilaporkan sebagai gantinya.

Gunakan pengindeks online menggunakan layanan onworks.net


Ad


Ad