İngilizceFransızcaİspanyolca

Sunucuları çalıştırın | Ubuntu > | Fedora > |


OnWorks favicon'u

dizin oluşturucu - Bulutta Çevrimiçi

OnWorks ücretsiz barındırma sağlayıcısında dizin oluşturucuyu Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü üzerinden çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü gibi birden çok ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen komut dizin oluşturucudur.

PROGRAM:

ADI


dizin oluşturucu - Sphinxsearch tam metin dizin oluşturucu

SİNOPSİS


dizin oluşturucu [--yapılandırma YAPILANDIRMA DOSYASI] [--döndür] [--progress | --sessiz] [--tümü | INDEX | ...]

dizin oluşturucu --buildstops ÇIKTI DOSYASI COUNT [--yapılandırma YAPILANDIRMA DOSYASI] [--ilerleme yok | --sessizlik]
[--tümü | INDEX | ...]

dizin oluşturucu --birleştirmek MAIN_INDEX DELTA_INDEX [--yapılandırma YAPILANDIRMA DOSYASI] [--döndür] [--progress |
--sessizlik]

TANIM


Sphinx, yüksek kaliteli tam metin araması sağlamayı amaçlayan bir programlar topluluğudur.

dizin oluşturucu Sfenks'in bir parçası olan iki temel araçtan ilkidir. Her ikisinden de çağrılır
doğrudan komut satırı veya daha büyük bir komut dosyasının parçası olarak, dizin oluşturucu sadece sorumludur
aranabilir olacak verileri toplamak.

Dizin oluşturucu için çağrı sözdizimi aşağıdaki gibidir:

$ indeksleyici [SEÇENEKLER] [indexname1 [indexname2 [...]]]

Esasen farklı olası dizinleri listelersiniz (daha sonra
aranabilir) sfenks.conf dosyasında, yani arama yaparken dizin oluşturucu, minimum olarak olmanız gerekir
hangi dizini (veya dizinleri) dizine eklemek istediğinizi söyleyin.

sfenks.conf 2 dizinle ilgili ayrıntıları içeriyorsa, mybigindex ve mysmallindexyapabilirsin
şu:

$ dizin oluşturucu mybigindex
$ dizin oluşturucu mysmallindex mybigindex

Yapılandırma dosyası sfenx.conf'un bir parçası olarak, dosyanız için bir veya daha fazla dizin belirtirsiniz.
veri. arayabilirsin dizin oluşturucu bunlardan birini geçici olarak yeniden indekslemek için veya işlemesini söyleyebilirsiniz
tüm dizinler - yalnızca birini veya hepsini aynı anda çağırmakla sınırlı değilsiniz, her zaman seçebilirsiniz
mevcut dizinlerin bazı kombinasyonları.

SEÇENEKLER


için seçeneklerin çoğunluğu dizin oluşturucu yapılandırma dosyasında verilmiştir, ancak orada
etkileyebilecekleri için komut satırında belirtmeniz gerekebilecek bazı seçeneklerdir.
indeksleme işlemi nasıl yapılır. Bu seçenekler şunlardır:

--herşey
Söyler dizin oluşturucu listelemek yerine sfenx.conf'ta listelenen her dizini güncellemek için
bireysel indeksler Bu, küçük konfigürasyonlarda veya cron tipinde veya
tüm dizin kümesinin her gün veya hafta yeniden oluşturulacağı bakım işleri veya
hangi dönem en iyisidir.

Örnek kullanım:

$ dizin oluşturucu --config /home/myuser/sphinx.conf --all

--buildstops outfile.txt NUM
İndeks kaynağını, verileri indeksliyormuş gibi gözden geçirir ve bir liste üretir.
indekslenen terimler. Başka bir deyişle, aranabilir tüm öğelerin bir listesini üretir.
Endeksin bir parçası haline gelen terimler. Not; içindeki dizini güncellemez
soru, verileri çalıştırmak da dahil olmak üzere dizine alıyormuş gibi 'sanki' işler
ile tanımlanan sorgular sql_query_pre or sql_query_post. outputfile.txt içerecektir
her satırda bir tane olacak şekilde, sıklığa göre en sık ilk sırada olacak şekilde sıralanmış kelimelerin listesi ve NUM
listelenecek maksimum kelime sayısını belirtir; yeterince büyükse
dizindeki her kelimeyi kapsar, sadece o kadar kelime döndürülür. böyle bir
sözlük listesi, "Şunu mu demek istediniz..." etrafındaki istemci uygulama özellikleri için kullanılabilir.
işlevsellik, genellikle birlikte --buildfreqs, Aşağıda.

Örnek:

$ dizin oluşturucu myindex --buildstops word_freq.txt 1000

Bu, geçerli dizinde, 1,000 ile word_freq.txt bir belge üretecektir.
'myindex' içindeki en yaygın kelimeler, en yaygın olanı ilk sıraya göre sıralanır. Dosyanın olacağını unutmayın
birden çok dizinle belirtildiğinde dizine eklenen son dizine aittir veya --herşey (yani
yapılandırma dosyasında listelenen sonuncusu)

--buildfreqs
Ile çift olarak kullanılır --buildstops (ve varsa yoksayılır --buildstops belirtilmemiştir). Olarak
--buildstops dizin içinde kullanılan kelimelerin listesini sağlar, --buildfreqs ekler
Endekste mevcut olan miktar, belirli olup olmadığının belirlenmesinde faydalı olacaktır.
kelimeler çok yaygınsa, kelimelerin durdurulması düşünülmelidir. Ayrıca yardımcı olacaktır
Belirli bir kelimeyi ne kadar daha yaygın hale getirebileceğiniz "Bunu mu demek istediniz..." özelliklerini geliştirmek
bir başkasıyla, benzer olanla karşılaştırıldığında.

Örnek:

$ dizin oluşturucu myindex --buildstops word_freq.txt 1000 --buildfreqs

Bu, yukarıdaki gibi word_freq.txt dosyasını üretecektir, ancak her bir Word'den sonra
söz konusu dizinde meydana gelme sayısı.

--config YAPILANDIRMA, -c YAPILANDIRMA DOSYASI
Verilen dosyayı yapılandırma olarak kullanın. Normalde, sfenx.conf'u aşağıdaki dosyada arayacaktır.
kurulum dizini (örn./usr/local/sphinx/etc/sphinx.conf
/usr/local/sphinx), ardından dizin oluşturucuyu çağırırken içinde bulunduğunuz mevcut dizin
kabuğundan. Bu, ikili dosyaların bulunduğu paylaşılan ortamlarda en çok kullanılır.
/usr/local/sphinx/ gibi bir yere kuruldu ancak kullanıcılara
kendi özel Sfenks kurulumlarını yapma yeteneği veya birden fazla çalıştırmak istiyorsanız
tek bir sunucudaki örnekler. Bu gibi durumlarda, kendi tasarımlarını oluşturmalarına izin verebilirsiniz.
sfenx.conf dosyalarına sahip olun ve bunları dizin oluşturucu Bu seçenek ile.

Örneğin:

$ dizin oluşturucu --config /home/myuser/sphinx.conf myindex

--dump-satırları DOSYA
SQL kaynakları tarafından getirilen satırları MySQL uyumlu bir dosyada belirtilen dosyaya döker
sözdizimi. Ortaya çıkan dökümler, dizin oluşturucu tarafından alınan verilerin tam temsilidir
ve indeksleme zamanı sorunlarının tekrarlanmasına yardımcı olur.

--birleştirmek DST-INDEX SRC-INDEX
İki dizini fiziksel olarak birleştirin. Örneğin, bir ana+delta şemanız varsa,
ana dizinin nadiren değiştiği, ancak delta dizininin sık sık yeniden oluşturulduğu ve
--birleştirmek ikisini birleştirmek için kullanılacaktır. İşlem sağdan sola hareket eder -
içeriği SRC-INDEX incelenmesi ve içeriği ile fiziksel olarak birleştirilmesi
DST-INDEX ve sonuç bırakılır DST-INDEX. Sözde kodda, ifade edilebilir
olarak: DST-INDEX += SRC-INDEX

Bir örnek:

$ dizin oluşturucu -- ana deltayı birleştir -- döndür

Ana öğenin ana, nadiren değiştirilen dizin ve delta olduğu yukarıdaki örnekte
daha az sıklıkta değiştirilmiş olanıdır, aramak için yukarıdakileri kullanabilirsiniz. dizin oluşturucu için
deltanın içeriğini ana dizinde birleştirin ve dizinleri döndürün.

--merge-dst-aralığı ATTR MIN MAX
Birleştirme sırasında verilen filtre aralığını çalıştırın. Özellikle, birleştirme uygulandığında
hedef dizini (bir parçası olarak --birleştirmek, ve eğer yoksayılır --birleştirmek belirtilmemiş),
dizin oluşturucu ayrıca hedef dizinde biten belgeleri de filtreler ve yalnızca
Belgeler verilen filtreden geçecek ve son dizinde son bulacaktır. Bu
örneğin, 'silinmiş' bir özniteliğin olduğu bir dizinde kullanılabilir, burada 0
'silinmedi' anlamına gelir. Böyle bir dizin aşağıdakilerle birleştirilebilir:

$ dizin oluşturucu --merge ana delta --merge-dst-range silindi 0 0

Silinmiş olarak işaretlenen tüm belgeler (1 değeri) yeni birleştirilmiş belgeden kaldırılacaktır.
hedef indeksi. Eklemek için komut satırına birkaç kez eklenebilir.
birleştirmeye yönelik ardışık filtreler, bir belgenin geçerli olabilmesi için tümünün karşılanması gerekir.
nihai endeksin bir parçası olun.

--birleştirme öldürücüler, --merge-klists
Ile çift olarak kullanılır --birleştirmek. Genellikle birleştirirken dizin oluşturucu kaynak dizininin kill listesini kullanır
(yani, birleştirilmiş olan) eşleşen dokümanları silmek için filtre olarak
hedef indeksi. Aynı zamanda, hedefin kendisinin öldürme listesi
hiç dokundu. Kullanırken --birleştirme öldürücüler, (veya daha kısa biçimi --merge-klists)
dizin oluşturucu dst-index belgelerini src-index killlist ile filtrelemeyecek, ancak birleşecek
öldürme listeleri birlikte, bu nedenle nihai sonuç indeksi öldürme listesine sahip olacak
birleştirilmiş kaynak öldürme listelerini içerir.

--ilerleme yok
İlerleme ayrıntılarını oluştukları anda görüntülemeyin; bunun yerine, nihai durum ayrıntıları (ör.
belgeler dizine eklendiğinden, dizin oluşturma hızı vb. yalnızca sürecin tamamlanmasıyla rapor edilir.
indeksleme. Komut dosyasının bir konsolda (veya 'tty') çalıştırılmadığı durumlarda, bu
varsayılan olarak açık olacaktır.

Örnek kullanım:

$ dizin oluşturucu --döndür --hepsi --noprogress

--print-sorgular
Dizin oluşturucunun veritabanına gönderdiği SQL sorgularını SQL bağlantısıyla birlikte yazdırır
ve kopukluk olayları. SQL ile ilgili sorunları teşhis etmek ve düzeltmek için kullanışlıdır.
kaynaklar.

--sessizlik
Söyler dizin oluşturucu bir hata olmadıkça, hiçbir şey çıkarmamak. Yine en çok kullanılan
cron türü veya çıktının alakasız veya gereksiz olduğu diğer komut dosyası işleri dışında
bir tür hata durumunda.

Örnek kullanım:

$ indeksleyici --rotate --all --quiet

--döndür
İndeksleri döndürmek için kullanılır. Aramayı yapabileceğiniz bir durumunuz yoksa
kullanıcıları rahatsız etmeden çevrimdışı çalışırsanız, neredeyse kesinlikle
yeni belgeleri indekslerken arama çalışıyor. --döndür ikinci bir dizin oluşturur,
birincisine paralel (aynı yerde, dosya adlarına basitçe .new dahil).
Tamamlandığında, dizin oluşturucu bildirir arandı göndererek GÖRÜŞ sinyal ve arandı
dizinleri yeniden adlandırmaya çalışacak (mevcut olanları .old ve
.new'i değiştirmek için yeniden adlandırın) ve ardından daha yeni dosyalardan sunmaya başlayın.
ayarına bağlı olarak sorunsuz_döndür, yapabilmekte hafif bir gecikme olabilir
daha yeni dizinleri aramak için.

Örnek kullanım:

$ dizin oluşturucu --döndür -- tüm

--iç çekme-her biri
birçok büyük dizini yeniden oluştururken ve her birinin döndürülmesini istediğinizde kullanışlıdır.
arandı en kısa sürede. İle birlikte --iç çekme-her biri, dizin oluşturucu gönderecek GÖRÜŞ sinyal
arandı her indeks üzerindeki çalışmayı başarıyla tamamladıktan sonra. (Varsayılan davranış
tek göndermek GÖRÜŞ tüm dizinler oluşturulduktan sonra.)

--ayrıntılı
Dizine ekleme sorunlarına neden olan her satırın (yinelenen, sıfır veya eksik)
belge kimliği; veya dosya alanı IO sorunları; vb) bildirilecektir. Varsayılan olarak, bu seçenek
kapalıdır ve bunun yerine sorun özetleri bildirilebilir.

onworks.net hizmetlerini kullanarak dizin oluşturucuyu çevrimiçi kullanın


Ad


Ad