นี่คือตัวสร้างดัชนีคำสั่งที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
ตัวสร้างดัชนี - Sphinxsearch ตัวสร้างดัชนีตัวเต็ม
เรื่องย่อ
ตัวทำดัชนี [--การกำหนดค่า กำหนดค่า] [--หมุน] [--noprogress | --เงียบ] [--ทั้งหมด | ดัชนี | ...]
ตัวทำดัชนี --buildstops ผลลัพธ์ COUNT [--การกำหนดค่า กำหนดค่า] [--noprogress | --เงียบ]
[--ทั้งหมด | ดัชนี | ...]
ตัวทำดัชนี --ผสาน MAIN_INDEX DELTA_INDEX [--การกำหนดค่า กำหนดค่า] [--หมุน] [--noprogress |
--เงียบ]
DESCRIPTION
สฟิงซ์คือชุดของโปรแกรมที่มีจุดมุ่งหมายเพื่อให้การค้นหาข้อความแบบเต็มคุณภาพสูง
ตัวทำดัชนี เป็นเครื่องมือหลักแรกในสองเครื่องมือหลักที่เป็นส่วนหนึ่งของสฟิงซ์ เรียกจาก
บรรทัดคำสั่งโดยตรงหรือเป็นส่วนหนึ่งของสคริปต์ที่ใหญ่กว่า ตัวทำดัชนี เป็นผู้รับผิดชอบแต่เพียงผู้เดียวสำหรับ
รวบรวมข้อมูลที่จะค้นหาได้
ไวยากรณ์การโทรสำหรับตัวทำดัชนีมีดังนี้:
$ ตัวทำดัชนี [ตัวเลือก] [indexname1 [indexname2 [...]]]
โดยพื้นฐานแล้วคุณจะต้องแสดงรายการดัชนีที่เป็นไปได้ต่างๆ (ซึ่งคุณจะสร้างในภายหลัง
สามารถค้นหาได้) ใน sphinx.conf ดังนั้นเมื่อโทร ตัวทำดัชนีอย่างน้อยคุณต้องเป็น
บอกว่าคุณต้องการสร้างดัชนีใด (หรือดัชนี)
หาก sphinx.conf มีรายละเอียด 2 ดัชนี mybigindex และ mysmallindex.php, คุณทำได้
ต่อไปนี้:
$ ตัวทำดัชนี mybigindex
$ ตัวทำดัชนี mysmallindex mybigindex
เป็นส่วนหนึ่งของไฟล์การกำหนดค่า sphinx.conf คุณระบุดัชนีอย่างน้อยหนึ่งรายการสำหรับ your
ข้อมูล. คุณอาจจะเรียก ตัวทำดัชนี เพื่อสร้างดัชนีใหม่ เฉพาะกิจ หรือคุณสามารถบอกให้ดำเนินการได้
ดัชนีทั้งหมด - คุณไม่ได้จำกัดการโทรเพียงรายการเดียวหรือทั้งหมดในครั้งเดียว คุณสามารถเลือกได้เสมอ
การรวมกันของดัชนีที่มีอยู่
OPTIONS
ตัวเลือกส่วนใหญ่สำหรับ ตัวทำดัชนี จะได้รับในไฟล์การกำหนดค่าอย่างไรก็ตามมี
เป็นตัวเลือกบางอย่างที่คุณอาจต้องระบุในบรรทัดคำสั่งเช่นกัน เนื่องจากอาจส่งผลกระทบได้
วิธีดำเนินการจัดทำดัชนี ตัวเลือกเหล่านี้คือ:
--ทั้งหมด
บอก ตัวทำดัชนี เพื่ออัปเดตทุกดัชนีที่ระบุไว้ใน sphinx.conf แทนที่จะแสดงรายการ
ดัชนีส่วนบุคคล สิ่งนี้จะมีประโยชน์ในการกำหนดค่าขนาดเล็กหรือ cron-type หรือ
งานบำรุงรักษาที่ทั้งชุดดัชนีจะถูกสร้างขึ้นใหม่ในแต่ละวัน หรือสัปดาห์ หรือ
ช่วงไหนดีที่สุด
ตัวอย่างการใช้งาน:
$ ตัวสร้างดัชนี --config /home/myuser/sphinx.conf --all
--buildstops outfile.txt NUM
ตรวจสอบแหล่งที่มาของดัชนี ราวกับว่ากำลังสร้างดัชนีข้อมูล และสร้างรายการของ
คำศัพท์ที่กำลังจัดทำดัชนี กล่าวอีกนัยหนึ่งก็คือมันสร้างรายการของสิ่งที่ค้นหาได้ทั้งหมด
คำศัพท์ที่กลายเป็นส่วนหนึ่งของดัชนี บันทึก; มันไม่ได้อัปเดตดัชนีใน
คำถาม มันเพียงประมวลผลข้อมูล 'ราวกับว่า' เป็นการจัดทำดัชนี รวมถึงการเรียกใช้
คำค้นหาที่กำหนดด้วย sql_query_pre or sql_query_post. outputfile.txt จะมี
รายการคำ หนึ่งคำต่อหนึ่งบรรทัด เรียงตามความถี่ที่มีบ่อยที่สุดก่อน และ NUM
ระบุจำนวนคำสูงสุดที่จะแสดง ถ้าใหญ่พอที่จะ
ห้อมล้อมทุกคำในดัชนี เฉพาะว่าหลายคำเท่านั้นที่จะถูกส่งกลับ อา
รายการพจนานุกรมสามารถใช้สำหรับคุณสมบัติแอปพลิเคชันไคลเอนต์รอบ ๆ "คุณหมายถึง ... "
ฟังก์ชันต่างๆ มักจะใช้ร่วมกับ --buildfreqsด้านล่าง
ตัวอย่าง:
$ ตัวสร้างดัชนี myindex --buildstops word_freq.txt 1000
สิ่งนี้จะสร้างเอกสารในไดเร็กทอรีปัจจุบัน word_freq.txt ที่มี 1,000
คำที่พบบ่อยที่สุดใน 'myindex' โดยเรียงลำดับจากคำที่พบบ่อยที่สุดก่อน โปรดทราบว่าไฟล์จะ
เกี่ยวข้องกับดัชนีสุดท้ายที่จัดทำดัชนีเมื่อระบุด้วยดัชนีหลายรายการหรือ --ทั้งหมด (เช่น
รายการสุดท้ายที่อยู่ในไฟล์กำหนดค่า)
--buildfreqs
ใช้คู่กับ --buildstops (และจะถูกละเว้นถ้า --buildstops ไม่ได้ระบุไว้) เนื่องจาก
--buildstops แสดงรายการคำที่ใช้ในดัชนี --buildfreqs เพิ่มไฟล์
ปริมาณที่มีอยู่ในดัชนีซึ่งจะเป็นประโยชน์ในการกำหนดว่าแน่นอน
คำควรถือเป็นคำหยุดหากมีการแพร่หลายเกินไป อีกทั้งยังช่วยในเรื่อง
การพัฒนาคุณลักษณะ "คุณหมายถึง ... " ซึ่งคุณสามารถใช้คำที่กำหนดได้ทั่วไปมากขึ้น
เทียบกับอีกอันที่คล้ายคลึงกัน
ตัวอย่าง:
$ ตัวสร้างดัชนี myindex --buildstops word_freq.txt 1000 --buildfreqs
สิ่งนี้จะสร้าง word_freq.txt ตามด้านบน อย่างไรก็ตาม หลังจากแต่ละคำจะเป็น
จำนวนครั้งที่เกิดขึ้นในดัชนีที่เป็นปัญหา
--การกำหนดค่า กำหนดค่า, -c กำหนดค่า
ใช้ไฟล์ที่กำหนดเป็นการกำหนดค่า โดยปกติมันจะมองหา sphinx.conf ใน
ไดเร็กทอรีการติดตั้ง (เช่น/usr/local/sphinx/etc/sphinx.conf หากติดตั้งลงใน
/usr/local/sphinx) ตามด้วยไดเร็กทอรีปัจจุบันที่คุณอยู่เมื่อเรียก indexer
จากเปลือก นี่เป็นการใช้งานส่วนใหญ่ในสภาพแวดล้อมที่ใช้ร่วมกันซึ่งมีไฟล์ไบนารีอยู่
ติดตั้งที่ไหนสักแห่งเช่น /usr/local/sphinx/ แต่คุณต้องการให้ .แก่ผู้ใช้
ความสามารถในการตั้งค่าสฟิงซ์แบบกำหนดเองหรือหากคุณต้องการเรียกใช้หลายตัว
อินสแตนซ์บนเซิร์ฟเวอร์เดียว ในกรณีเช่นนี้ คุณสามารถอนุญาตให้พวกเขาสร้าง
เป็นเจ้าของไฟล์ sphinx.conf แล้วส่งต่อไปยัง ตัวทำดัชนี ด้วยตัวเลือกนี้
ตัวอย่างเช่น:
$ ตัวทำดัชนี --config /home/myuser/sphinx.conf myindex
--dump-แถว ไฟล์
ดัมพ์แถวที่ดึงมาจากแหล่ง SQL ลงในไฟล์ที่ระบุใน MySQL ที่เข้ากันได้
ไวยากรณ์ ดัมพ์ผลลัพธ์คือการแสดงข้อมูลที่ถูกต้องตามที่ได้รับจากตัวสร้างดัชนี
และช่วยในการทำซ้ำปัญหาเวลาจัดทำดัชนี
--ผสาน DST-ดัชนี SRC-ดัชนี
รวมสองดัชนีเข้าด้วยกันทางกายภาพ ตัวอย่างเช่น หากคุณมีโครงร่างหลัก+เดลต้า
โดยที่ดัชนีหลักไม่ค่อยเปลี่ยนแปลง แต่ดัชนีเดลต้าถูกสร้างขึ้นใหม่บ่อยครั้ง และ
--ผสาน จะถูกนำมาใช้เพื่อรวมทั้งสอง การดำเนินการย้ายจากขวาไปซ้าย - the
เนื้อหาของ SRC-ดัชนี ได้รับการตรวจร่างกายและประกอบกับเนื้อหาของ
DST-ดัชนี และผลลัพธ์จะเหลืออยู่ใน DST-ดัชนี. ใน pseudo-code มันอาจจะแสดง
เป็น: DST-ดัชนี += SRC-ดัชนี
ตัวอย่าง:
$ ตัวทำดัชนี -- รวมเดลต้าหลัก -- หมุน
ในตัวอย่างข้างต้น โดยที่ main คือ master ดัชนีที่ไม่ค่อยมีการเปลี่ยนแปลง และ delta
เป็นอันที่แก้ไขน้อยกว่า คุณอาจใช้ข้างต้นเพื่อเรียก ตัวทำดัชนี ไปยัง
รวมเนื้อหาของเดลต้าเข้ากับดัชนีหลักและหมุนดัชนี
--merge-dst-ช่วง เอทีอาร์ นาที MAX
เรียกใช้ช่วงตัวกรองที่กำหนดเมื่อรวม โดยเฉพาะเมื่อการผสานถูกนำไปใช้กับ
ดัชนีปลายทาง (เป็นส่วนหนึ่งของ --ผสานและจะถูกละเว้น if --ผสาน ไม่ได้ระบุ)
ตัวทำดัชนี จะกรองเอกสารที่ลงท้ายด้วยดัชนีปลายทางและเท่านั้น
เอกสารจะผ่านตัวกรองที่กำหนดจะสิ้นสุดในดัชนีสุดท้าย นี้
สามารถใช้ตัวอย่างเช่นในดัชนีที่มีแอตทริบิวต์ 'ลบ' โดยที่ 0
หมายถึง 'ไม่ลบ' ดัชนีดังกล่าวสามารถรวมเข้ากับ:
$ indexer --merge main delta --merge-dst-range ถูกลบแล้ว 0 0
เอกสารใด ๆ ที่ทำเครื่องหมายว่าลบแล้ว (ค่า 1) จะถูกลบออกจากการรวมใหม่
ดัชนีปลายทาง สามารถเพิ่มได้หลายครั้งในบรรทัดคำสั่งเพื่อเพิ่ม
ตัวกรองต่อเนื่องในการผสาน ซึ่งทั้งหมดจะต้องตรงตามเพื่อให้เอกสารเป็น
กลายเป็นส่วนหนึ่งของดัชนีสุดท้าย
--ผสาน-killlists, --ผสาน-klists
ใช้คู่กับ --ผสาน. โดยปกติเมื่อรวมเข้าด้วยกัน ตัวทำดัชนี ใช้ kill-list ของดัชนีต้นทาง
(เช่น อันที่รวมเข้า) เป็นตัวกรองเพื่อล้างเอกสารที่ตรงกันออกจาก
ดัชนีปลายทาง ในขณะเดียวกัน Kill-list ของจุดหมายปลายทางเองก็ไม่ใช่
สัมผัสได้เลย เมื่อใช้ --ผสาน-killlists, (หรือรูปแบบที่สั้นกว่า --ผสาน-klists)
ตัวทำดัชนี จะไม่กรองเอกสาร dst-index ด้วย src-index killlist แต่จะรวมเข้าด้วยกัน
Kill-lists ของพวกเขาเข้าด้วยกัน ดังนั้นดัชนีผลลัพธ์สุดท้ายจะมี kill-list
มีรายการฆ่าแหล่งที่มาที่ผสานรวม
--ไม่มีความคืบหน้า
อย่าแสดงรายละเอียดความคืบหน้าตามที่เกิดขึ้น แทนรายละเอียดสถานะสุดท้าย (เช่น
เนื่องจากเอกสารที่จัดทำดัชนี ความเร็วในการจัดทำดัชนี และอื่นๆ จะถูกรายงานเมื่อเสร็จสิ้นเท่านั้น
การจัดทำดัชนี ในกรณีที่สคริปต์ไม่ได้ถูกเรียกใช้บนคอนโซล (หรือ 'tty') นี่
จะถูกเปิดโดยค่าเริ่มต้น
ตัวอย่างการใช้งาน:
ตัวทำดัชนี $ --rotate --all --noprogress
--พิมพ์-แบบสอบถาม
พิมพ์คำสั่ง SQL ที่ตัวสร้างดัชนีส่งไปยังฐานข้อมูลพร้อมกับการเชื่อมต่อ SQL
และเหตุการณ์ขาดการเชื่อมต่อ ที่เป็นประโยชน์ในการวินิจฉัยและแก้ไขปัญหาเกี่ยวกับSQL
แหล่งที่มา
--เงียบ
บอก ตัวทำดัชนี ไม่ให้ส่งออกสิ่งใด เว้นแต่จะมีข้อผิดพลาด อีกครั้งที่ใช้มากที่สุดสำหรับ
cron-type หรืองานสคริปต์อื่นๆ ที่เอาต์พุตไม่เกี่ยวข้องหรือไม่จำเป็น ยกเว้น
ในกรณีที่มีข้อผิดพลาดบางอย่าง
ตัวอย่างการใช้งาน:
ตัวสร้างดัชนี $ --rotate --all --quiet
--หมุน
ใช้สำหรับหมุนดัชนี เว้นแต่คุณมีสถานการณ์ที่สามารถค้นหาได้
ทำงานแบบออฟไลน์ได้โดยไม่ทำให้ผู้ใช้ต้องลำบากใจ คุณแทบไม่ต้องเก็บ
การค้นหาทำงานในขณะที่สร้างดัชนีเอกสารใหม่ --หมุน สร้างดัชนีที่สอง
ขนานกับตัวแรก (ในที่เดียวกัน เพียงแค่ใส่ .new ในชื่อไฟล์)
เมื่อเสร็จแล้ว ตัวทำดัชนี การแจ้งเตือน ค้นหาd โดยส่ง ซิกอัพ สัญญาณและ ค้นหาd
จะพยายามเปลี่ยนชื่อดัชนี (เปลี่ยนชื่อที่มีอยู่ให้รวม .old และ
เปลี่ยนชื่อ .new เพื่อแทนที่) แล้วเริ่มให้บริการจากไฟล์ที่ใหม่กว่า
ขึ้นอยู่กับการตั้งค่าของ ไม่มีรอยต่อ_rotate, อาจมีความล่าช้าเล็กน้อยในความสามารถ
เพื่อค้นหาดัชนีที่ใหม่กว่า
ตัวอย่างการใช้งาน:
ตัวสร้างดัชนี $ --rotate --all
--sighup-แต่ละ
มีประโยชน์เมื่อคุณกำลังสร้างดัชนีขนาดใหญ่จำนวนมาก และต้องการให้แต่ละดัชนีหมุนเวียนเป็น
ค้นหาd โดยเร็วที่สุด กับ --sighup-แต่ละ, ตัวทำดัชนี จะส่ง ซิกอัพ ส่งสัญญาณถึง
ค้นหาd หลังจากทำงานในแต่ละดัชนีเสร็จเรียบร้อยแล้ว (พฤติกรรมเริ่มต้นคือ
ส่งซิงเกิ้ล ซิกอัพ หลังจากสร้างดัชนีทั้งหมดแล้ว)
--รายละเอียด
รับประกันว่าทุกแถวที่ทำให้เกิดปัญหาในการจัดทำดัชนี (ซ้ำศูนย์หรือขาดหายไป
รหัสเอกสาร; หรือไฟล์ฟิลด์ IO ปัญหา; ฯลฯ) จะรายงานให้ทราบ โดยค่าเริ่มต้น ตัวเลือกนี้
ปิดอยู่ และอาจรายงานสรุปปัญหาแทน
ใช้ตัวสร้างดัชนีออนไลน์โดยใช้บริการ onworks.net