এটি হল কমান্ড ইনডেক্সার যা আমাদের একাধিক বিনামূল্যের অনলাইন ওয়ার্কস্টেশন যেমন উবুন্টু অনলাইন, ফেডোরা অনলাইন, উইন্ডোজ অনলাইন এমুলেটর বা MAC OS অনলাইন এমুলেটর ব্যবহার করে OnWorks ফ্রি হোস্টিং প্রদানকারীতে চালানো যেতে পারে।
কার্যক্রম:
NAME এর
indexer - Sphinxsearch fulltext সূচক জেনারেটর
সাইনোপিসিস
সূচক [-config কনফিগফাইল] [--ঘোরান] [--অপ্রগতি | --শান্ত] [---সমস্ত | এর INDEX | ...]
সূচক --বিল্ডস্টপ আউটপুট ফাইল COUNT টি [-config কনফিগফাইল] [-অপ্রগতি | --শান্ত]
[-সব | এর INDEX | ...]
সূচক --একত্রিত করা MAIN_INDEX DELTA_INDEX [-config কনফিগফাইল] [--ঘোরান] [--অপ্রগতি |
--শান্ত]
বর্ণনাঃ
Sphinx হল একটি প্রোগ্রামের সংগ্রহ যার লক্ষ্য উচ্চ মানের ফুলটেক্সট সার্চ প্রদান করা।
সূচক স্ফিঙ্কসের অংশ হিসেবে দুটি নীতির টুলের মধ্যে প্রথমটি। হয় থেকে আহ্বান করা হয়েছে
কমান্ড লাইন সরাসরি, বা একটি বড় স্ক্রিপ্টের অংশ হিসাবে, সূচক জন্য এককভাবে দায়ী
তথ্য সংগ্রহ করা যা অনুসন্ধানযোগ্য হবে।
সূচকের জন্য কলিং সিনট্যাক্স নিম্নরূপ:
$ indexer [বিকল্প] [indexname1 [indexname2 [...]]]
মূলত আপনি বিভিন্ন সম্ভাব্য সূচকের তালিকা করবেন (যা আপনি পরে তৈরি করবেন
অনুসন্ধানের জন্য উপলব্ধ) sphinx.conf এ, তাই কল করার সময় সূচক, একটি সর্বনিম্ন হিসাবে আপনি হতে হবে
আপনি কি সূচক (বা সূচী) সূচী করতে চান তা বলছেন।
যদি sphinx.conf 2টি সূচীতে বিশদ থাকে, mybigindex এবং mysmallindex, আপনি করতে পারেন
অনুসরণ:
$ indexer mybigindex
$ indexer mysmallindex mybigindex
কনফিগারেশন ফাইলের অংশ হিসাবে, sphinx.conf, আপনি আপনার জন্য এক বা একাধিক সূচী নির্দিষ্ট করেন
তথ্য আপনি কল করতে পারেন সূচক তাদের মধ্যে একটিকে পুনঃসূচীকরণ করতে, অ্যাড-হক, অথবা আপনি এটি প্রক্রিয়া করতে বলতে পারেন
সমস্ত সূচী - আপনি শুধুমাত্র একটি বা একবারে কল করার মধ্যে সীমাবদ্ধ নন, আপনি সবসময় বাছাই করতে পারেন
উপলব্ধ সূচকের কিছু সংমিশ্রণ।
বিকল্প
জন্য বিকল্প সংখ্যাগরিষ্ঠ সূচক কনফিগারেশন ফাইলে দেওয়া আছে, তবে সেখানে
কিছু বিকল্প যা আপনাকে কমান্ড লাইনে নির্দিষ্ট করতে হবে, কারণ তারা প্রভাবিত করতে পারে
কিভাবে ইন্ডেক্সিং অপারেশন সঞ্চালিত হয়। এই বিকল্পগুলি হল:
--সব
বলে সূচক তালিকার পরিবর্তে, sphinx.conf-এ তালিকাভুক্ত প্রতিটি সূচক আপডেট করতে
স্বতন্ত্র সূচক। এটি ছোট কনফিগারেশন, বা ক্রন-টাইপ বা উপযোগী হবে
রক্ষণাবেক্ষণের কাজ যেখানে সম্পূর্ণ সূচক সেটটি প্রতিদিন, বা সপ্তাহে, বা পুনর্নির্মাণ করা হবে
যে সময়কাল সেরা
উদাহরণ ব্যবহার:
$ indexer --config /home/myuser/sphinx.conf --all
--বিল্ডস্টপ outfile.txt NUM টি
সূচক উত্স পর্যালোচনা করে, যেন এটি ডেটা সূচীকরণ করছে, এবং এর একটি তালিকা তৈরি করে৷
শর্তাবলী যে সূচী করা হচ্ছে. অন্য কথায়, এটি অনুসন্ধানযোগ্য সমস্তগুলির একটি তালিকা তৈরি করে
শর্তাবলী যা সূচকের অংশ হয়ে উঠছে। বিঃদ্রঃ; এটি ইনডেক্স আপডেট করে না
প্রশ্ন, এটি সহজভাবে ডেটা প্রক্রিয়া করে 'যেন' এটি চলমান সহ ইনডেক্সিং ছিল
এর সাথে সংজ্ঞায়িত প্রশ্ন sql_query_pre or sql_query_post. outputfile.txt থাকবে
শব্দের তালিকা, প্রতি লাইনে একটি, ফ্রিকোয়েন্সি অনুসারে বাছাই করা হয়েছে সবচেয়ে ঘন ঘন প্রথমে, এবং NUM টি
তালিকাভুক্ত করা হবে শব্দের সর্বোচ্চ সংখ্যা নির্দিষ্ট করে; যদি যথেষ্ট বড় হয়
সূচীতে প্রতিটি শব্দকে অন্তর্ভুক্ত করুন, শুধুমাত্র অনেকগুলি শব্দ ফেরত দেওয়া হবে। যেমন ক
অভিধান তালিকা "আপনি কি বলতে চাচ্ছিলেন..." এর কাছাকাছি ক্লায়েন্ট অ্যাপ্লিকেশন বৈশিষ্ট্যগুলির জন্য ব্যবহার করা যেতে পারে।
কার্যকারিতা, সাধারণত এর সাথে একযোগে --বিল্ডফ্রিকস, নিচে.
উদাহরণ:
$ indexer myindex --buildstops word_freq.txt 1000
এটি বর্তমান ডিরেক্টরিতে একটি নথি তৈরি করবে, word_freq.txt 1,000 এর সাথে
'myindex'-এর সবচেয়ে সাধারণ শব্দ, সবচেয়ে সাধারণ প্রথম দ্বারা ক্রমানুযায়ী। উল্লেখ্য যে ফাইল হবে
একাধিক সূচী বা সঙ্গে নির্দিষ্ট করা হলে শেষ সূচির সাথে সম্পর্কিত --সব (অর্থাত
শেষটি কনফিগারেশন ফাইলে তালিকাভুক্ত)
--বিল্ডফ্রিকস
সাথে জোড়ায় ব্যবহৃত হয় --বিল্ডস্টপ (এবং উপেক্ষা করা হয় যদি --বিল্ডস্টপ নির্দিষ্ট করা নেই)। হিসাবে
--বিল্ডস্টপ সূচকের মধ্যে ব্যবহৃত শব্দের তালিকা প্রদান করে, --বিল্ডফ্রিকস যোগ করুন
সূচকে উপস্থিত পরিমাণ, যা নিশ্চিত কিনা তা নির্ধারণে কার্যকর হবে
শব্দগুলি যদি খুব বেশি প্রচলিত হয় তবে তাকে স্টপওয়ার্ড হিসাবে বিবেচনা করা উচিত। এটাও সাহায্য করবে
"আপনি কি বলতে চাচ্ছিলেন..." বৈশিষ্ট্যগুলি বিকাশ করছে যেখানে আপনি একটি প্রদত্ত শব্দের আরও বেশি সাধারণ ব্যবহার করতে পারবেন
অন্যের তুলনায়, অনুরূপ।
উদাহরণ:
$ indexer myindex --buildstops word_freq.txt 1000 --buildfreqs
এটি উপরের মতো শব্দ_freq.txt তৈরি করবে, তবে প্রতিটি শব্দের পরে হবে
প্রশ্নযুক্ত সূচকে এটি কতবার ঘটেছে।
--config কনফিগারিল, -c কনফিগফাইল
প্রদত্ত ফাইলটি কনফিগারেশন হিসাবে ব্যবহার করুন। সাধারণত, এটি sphinx.conf-এর মধ্যে সন্ধান করবে
ইনস্টলেশন ডিরেক্টরি (যেমন/usr/local/sphinx/etc/sphinx.conf যদি ইনস্টল করা হয়
/usr/local/sphinx), তারপরে ইনডেক্সার কল করার সময় আপনি বর্তমান ডিরেক্টরিতে থাকেন
শেল থেকে এটি ভাগ করা পরিবেশে সবচেয়ে বেশি ব্যবহার করা হয় যেখানে বাইনারি ফাইল থাকে
/usr/local/sphinx/ এর মতো কোথাও ইনস্টল করা হয়েছে কিন্তু আপনি ব্যবহারকারীদের প্রদান করতে চান
তাদের নিজস্ব কাস্টম স্ফিংস সেট-আপ করার ক্ষমতা, অথবা আপনি একাধিক চালাতে চান
একটি একক সার্ভারে উদাহরণ। তাদের মত ক্ষেত্রে আপনি তাদের তাদের তৈরি করতে অনুমতি দিতে পারে
নিজস্ব sphinx.conf ফাইল এবং তাদের পাস সূচক এই বিকল্পের সাথে।
উদাহরণ স্বরূপ:
$ indexer --config /home/myuser/sphinx.conf myindex
--ডাম্প-সারি ফাইল
একটি MySQL সামঞ্জস্যপূর্ণ, নির্দিষ্ট ফাইলে SQL উৎস(গুলি) দ্বারা আনা সারিগুলি ডাম্প করে
বাক্য গঠন. ফলাফল ডাম্পগুলি হল ইনডেক্সার দ্বারা প্রাপ্ত ডেটার সঠিক উপস্থাপনা
এবং ইনডেক্সিং-টাইম সমস্যাগুলি পুনরাবৃত্তি করতে সহায়তা করে।
--একত্রিত করা DST-INDEX SRC-INDEX
শারীরিকভাবে দুটি সূচীকে একত্রিত করুন। উদাহরণস্বরূপ যদি আপনার একটি প্রধান + ডেল্টা স্কিম থাকে,
যেখানে প্রধান সূচক খুব কমই পরিবর্তিত হয়, কিন্তু ডেল্টা সূচক ঘন ঘন পুনর্নির্মাণ করা হয়, এবং
--একত্রিত করা দুটি একত্রিত করতে ব্যবহার করা হবে। অপারেশন ডান থেকে বামে চলে -
বিষয়বস্তু SRC-INDEX পরীক্ষা করা এবং শারীরিকভাবে এর বিষয়বস্তুর সাথে মিলিত হওয়া
DST-INDEX এবং ফলাফল বাকি আছে DST-INDEX. ছদ্ম কোডে, এটি প্রকাশ করা যেতে পারে
যেমন: DST-INDEX += SRC-INDEX
একটি উদাহরণ:
$ indexer -- merge main delta -- rotate
উপরের উদাহরণে, যেখানে প্রধানটি মাস্টার, খুব কমই পরিবর্তিত সূচক এবং ডেল্টা
কম ঘন ঘন পরিবর্তন করা হয়, আপনি কল করার জন্য উপরেরটি ব্যবহার করতে পারেন সূচক থেকে
ডেল্টার বিষয়বস্তু প্রধান সূচকে একত্রিত করুন এবং সূচীগুলি ঘোরান।
--মার্জ-ডিএসটি-রেঞ্জ এটিটিআর MIN এর MAX টি
মার্জ করার সময় প্রদত্ত ফিল্টার পরিসীমা চালান। বিশেষভাবে, মার্জ প্রয়োগ করা হয় হিসাবে
গন্তব্য সূচক (এর অংশ হিসাবে --একত্রিত করা, এবং উপেক্ষা করা হয় যদি --একত্রিত করা নির্দিষ্ট করা নেই),
সূচক গন্তব্য সূচকে শেষ হওয়া নথিগুলিও ফিল্টার করবে, এবং শুধুমাত্র
নথিগুলি প্রদত্ত ফিল্টারের মধ্য দিয়ে যাবে চূড়ান্ত সূচকে শেষ হবে। এই
উদাহরণস্বরূপ, একটি সূচীতে ব্যবহার করা যেতে পারে যেখানে একটি 'মুছে ফেলা' বৈশিষ্ট্য রয়েছে, যেখানে 0
মানে 'মোছা হয়নি'। এই ধরনের একটি সূচক এর সাথে একত্রিত করা যেতে পারে:
$ indexer --merge main delta --merge-dst-range মুছে ফেলা হয়েছে 0 0
মুছে ফেলা হিসাবে চিহ্নিত যেকোন নথি (মান 1) নতুন-একত্রিত করা থেকে সরানো হবে
গন্তব্য সূচক। এটি কমান্ড লাইনে কয়েকবার যোগ করা যেতে পারে, যোগ করার জন্য
একত্রিত করার জন্য ধারাবাহিক ফিল্টার, যার সবকটি অবশ্যই একটি নথির জন্য পূরণ করতে হবে
চূড়ান্ত সূচকের অংশ হয়ে ওঠে।
-- মার্জ-কিলিস্ট, -- মার্জ-ক্লিস্ট
সাথে জোড়ায় ব্যবহৃত হয় --একত্রিত করা. সাধারণত মার্জ করার সময় সূচক উৎস সূচকের হত্যা-তালিকা ব্যবহার করে
(অর্থাৎ, যেটিতে একত্রিত করা হয়েছে) ফিল্টার হিসাবে মিলিত ডক্সগুলিকে মুছে ফেলার জন্য
গন্তব্য সূচক। একই সময়ে গন্তব্যের হত্যা-তালিকাটি নিজেই নয়
একেবারে স্পর্শ ব্যবহার করার সময় -- মার্জ-কিলিস্ট, (বা এটি সংক্ষিপ্ত রূপ -- মার্জ-ক্লিস্ট) দ্য
সূচক src-index killlist দিয়ে dst-index ডক্স ফিল্টার করবে না, কিন্তু এটি একত্রিত হবে
তাদের হত্যা-তালিকা একসাথে, তাই চূড়ান্ত ফলাফল সূচকে হত্যা-তালিকা থাকবে
মার্জড সোর্স কিল-লিস্ট রয়েছে।
--কোনো উন্নতি নেই
অগ্রগতির বিবরণ যেমন ঘটবে তা প্রদর্শন করবেন না; পরিবর্তে, চূড়ান্ত অবস্থার বিবরণ (যেমন
নথি সূচী হিসাবে, সূচীকরণের গতি এবং তাই শুধুমাত্র সমাপ্তির রিপোর্ট করা হয়
ইনডেক্সিং উদাহরণে যেখানে স্ক্রিপ্টটি কনসোলে (বা 'tty') চালানো হচ্ছে না, এটি
ডিফল্টরূপে চালু হবে।
উদাহরণ ব্যবহার:
$ indexer --rotate --all --noprogress
--প্রিন্ট-কোয়েরি
এসকিউএল ক্যোয়ারী প্রিন্ট করে যা ইনডেক্সার এসকিউএল সংযোগ সহ ডাটাবেসে পাঠায়
এবং সংযোগ বিচ্ছিন্ন ঘটনা। এসকিউএল-এর সাথে সমস্যাগুলি নির্ণয় এবং সমাধান করতে এটি কার্যকর
সূত্র।
-- শান্ত
বলে সূচক কিছু আউটপুট না, যদি না একটি ত্রুটি আছে. আবার, সবচেয়ে জন্য ব্যবহৃত
ক্রন-টাইপ, বা অন্যান্য স্ক্রিপ্ট কাজ যেখানে আউটপুট অপ্রাসঙ্গিক বা অপ্রয়োজনীয়, ছাড়া
কোনো ধরনের ত্রুটির ক্ষেত্রে।
উদাহরণ ব্যবহার:
$ indexer -- rotate -- all -- শান্ত
--আবর্তিত
সূচী ঘোরানোর জন্য ব্যবহৃত হয়। খোঁজ না নিলে এমন পরিস্থিতি না থাকলে
ব্যবহারকারীদের ঝামেলা না করে অফলাইনে ফাংশন, আপনাকে প্রায় অবশ্যই রাখতে হবে
অনুসন্ধান চলমান যখন নতুন নথি সূচীকরণ. --আবর্তিত একটি দ্বিতীয় সূচক তৈরি করে,
প্রথমটির সমান্তরাল (একই জায়গায়, ফাইলের নামগুলিতে .new সহ)।
একবার সম্পূর্ণ, সূচক সূচিত অনুসন্ধান পাঠানোর মাধ্যমে সাইনআপ সংকেত, এবং অনুসন্ধান
সূচীগুলির পুনঃনামকরণ করার চেষ্টা করবে (বিদ্যমানগুলির নাম পরিবর্তন করে .old এবং
তাদের প্রতিস্থাপন করতে .new এর নাম পরিবর্তন করুন), এবং তারপরে নতুন ফাইলগুলি থেকে পরিবেশন শুরু করুন।
এর সেটিং এর উপর নির্ভর করে seamless_rotate, সক্ষম হতে একটি সামান্য বিলম্ব হতে পারে
নতুন সূচী অনুসন্ধান করতে.
উদাহরণ ব্যবহার:
$ indexer --rotate --all
--sighup-প্রতিটি
আপনি যখন অনেক বড় সূচী পুনর্নির্মাণ করছেন এবং প্রতিটিতে ঘোরানো চান তখন এটি কার্যকর
অনুসন্ধান যত দ্রুত সম্ভব. সঙ্গে --sighup-প্রতিটি, সূচক একটি পাঠাবে সাইনআপ সিগন্যাল
অনুসন্ধান সফলভাবে প্রতিটি সূচকে কাজ শেষ করার পর। (ডিফল্ট আচরণ হল
একটি একক পাঠাতে সাইনআপ সমস্ত সূচক তৈরি করার পরে।)
-- ভারবোস
গ্যারান্টি দেয় যে প্রতিটি সারি যা সূচীকরণে সমস্যা সৃষ্টি করে (ডুপ্লিকেট, শূন্য, বা অনুপস্থিত
নথি আইডি; অথবা ফাইল ফিল্ড আইও সমস্যা; ইত্যাদি) রিপোর্ট করা হবে। ডিফল্টরূপে, এই বিকল্প
বন্ধ আছে, এবং সমস্যার সারাংশ এর পরিবর্তে রিপোর্ট করা হতে পারে।
onworks.net পরিষেবা ব্যবহার করে অনলাইনে ইনডেক্সার ব্যবহার করুন