Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാൻ കഴിയുന്ന pdfgrep കമാൻഡ് ആണിത്.
പട്ടിക:
NAME
pdfgrep - ഒരു സാധാരണ പദപ്രയോഗത്തിനായി pdf ഫയലുകൾ തിരയുക
സിനോപ്സിസ്
pdfgrep [ഓപ്ഷൻ...] PATTERN [FILE...]
വിവരണം
ഇതിനായി തിരയുക PATTERN ഓരോന്നിലും FILE. PATTERN ഒരു വിപുലീകൃത റെഗുലർ എക്സ്പ്രഷൻ ആണ്.
pdfgrep ഗ്രെപ്പ് പോലെ പ്രവർത്തിക്കുന്നു, ഒരു വ്യത്യാസമുണ്ട്: ഇത് പേജുകളിലാണ് പ്രവർത്തിക്കുന്നത്, ലൈനുകളിലല്ല.
ഓപ്ഷനുകൾ
-i, --അവഗണിക്കുക-കേസ്
രണ്ടിലെയും കേസ് വ്യത്യാസങ്ങൾ അവഗണിക്കുക PATTERN ഇൻപുട്ട് ഫയലുകളും.
-F, --ഫിക്സഡ്-സ്ട്രിംഗുകൾ
വ്യാഖ്യാനിക്കുക PATTERN പുതിയ ലൈനുകളാൽ വേർതിരിക്കുന്ന നിശ്ചിത സ്ട്രിംഗുകളുടെ ഒരു പട്ടികയായി, അവയിലേതെങ്കിലും
പൊരുത്തപ്പെടുത്തപ്പെടും.
-P, --perl-regexp
വ്യാഖ്യാനിക്കുക PATTERN ഒരു പേളിന് അനുയോജ്യമായ റെഗുലർ എക്സ്പ്രഷൻ (PCRE) ആയി. കാണുക pcresyntax(3)
ഒരു ദ്രുത അവലോകനത്തിനായി.
-H, --ഫയൽ പേരിനൊപ്പം
ഓരോ മത്സരത്തിനും ഫയലിന്റെ പേര് പ്രിന്റ് ചെയ്യുക. കൂടുതൽ ഉള്ളപ്പോൾ ഇതാണ് ഡിഫോൾട്ട് ക്രമീകരണം
തിരയാൻ ഒന്നിലധികം ഫയലുകൾ.
-h, --നോ-ഫയൽ നാമം
ഔട്ട്പുട്ടിൽ ഫയലിന്റെ പേരിന്റെ പ്രിഫിക്സിംഗ് അടിച്ചമർത്തുക. ഉള്ളപ്പോൾ ഇതാണ് സ്ഥിരസ്ഥിതി ക്രമീകരണം
തിരയാനുള്ള ഒരു ഫയൽ മാത്രമാണ്.
-n, --പേജ് നമ്പർ
ഓരോ പൊരുത്തവും അത് കണ്ടെത്തിയ പേജിന്റെ നമ്പർ ഉപയോഗിച്ച് പ്രിഫിക്സ് ചെയ്യുക.
-c, --എണ്ണം
സാധാരണ ഔട്ട്പുട്ട് അടിച്ചമർത്തുക. പകരം ഓരോ ഇൻപുട്ട് ഫയലിനുമുള്ള പൊരുത്തങ്ങളുടെ എണ്ണം പ്രിന്റ് ചെയ്യുക. കുറിപ്പ്
grep-ൽ നിന്ന് വ്യത്യസ്തമായി, ഒരേ പേജിലെ ഒന്നിലധികം പൊരുത്തങ്ങൾ വ്യക്തിഗതമായി കണക്കാക്കും.
-p, --പേജ്-എണ്ണം
പോലെ -c, എന്നാൽ ഓരോ പേജിലും പൊരുത്തങ്ങളുടെ എണ്ണം പ്രിന്റ് ചെയ്യുന്നു.
-C, --സന്ദർഭം NUMBER
പരമാവധി പ്രിന്റ് ചെയ്യുക INUM ഓരോ മത്സരത്തിനും ചുറ്റുമുള്ള സന്ദർഭത്തിന്റെ പ്രതീകങ്ങൾ. കൃത്യമായ എണ്ണം വരും
വ്യത്യസ്തമാണ്, കാരണം pdfgrep വാക്കുകളുടെ അതിരുകൾ മാനിക്കാൻ ശ്രമിക്കുന്നു. എങ്കിൽ NUMBER ആണ് "വര", മുഴുവൻ
ലൈൻ പ്രിന്റ് ചെയ്യും. ഈ ഓപ്ഷൻ സജ്ജീകരിച്ചിട്ടില്ലെങ്കിൽ, pdfgrep ലൈനുകൾ പ്രിന്റ് ചെയ്യാൻ ശ്രമിക്കുന്നു
ടെർമിനൽ വീതിയേക്കാൾ ദൈർഘ്യമേറിയതല്ല.
--നിറം എപ്പോൾ
സറൗണ്ട് ഫയലുകളുടെ പേരുകൾ, പേജ് നമ്പറുകൾ, എസ്കേപ്പ് സീക്വൻസുകളുള്ള പൊരുത്തപ്പെടുന്ന ടെക്സ്റ്റ് എന്നിവ പ്രദർശിപ്പിക്കുക
ടെർമിനലിൽ അവ നിറത്തിലാണ്. (സ്ഥിരസ്ഥിതി ക്രമീകരണം കാര്). എപ്പോൾ ആകാം:
എല്ലായിപ്പോഴും
stdout ഒരു ടെർമിനൽ അല്ലാത്തപ്പോൾ പോലും എപ്പോഴും നിറങ്ങൾ ഉപയോഗിക്കുക.
ഒരിക്കലും
നിറങ്ങൾ ഉപയോഗിക്കരുത്.
കാര്
stdout ഒരു ടെർമിനൽ ആയിരിക്കുമ്പോൾ മാത്രം നിറങ്ങൾ ഉപയോഗിക്കുക.
-o, --മാത്രം-പൊരുത്തം
ചുറ്റുപാടുകളൊന്നും കൂടാതെ ഒരു വരിയുടെ പൊരുത്തപ്പെടുന്ന ഭാഗം മാത്രം പ്രിന്റ് ചെയ്യുക.
-r, --ആവർത്തന
എല്ലാ ഫയലുകളും ആവർത്തിച്ച് തിരയുക (നിയന്ത്രിച്ചിരിക്കുന്നത് --ഉൾപ്പെടുന്നു ഒപ്പം --പെടുത്തിയിട്ടില്ല) ഓരോന്നിനും കീഴിൽ
ഡയറക്ടറി, സിംലിങ്കുകൾ കമാൻഡ് ലൈനിലാണെങ്കിൽ മാത്രം.
-R, --dereference-recursive
അതുപോലെ തന്നെ -r, എന്നാൽ എല്ലാ സിംലിങ്കുകളും പിന്തുടരുന്നു.
--ഒഴിവാക്കുക=GLOB
അടിസ്ഥാന നാമവുമായി പൊരുത്തപ്പെടുന്ന ഫയലുകൾ ഒഴിവാക്കുക GLOB. കാണുക ഗ്ലോബ്(7) വൈൽഡ്കാർഡുകൾക്കായി നിങ്ങൾക്ക് ഉപയോഗിക്കാം. നിങ്ങൾ
കൂടുതൽ പാറ്റേണുകൾ ഒഴിവാക്കാൻ ഈ ഓപ്ഷൻ ഒന്നിലധികം തവണ ഉപയോഗിക്കാം. അതിനു മുൻതൂക്കം ലഭിക്കുന്നു
--ഉൾപ്പെടുന്നു. ശ്രദ്ധിക്കുക, ഇതിലൂടെ കണ്ടെത്തുന്ന ഫയലുകൾക്ക് മാത്രമേ ഇൻ-ഉം ഒഴിവാക്കലും ബാധകമാകൂ --ആവർത്തന ഒപ്പം
ആർഗ്യുമെന്റ് ലിസ്റ്റിലേക്കല്ല.
--ഉൾപ്പെടുത്തുക=GLOB
അടിസ്ഥാന നാമം പൊരുത്തപ്പെടുന്ന ഫയലുകൾ മാത്രം തിരയുക GLOB. കാണുക --പെടുത്തിയിട്ടില്ല വിശദാംശങ്ങൾക്ക്. സ്ഥിരസ്ഥിതി
is *.pdf.
--പാസ്വേഡ്=പാസ്വേഡ്
PDF ഫയലുകൾ ഡീക്രിപ്റ്റ് ചെയ്യാൻ PASSWORD ഉപയോഗിക്കുക. ഒന്നിലധികം തവണ വ്യക്തമാക്കാം; എല്ലാ പാസ്വേഡുകളും
എല്ലാ PDF-കളിലും പരീക്ഷിക്കും. കുറിപ്പ് ഈ പാസ്വേഡ് നിങ്ങളുടെ കമാൻഡിൽ കാണിക്കും
ചരിത്രവും ഔട്ട്പുട്ടും ps(1). അതിനാൽ സുരക്ഷയുണ്ടെങ്കിൽ ദയവായി ഇത് ഉപയോഗിക്കരുത് പാസ്വേഡ്
പ്രധാനമാണ്.
-m, --പരമാവധി-എണ്ണം NUMBER
അതിനുശേഷം ഒരു ഫയൽ വായിക്കുന്നത് നിർത്തുക NUMBER മത്സരങ്ങൾ. -c അല്ലെങ്കിൽ --count ഓപ്ഷനും ഉപയോഗിക്കുമ്പോൾ,
pdfgrep എന്നതിനേക്കാൾ കൂടുതൽ എണ്ണം ഔട്ട്പുട്ട് ചെയ്യുന്നില്ല NUMBER.
-Z, --ശൂന്യം
ഒരു നൾ ബൈറ്റ് ഔട്ട്പുട്ട് ചെയ്യുക (വിളിക്കുന്നത് NUL കോളണിന് പകരം ASCII-ലും '\0' C-ലും
സാധാരണയായി ഒരു ഫയലിന്റെ പേര് ബാക്കി വരിയിൽ നിന്ന് വേർതിരിക്കുന്നു. ഈ ഓപ്ഷൻ ഔട്ട്പുട്ട് ചെയ്യുന്നു
ഫയലിന്റെ പേരിൽ കോളണുകൾ, സ്പെയ്സുകൾ അല്ലെങ്കിൽ ന്യൂലൈനുകൾ എന്നിവയുടെ സാന്നിധ്യത്തിൽ അവ്യക്തമാണ്. അത് ആവാം
തുടങ്ങിയ കമാൻഡുകൾക്കൊപ്പം ഉപയോഗിക്കുന്നു xargs -0 or മുത്ത് -0.
--മാച്ച്-പ്രിഫിക്സ്-സെപ്പറേറ്റർ SEP
ഔട്ട്പുട്ടിലെ ഫയലിന്റെ പേര്, ലൈൻ നമ്പർ, ടെക്സ്റ്റ് എന്നിവ വേർതിരിക്കുന്നതിന് ഉപയോഗിക്കുന്ന കോളണിലേക്ക് മാറ്റുന്നു
SEP, ഒരു ഏകപക്ഷീയമായ സ്ട്രിംഗ് ആകാം. ഫയൽ നാമങ്ങളിൽ കോളണുകൾ അടങ്ങിയിരിക്കുമ്പോൾ ഇത് ഉപയോഗപ്രദമാണ്,
എന്നാൽ സംവേദനാത്മക ഉപയോഗത്തിന് മാത്രം. സ്ക്രിപ്റ്റിങ്ങിന്, --ശൂന്യം ഉപയോഗിക്കണം.
--ഡീബഗ്
ഡീബഗ് ഔട്ട്പുട്ട് പ്രവർത്തനക്ഷമമാക്കുക. കുറിപ്പ്: പതിപ്പ് 0.30.0-ന് മുമ്പുള്ള പോപ്ലറിന്റെ പരിമിതികൾ കാരണം, ചിലത്
ഡീബഗ് ഔട്ട്പുട്ടും കൂടാതെ പ്രിന്റ് ചെയ്യുന്നു --ഡീബഗ് അത്തരമൊരു പോപ്ലർ പതിപ്പ് ഉപയോഗിക്കുമ്പോൾ.
--മുന്നറിയിപ്പ്-ശൂന്യം
ഒരു മുന്നറിയിപ്പ് അച്ചടിക്കുക stderr ഒരു PDF-ൽ തിരയാനാകുന്ന വാചകം ഇല്ലെങ്കിൽ. ഇതാണ് കേസ്
ചിത്രങ്ങൾ മാത്രം ഉൾക്കൊള്ളുന്ന PDF-കൾ, ഉദാഹരണത്തിന് സ്കാൻ ചെയ്ത പ്രമാണങ്ങൾ.
--unac
തിരയൽ പാറ്റേണിൽ നിന്നും PDF പ്രമാണങ്ങളിൽ നിന്നും ആക്സന്റുകളും ലിഗേച്ചറുകളും നീക്കം ചെയ്യുക. ഈ
"ae" അടങ്ങിയിരിക്കുന്ന ഒരു വാക്ക് തിരയണമെങ്കിൽ അത് ഉപയോഗപ്രദമാണ്, എന്നാൽ PDF ഉപയോഗിക്കുന്നത്
പകരം "æ" എന്ന ഒറ്റ അക്ഷരം. കാണുക unac(3) ഒപ്പം ഉച്ചാരണമില്ലാത്ത(1) വിവരങ്ങൾക്ക്.
ഈ ഓപ്ഷൻ is പരീക്ഷണാത്മകം ഒപ്പം മാത്രം ലഭ്യമായ if pdfgrep is സമാഹരിച്ചത് കൂടെ unac
പിന്തുണ.
-q, --നിശബ്ദമായി
എല്ലാ സാധാരണ ഔട്ട്പുട്ടും stdout-ലേക്ക് അടിച്ചമർത്തുക. പിശകുകൾ അച്ചടിക്കുകയും എക്സിറ്റ് കോഡുകൾ നൽകുകയും ചെയ്യും
തിരികെ ലഭിക്കും (ചുവടെ കാണുക).
--സഹായിക്കൂ
ഓപ്ഷനുകളുടെ ഒരു ഹ്രസ്വ സംഗ്രഹം അച്ചടിക്കുക.
-V, --പതിപ്പ് പതിപ്പ് വിവരങ്ങൾ കാണിക്കുക.
പുറത്ത് പദവി
സാധാരണയായി, കുറഞ്ഞത് ഒരു പൊരുത്തം കണ്ടെത്തിയാൽ എക്സിറ്റ് സ്റ്റാറ്റസ് 0 ആണ്, പൊരുത്തമൊന്നും കണ്ടെത്തിയില്ലെങ്കിൽ 1 ആണ്
2 ഒരു പിശക് സംഭവിച്ചാൽ. എന്നാൽ എങ്കിൽ --നിശബ്ദമായി or -q ഓപ്ഷൻ ഉപയോഗിച്ചു, ഒരു പൊരുത്തം കണ്ടെത്തി,
pdfgrep പിശകുകൾ പരിഗണിക്കാതെ 0 നൽകും.
ENVIRONMENT വ്യത്യാസങ്ങൾ
യുടെ പെരുമാറ്റം pdfgrep ഇനിപ്പറയുന്ന പരിസ്ഥിതി വേരിയബിൾ ബാധിക്കുന്നു.
GREP_COLORS
വിവിധ ഭാഗങ്ങൾ ഹൈലൈറ്റ് ചെയ്യാൻ ഉപയോഗിക്കുന്ന നിറങ്ങളും മറ്റ് ആട്രിബ്യൂട്ടുകളും വ്യക്തമാക്കുന്നു
ഔട്ട്പുട്ട്. വാക്യഘടനയും മൂല്യങ്ങളും ഇതുപോലെയാണ് GREP_COLORS of grep. കാണുക grep(1) കൂടുതൽ കാര്യങ്ങൾക്കായി
വിശദാംശങ്ങൾ. നിലവിൽ കഴിവുകൾ മാത്രം mt, ms, mc, fn, ln ഒപ്പം se ഉപയോഗിക്കുന്നത്
pdfgrepഎവിടെ mt, ms ഒപ്പം mc സമാന ഫലം.
ഉദാഹരണങ്ങൾ
അച്ചടിക്കുക The ആദ്യം ഈ ലൈനുകൾ പൊരുത്തപ്പെടുന്നു പാറ്റേൺ ഒപ്പം അച്ചടിക്കുക അവരുടെ പേജ് അക്കം
pdfgrep -n --max-count 10 പാറ്റേൺ foo.pdf
തിരയൽ എല്ലാം .pdf ഫയലുകൾ ആരുടെ പേരുകൾ ആരംഭിക്കുന്നു കൂടെ ഫൂ ആവർത്തിച്ച് in The നിലവിലുള്ളത് ഡയറക്ടറി
pdfgrep -r --"foo*.pdf" പാറ്റേൺ ഉൾപ്പെടുത്തുക
തിരയൽ എല്ലാം .pdf ഫയലുകൾ ആ ആകുന്നു ചെറുത് അധികം 12M ആവർത്തിച്ച് in The നിലവിലുള്ളത് ഡയറക്ടറി
കണ്ടെത്തുക . -name "*.pdf" -size -12M -print0 | xargs -0 pdfgrep പാറ്റേൺ
മുമ്പത്തെ ഉദാഹരണങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി, ഈ ടാസ്ക് പരിഹരിക്കാൻ കഴിഞ്ഞില്ല എന്നത് ശ്രദ്ധിക്കുക
pdfgrep മാത്രം, എന്നാൽ Unix ടൂളുകൾ കണ്ടെത്തുക(1) ഒപ്പം xargs(1) ഉപയോഗിക്കേണ്ടതായിരുന്നു. അത് കാരണം
pdfgrep-ൽ തന്നെ ഫയലുകളെ അവയുടെ വലിപ്പമനുസരിച്ച് ഒഴിവാക്കാനുള്ള ഓപ്ഷനുകൾ ഉൾപ്പെടുന്നില്ല. എന്നാൽ നിങ്ങൾ കാണുന്നതുപോലെ,
അത് ആവശ്യമില്ല!
onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് pdfgrep ഓൺലൈനായി ഉപയോഗിക്കുക