pdfgrep - ക്ലൗഡിൽ ഓൺലൈനിൽ

Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാൻ കഴിയുന്ന pdfgrep കമാൻഡ് ആണിത്.

പട്ടിക:

NAME


pdfgrep - ഒരു സാധാരണ പദപ്രയോഗത്തിനായി pdf ഫയലുകൾ തിരയുക

സിനോപ്സിസ്


pdfgrep [ഓപ്ഷൻ...] PATTERN [FILE...]

വിവരണം


ഇതിനായി തിരയുക PATTERN ഓരോന്നിലും FILE. PATTERN ഒരു വിപുലീകൃത റെഗുലർ എക്സ്പ്രഷൻ ആണ്.

pdfgrep ഗ്രെപ്പ് പോലെ പ്രവർത്തിക്കുന്നു, ഒരു വ്യത്യാസമുണ്ട്: ഇത് പേജുകളിലാണ് പ്രവർത്തിക്കുന്നത്, ലൈനുകളിലല്ല.

ഓപ്ഷനുകൾ


-i, --അവഗണിക്കുക-കേസ്
രണ്ടിലെയും കേസ് വ്യത്യാസങ്ങൾ അവഗണിക്കുക PATTERN ഇൻപുട്ട് ഫയലുകളും.

-F, --ഫിക്സഡ്-സ്ട്രിംഗുകൾ
വ്യാഖ്യാനിക്കുക PATTERN പുതിയ ലൈനുകളാൽ വേർതിരിക്കുന്ന നിശ്ചിത സ്ട്രിംഗുകളുടെ ഒരു പട്ടികയായി, അവയിലേതെങ്കിലും
പൊരുത്തപ്പെടുത്തപ്പെടും.

-P, --perl-regexp
വ്യാഖ്യാനിക്കുക PATTERN ഒരു പേളിന് അനുയോജ്യമായ റെഗുലർ എക്സ്പ്രഷൻ (PCRE) ആയി. കാണുക pcresyntax(3)
ഒരു ദ്രുത അവലോകനത്തിനായി.

-H, --ഫയൽ പേരിനൊപ്പം
ഓരോ മത്സരത്തിനും ഫയലിന്റെ പേര് പ്രിന്റ് ചെയ്യുക. കൂടുതൽ ഉള്ളപ്പോൾ ഇതാണ് ഡിഫോൾട്ട് ക്രമീകരണം
തിരയാൻ ഒന്നിലധികം ഫയലുകൾ.

-h, --നോ-ഫയൽ നാമം
ഔട്ട്‌പുട്ടിൽ ഫയലിന്റെ പേരിന്റെ പ്രിഫിക്‌സിംഗ് അടിച്ചമർത്തുക. ഉള്ളപ്പോൾ ഇതാണ് സ്ഥിരസ്ഥിതി ക്രമീകരണം
തിരയാനുള്ള ഒരു ഫയൽ മാത്രമാണ്.

-n, --പേജ് നമ്പർ
ഓരോ പൊരുത്തവും അത് കണ്ടെത്തിയ പേജിന്റെ നമ്പർ ഉപയോഗിച്ച് പ്രിഫിക്സ് ചെയ്യുക.

-c, --എണ്ണം
സാധാരണ ഔട്ട്പുട്ട് അടിച്ചമർത്തുക. പകരം ഓരോ ഇൻപുട്ട് ഫയലിനുമുള്ള പൊരുത്തങ്ങളുടെ എണ്ണം പ്രിന്റ് ചെയ്യുക. കുറിപ്പ്
grep-ൽ നിന്ന് വ്യത്യസ്തമായി, ഒരേ പേജിലെ ഒന്നിലധികം പൊരുത്തങ്ങൾ വ്യക്തിഗതമായി കണക്കാക്കും.

-p, --പേജ്-എണ്ണം
പോലെ -c, എന്നാൽ ഓരോ പേജിലും പൊരുത്തങ്ങളുടെ എണ്ണം പ്രിന്റ് ചെയ്യുന്നു.

-C, --സന്ദർഭം NUMBER
പരമാവധി പ്രിന്റ് ചെയ്യുക INUM ഓരോ മത്സരത്തിനും ചുറ്റുമുള്ള സന്ദർഭത്തിന്റെ പ്രതീകങ്ങൾ. കൃത്യമായ എണ്ണം വരും
വ്യത്യസ്തമാണ്, കാരണം pdfgrep വാക്കുകളുടെ അതിരുകൾ മാനിക്കാൻ ശ്രമിക്കുന്നു. എങ്കിൽ NUMBER ആണ് "വര", മുഴുവൻ
ലൈൻ പ്രിന്റ് ചെയ്യും. ഈ ഓപ്ഷൻ സജ്ജീകരിച്ചിട്ടില്ലെങ്കിൽ, pdfgrep ലൈനുകൾ പ്രിന്റ് ചെയ്യാൻ ശ്രമിക്കുന്നു
ടെർമിനൽ വീതിയേക്കാൾ ദൈർഘ്യമേറിയതല്ല.

--നിറം എപ്പോൾ
സറൗണ്ട് ഫയലുകളുടെ പേരുകൾ, പേജ് നമ്പറുകൾ, എസ്‌കേപ്പ് സീക്വൻസുകളുള്ള പൊരുത്തപ്പെടുന്ന ടെക്‌സ്‌റ്റ് എന്നിവ പ്രദർശിപ്പിക്കുക
ടെർമിനലിൽ അവ നിറത്തിലാണ്. (സ്ഥിരസ്ഥിതി ക്രമീകരണം കാര്). എപ്പോൾ ആകാം:

എല്ലായിപ്പോഴും
stdout ഒരു ടെർമിനൽ അല്ലാത്തപ്പോൾ പോലും എപ്പോഴും നിറങ്ങൾ ഉപയോഗിക്കുക.

ഒരിക്കലും
നിറങ്ങൾ ഉപയോഗിക്കരുത്.

കാര്
stdout ഒരു ടെർമിനൽ ആയിരിക്കുമ്പോൾ മാത്രം നിറങ്ങൾ ഉപയോഗിക്കുക.

-o, --മാത്രം-പൊരുത്തം
ചുറ്റുപാടുകളൊന്നും കൂടാതെ ഒരു വരിയുടെ പൊരുത്തപ്പെടുന്ന ഭാഗം മാത്രം പ്രിന്റ് ചെയ്യുക.

-r, --ആവർത്തന
എല്ലാ ഫയലുകളും ആവർത്തിച്ച് തിരയുക (നിയന്ത്രിച്ചിരിക്കുന്നത് --ഉൾപ്പെടുന്നു ഒപ്പം --പെടുത്തിയിട്ടില്ല) ഓരോന്നിനും കീഴിൽ
ഡയറക്ടറി, സിംലിങ്കുകൾ കമാൻഡ് ലൈനിലാണെങ്കിൽ മാത്രം.

-R, --dereference-recursive
അതുപോലെ തന്നെ -r, എന്നാൽ എല്ലാ സിംലിങ്കുകളും പിന്തുടരുന്നു.

--ഒഴിവാക്കുക=GLOB
അടിസ്ഥാന നാമവുമായി പൊരുത്തപ്പെടുന്ന ഫയലുകൾ ഒഴിവാക്കുക GLOB. കാണുക ഗ്ലോബ്(7) വൈൽഡ്കാർഡുകൾക്കായി നിങ്ങൾക്ക് ഉപയോഗിക്കാം. നിങ്ങൾ
കൂടുതൽ പാറ്റേണുകൾ ഒഴിവാക്കാൻ ഈ ഓപ്ഷൻ ഒന്നിലധികം തവണ ഉപയോഗിക്കാം. അതിനു മുൻതൂക്കം ലഭിക്കുന്നു
--ഉൾപ്പെടുന്നു. ശ്രദ്ധിക്കുക, ഇതിലൂടെ കണ്ടെത്തുന്ന ഫയലുകൾക്ക് മാത്രമേ ഇൻ-ഉം ഒഴിവാക്കലും ബാധകമാകൂ --ആവർത്തന ഒപ്പം
ആർഗ്യുമെന്റ് ലിസ്റ്റിലേക്കല്ല.

--ഉൾപ്പെടുത്തുക=GLOB
അടിസ്ഥാന നാമം പൊരുത്തപ്പെടുന്ന ഫയലുകൾ മാത്രം തിരയുക GLOB. കാണുക --പെടുത്തിയിട്ടില്ല വിശദാംശങ്ങൾക്ക്. സ്ഥിരസ്ഥിതി
is *.pdf.

--പാസ്‌വേഡ്=പാസ്വേഡ്
PDF ഫയലുകൾ ഡീക്രിപ്റ്റ് ചെയ്യാൻ PASSWORD ഉപയോഗിക്കുക. ഒന്നിലധികം തവണ വ്യക്തമാക്കാം; എല്ലാ പാസ്വേഡുകളും
എല്ലാ PDF-കളിലും പരീക്ഷിക്കും. കുറിപ്പ് ഈ പാസ്‌വേഡ് നിങ്ങളുടെ കമാൻഡിൽ കാണിക്കും
ചരിത്രവും ഔട്ട്പുട്ടും ps(1). അതിനാൽ സുരക്ഷയുണ്ടെങ്കിൽ ദയവായി ഇത് ഉപയോഗിക്കരുത് പാസ്വേഡ്
പ്രധാനമാണ്.

-m, --പരമാവധി-എണ്ണം NUMBER
അതിനുശേഷം ഒരു ഫയൽ വായിക്കുന്നത് നിർത്തുക NUMBER മത്സരങ്ങൾ. -c അല്ലെങ്കിൽ --count ഓപ്ഷനും ഉപയോഗിക്കുമ്പോൾ,
pdfgrep എന്നതിനേക്കാൾ കൂടുതൽ എണ്ണം ഔട്ട്‌പുട്ട് ചെയ്യുന്നില്ല NUMBER.

-Z, --ശൂന്യം
ഒരു നൾ ബൈറ്റ് ഔട്ട്പുട്ട് ചെയ്യുക (വിളിക്കുന്നത് NUL കോളണിന് പകരം ASCII-ലും '\0' C-ലും
സാധാരണയായി ഒരു ഫയലിന്റെ പേര് ബാക്കി വരിയിൽ നിന്ന് വേർതിരിക്കുന്നു. ഈ ഓപ്ഷൻ ഔട്ട്പുട്ട് ചെയ്യുന്നു
ഫയലിന്റെ പേരിൽ കോളണുകൾ, സ്‌പെയ്‌സുകൾ അല്ലെങ്കിൽ ന്യൂലൈനുകൾ എന്നിവയുടെ സാന്നിധ്യത്തിൽ അവ്യക്തമാണ്. അത് ആവാം
തുടങ്ങിയ കമാൻഡുകൾക്കൊപ്പം ഉപയോഗിക്കുന്നു xargs -0 or മുത്ത് -0.

--മാച്ച്-പ്രിഫിക്സ്-സെപ്പറേറ്റർ SEP
ഔട്ട്‌പുട്ടിലെ ഫയലിന്റെ പേര്, ലൈൻ നമ്പർ, ടെക്‌സ്‌റ്റ് എന്നിവ വേർതിരിക്കുന്നതിന് ഉപയോഗിക്കുന്ന കോളണിലേക്ക് മാറ്റുന്നു
SEP, ഒരു ഏകപക്ഷീയമായ സ്ട്രിംഗ് ആകാം. ഫയൽ നാമങ്ങളിൽ കോളണുകൾ അടങ്ങിയിരിക്കുമ്പോൾ ഇത് ഉപയോഗപ്രദമാണ്,
എന്നാൽ സംവേദനാത്മക ഉപയോഗത്തിന് മാത്രം. സ്ക്രിപ്റ്റിങ്ങിന്, --ശൂന്യം ഉപയോഗിക്കണം.

--ഡീബഗ്
ഡീബഗ് ഔട്ട്പുട്ട് പ്രവർത്തനക്ഷമമാക്കുക. കുറിപ്പ്: പതിപ്പ് 0.30.0-ന് മുമ്പുള്ള പോപ്ലറിന്റെ പരിമിതികൾ കാരണം, ചിലത്
ഡീബഗ് ഔട്ട്പുട്ടും കൂടാതെ പ്രിന്റ് ചെയ്യുന്നു --ഡീബഗ് അത്തരമൊരു പോപ്ലർ പതിപ്പ് ഉപയോഗിക്കുമ്പോൾ.

--മുന്നറിയിപ്പ്-ശൂന്യം
ഒരു മുന്നറിയിപ്പ് അച്ചടിക്കുക stderr ഒരു PDF-ൽ തിരയാനാകുന്ന വാചകം ഇല്ലെങ്കിൽ. ഇതാണ് കേസ്
ചിത്രങ്ങൾ മാത്രം ഉൾക്കൊള്ളുന്ന PDF-കൾ, ഉദാഹരണത്തിന് സ്കാൻ ചെയ്ത പ്രമാണങ്ങൾ.

--unac
തിരയൽ പാറ്റേണിൽ നിന്നും PDF പ്രമാണങ്ങളിൽ നിന്നും ആക്‌സന്റുകളും ലിഗേച്ചറുകളും നീക്കം ചെയ്യുക. ഈ
"ae" അടങ്ങിയിരിക്കുന്ന ഒരു വാക്ക് തിരയണമെങ്കിൽ അത് ഉപയോഗപ്രദമാണ്, എന്നാൽ PDF ഉപയോഗിക്കുന്നത്
പകരം "æ" എന്ന ഒറ്റ അക്ഷരം. കാണുക unac(3) ഒപ്പം ഉച്ചാരണമില്ലാത്ത(1) വിവരങ്ങൾക്ക്.

ഓപ്ഷൻ is പരീക്ഷണാത്മകം ഒപ്പം മാത്രം ലഭ്യമായ if pdfgrep is സമാഹരിച്ചത് കൂടെ unac
പിന്തുണ.

-q, --നിശബ്ദമായി
എല്ലാ സാധാരണ ഔട്ട്‌പുട്ടും stdout-ലേക്ക് അടിച്ചമർത്തുക. പിശകുകൾ അച്ചടിക്കുകയും എക്സിറ്റ് കോഡുകൾ നൽകുകയും ചെയ്യും
തിരികെ ലഭിക്കും (ചുവടെ കാണുക).

--സഹായിക്കൂ
ഓപ്ഷനുകളുടെ ഒരു ഹ്രസ്വ സംഗ്രഹം അച്ചടിക്കുക.

-V, --പതിപ്പ് പതിപ്പ് വിവരങ്ങൾ കാണിക്കുക.

പുറത്ത് പദവി


സാധാരണയായി, കുറഞ്ഞത് ഒരു പൊരുത്തം കണ്ടെത്തിയാൽ എക്സിറ്റ് സ്റ്റാറ്റസ് 0 ആണ്, പൊരുത്തമൊന്നും കണ്ടെത്തിയില്ലെങ്കിൽ 1 ആണ്
2 ഒരു പിശക് സംഭവിച്ചാൽ. എന്നാൽ എങ്കിൽ --നിശബ്ദമായി or -q ഓപ്ഷൻ ഉപയോഗിച്ചു, ഒരു പൊരുത്തം കണ്ടെത്തി,
pdfgrep പിശകുകൾ പരിഗണിക്കാതെ 0 നൽകും.

ENVIRONMENT വ്യത്യാസങ്ങൾ


യുടെ പെരുമാറ്റം pdfgrep ഇനിപ്പറയുന്ന പരിസ്ഥിതി വേരിയബിൾ ബാധിക്കുന്നു.

GREP_COLORS
വിവിധ ഭാഗങ്ങൾ ഹൈലൈറ്റ് ചെയ്യാൻ ഉപയോഗിക്കുന്ന നിറങ്ങളും മറ്റ് ആട്രിബ്യൂട്ടുകളും വ്യക്തമാക്കുന്നു
ഔട്ട്പുട്ട്. വാക്യഘടനയും മൂല്യങ്ങളും ഇതുപോലെയാണ് GREP_COLORS of grep. കാണുക grep(1) കൂടുതൽ കാര്യങ്ങൾക്കായി
വിശദാംശങ്ങൾ. നിലവിൽ കഴിവുകൾ മാത്രം mt, ms, mc, fn, ln ഒപ്പം se ഉപയോഗിക്കുന്നത്
pdfgrepഎവിടെ mt, ms ഒപ്പം mc സമാന ഫലം.

ഉദാഹരണങ്ങൾ


അച്ചടിക്കുക The ആദ്യം ലൈനുകൾ പൊരുത്തപ്പെടുന്നു പാറ്റേൺ ഒപ്പം അച്ചടിക്കുക അവരുടെ പേജ് അക്കം

pdfgrep -n --max-count 10 പാറ്റേൺ foo.pdf

തിരയൽ എല്ലാം .pdf ഫയലുകൾ ആരുടെ പേരുകൾ ആരംഭിക്കുന്നു കൂടെ ഫൂ ആവർത്തിച്ച് in The നിലവിലുള്ളത് ഡയറക്ടറി

pdfgrep -r --"foo*.pdf" പാറ്റേൺ ഉൾപ്പെടുത്തുക

തിരയൽ എല്ലാം .pdf ഫയലുകൾ ആകുന്നു ചെറുത് അധികം 12M ആവർത്തിച്ച് in The നിലവിലുള്ളത് ഡയറക്ടറി

കണ്ടെത്തുക . -name "*.pdf" -size -12M -print0 | xargs -0 pdfgrep പാറ്റേൺ

മുമ്പത്തെ ഉദാഹരണങ്ങളിൽ നിന്ന് വ്യത്യസ്തമായി, ഈ ടാസ്ക് പരിഹരിക്കാൻ കഴിഞ്ഞില്ല എന്നത് ശ്രദ്ധിക്കുക
pdfgrep മാത്രം, എന്നാൽ Unix ടൂളുകൾ കണ്ടെത്തുക(1) ഒപ്പം xargs(1) ഉപയോഗിക്കേണ്ടതായിരുന്നു. അത് കാരണം
pdfgrep-ൽ തന്നെ ഫയലുകളെ അവയുടെ വലിപ്പമനുസരിച്ച് ഒഴിവാക്കാനുള്ള ഓപ്ഷനുകൾ ഉൾപ്പെടുന്നില്ല. എന്നാൽ നിങ്ങൾ കാണുന്നതുപോലെ,
അത് ആവശ്യമില്ല!

onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് pdfgrep ഓൺലൈനായി ഉപയോഗിക്കുക



ഏറ്റവും പുതിയ ലിനക്സ്, വിൻഡോസ് ഓൺലൈൻ പ്രോഗ്രാമുകൾ