שרבוט - מקוון בענן

זהו שרבוט הפקודה שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

תָכְנִית:

שֵׁם


דודל - כלי לחיפוש במטא נתונים בקבצים שלך

תַקצִיר


לשרבט [אפשרויות] ([FILENAMES]*|[KEYWORDS]*)

תיאור


דודל הוא כלי לאינדקס קבצים. דודל משתמש ב-libextractor כדי למצוא מטא-נתונים בקבצים.
לאחר בניית מסד נתונים, ניתן להשתמש ב-Dudle כדי למצוא במהירות קבצים שבהם
מטא-נתונים תואמים למחרוזת חיפוש נתונה. בדרך זו, ניתן להשתמש בדודל לחיפוש מהיר
מערכת הקבצים שלך.

בדרך כלל, בפעם הראשונה שאתה מריץ את דודל אתה עובר את האפשרות -b לבניית מסד הנתונים.
יחד עם -b אתה מציין את רשימת הקבצים או הספריות לאינדקס, למשל

$ דודל -b $HOME

הוספה לאינדקס עם שרבוט היא מצטברת. אם דודל -b מופעל (עם אותו מסד נתונים) פעמיים
זה יעדכן את האינדקס עבור קבצים ששונו. דודל גם יסיר קבצים ש
אינם נגישים יותר. דודל לא יסיר קבצים שעדיין קיימים אבל לא
מפורט יותר ברשימת הארגומנטים. ובכך קורא גם

$ doodle -b /foo /bar # or

$ דודל -b /foo; שרבוט -b /bar

יגרום לאותו מסד נתונים שיכיל גם את האינדקס עבור /foo וגם /bar. ציין זאת
הדרך היחידה לבטל את האינדקס של /foo בשלב זה היא להפוך את /foo לבלתי נגיש (באמצעות עבור
לדוגמה chmod 000 /foo או אפילו rm -rf /foo) ואז הרץ שוב את דודל -b.

בסביבות רשתיות, לעתים קרובות הגיוני לבנות מסד נתונים בבסיס של כל אחת מהן
מערכת קבצים, המכילה את הערכים עבור אותה מערכת קבצים. בשביל זה, מופעלת דודל
כל מערכת קבצים בשרת הקבצים שבה מערכת הקבצים נמצאת בדיסק מקומי, כדי למנוע
לחבוט ברשת. משתמשים יכולים לבחור אילו מסדי נתונים מציירים חיפושים. מסדי נתונים לא יכולים
להיות משולבים יחד.

לאחר שהקבצים נוספו לאינדקס, תוכל לבצע שאילתה מהירה במסד הנתונים של השרבוטים. פשוט תרוץ

$ דודל מילת מפתח

כדי לחפש בכל הקבצים שלך מילת מפתח. שימו לב שרק המטא-נתונים שחולצו על ידי
libextractor הוא חיפוש. לפיכך, אם libextractor לא מוצא שום מטא-נתונים בקבצים,
ייתכן שלא תקבל תוצאות. אתה יכול להשתמש באפשרות -l כדי לציין לא סטנדרטי
תוספים של libextractor. לדוגמה, ניתן להשתמש בדודל כדי להחליף את כלי האיתור מ
ה-findutils של GNU כך:

$ alias updatedb="doodle -bn -d /var/lib/doodle/doodle-locate-db -l
libextractor_filename /"

$ alias locate="doodle -d /var/lib/doodle/doodle-locate-db"

אפשרויות


-a מספר, --בערך =מספר
בצע התאמה משוערת עם אי התאמה של עד NUMBER אותיות

-ב, --לִבנוֹת
לבנות את מסד הנתונים של השרבוט (הארגומנטים שעברו הם ספריות ושמות קבצים שהם
להוספה לאינדקס). בהשוואה ל-GNU איתור, הדודל הבינארי מקפל את שניהם
את האיתור ואת הכלי updatedb. משתמש ב -b אפשרות דודל בונה או מעדכנת את
מסד נתונים (שווה ערך ל-updateb), ללא -b הוא מתנהג דומה לאתר.

-d שם קובץ, --מסד נתונים=שם קובץ
השתמש ב- FILENAME עבור מיקום מסד הנתונים (השתמש בעת בנייה או חיפוש).
אפשרות זו שימושית במיוחד כאשר דודל משמש לחיפוש סוגים שונים של
קבצים (או מופעל עם אפשרויות חילוץ שונות). באמצעות אופציה זו שרבוט
יכול לשמש לבניית מדדים מיוחדים (כלומר אחד לכל מערכת קבצים), שיכולים להיכנס
הפוך לשפר את ביצועי החיפוש. בעת חיפוש, אתה יכול לעבור נקודתיים מופרדת
רשימה של שמות קבצי מסד נתונים, במקרה זה כל מסדי הנתונים מתבצעים בחיפוש. ציין זאת
צריכת שטח הדיסק של מסד נתונים בודד היא בדרך כלל מעט קטנה מזו
אם מסד הנתונים מפוצל למספר קבצים. עם זאת, החיסכון במקום הוא
סביר להניח שהוא קטן (כמה אחוזים). אתה יכול גם להשתמש במשתנה הסביבה
DOODLE_PATH כדי להגדיר את רשימת קבצי מסד הנתונים לחיפוש. האפשרות עוקפת את
משתנה סביבה אם נעשה שימוש בשניהם. אם האפשרות לא ניתנת ו-DOODLE_PATH
לא מוגדר, נעשה שימוש ב-"/var/lib/doodle".

-e, --לחלץ
להדפיס את מילות המפתח שחולצו עבור כל קובץ תואם שנמצא. שימו לב שזה יהיה
להאט מאוד את התוכנית, במיוחד אם יש הרבה התאמות במסד הנתונים.
שימו לב שאם האפשרויות שניתנו עבור libextractor שונות מהאפשרויות בהן נעשה שימוש
לבניית האינדקס ייתכן שהתוצאות לא יכילו את מחרוזת החיפוש.

-f, --שמות קבצים
כלול שמות קבצים (נתיב מלא) בקבוצת מילות המפתח

-h, - עזרה
להדפיס דף עזרה

-אני, --התעלם ממקרה
להיות חסר רגישות לאותיות גדולות

-l ספריות, --ספרייה=ספריות
ציין באילו תוספים של libextractor להשתמש (לבניית האינדקס עם -b או עבור
הדפסת מידע על קבצים עם -e)

-L שם קובץ, --log=שם קובץ
רשום את כל מילות המפתח שנתקלו בקובץ יומן בשם FILENAME. אפשרות זו היא בעיקר
שימושי לניפוי באגים.

-m להגביל, --זיכרון=להגביל
השתמש לכל היותר ב-LIMIT MB של זיכרון עבור הצמתים של עץ הסיומת (אחרי זה,
סדרה לדיסק). שימו לב שערך קטן יותר יקטין את צריכת הזיכרון אבל
הגדל את גודל הקובץ הזמני (והאט את יצירת האינדקס). ברירת המחדל היא 8
MB.

-n, --ברירת מחדל
אל תטען את ערכת ברירת המחדל של תוספים (טען רק תוספים שצוינו ב-l)

-p, --הדפס
צור dump מסך קריא אנושי של מסד הנתונים של השרבוטים (רק שימושי באמת עבור
איתור באגים)

-P נתיב, --Prunepaths=נתיב
מדריכים לא לשים במסד הנתונים, מה שאם לא כן. הסביבה
המשתנה PRUNEPATHS גם קובע ערך זה. ברירת המחדל היא "/ Tmp /usr/tmp / var / tmp / dev
/ proc / sys"אפשרות זו יכולה לשמש גם בעת חיפוש, ובמקרה זה חיפוש
תתעלמו מהתוצאות בספריות שצוינו.

-v, --גִרְסָה
להדפיס את מספר הגרסה

-V, --מִלוּלִי
להיות מילולי

הסביבה


DOODLE_PATH
רשימה מופרדת בנקודתיים של מסדי נתונים לחיפוש. שימו לב כי בעת בניית מסד הנתונים
נתיב זה חייב להכיל רק שם קובץ אחד או את האפשרות -b חייב להיות רגיל
ציין את קובץ מסד הנתונים. ברירת המחדל היא "/var/lib/doodle".

PUNEPATHS
רשימה מופרדת מרווחים של נתיבים להחרגה. ניתן לעקוף עם ה -P אוֹפְּצִיָה.

אורים


שרבוט תלוי ב-libextractor. אתה יכול להוריד את libextractor מ
http://gnunet.org/libextractor/.

השתמש ב-Dudle באינטרנט באמצעות שירותי onworks.net



התוכניות המקוונות האחרונות של לינוקס ו-Windows