GoGPT Best VPN GoSearch

סמל OnWorks

טחינה - אונליין בענן

Run grind in OnWorks free hosting provider over Ubuntu Online, Fedora Online, Windows online emulator or MAC OS online emulator

זוהי הפקודה "גרינד" שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות החינמיות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS.

תָכְנִית:

שֵׁם


לטחון - עיבוד קבצי לקסיקוגרף של WordNet

תַקצִיר


חצץ [ -v ] [ -s ] [ -Lקובץ לוג ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] שם הקובץ [
שם הקובץ... ]

תיאור


לִטחוֹן() מעבד קבצי לקסיקוגרפיה של WordNet, ומייצר קבצי מסד נתונים המתאימים לשימוש
עם קוד החיפוש והממשק של WordNet ויישומים אחרים. התחביר וה
מאומתת השלמות המבנית של קבצי הקלט. אזהרות ושגיאות מדווחות באמצעות
סטדרר ונוצר יומן זמן ריצה ב stdoutמסד נתונים נוצר רק אם יש
אין שגיאות.

קֶלֶט קבצים
קבצי הקלט תואמים לקטגוריות התחביריות המיושמות ב-WordNet - שם עצם, פועל,
תוֹאַר ו תואר הפועלכל קובץ לקסיקוגרף קלט מורכב מרשימת קבוצות של מילים נרדפות
(סינסטים) עבור חלק דיבור אחד. למרות שתחביר הסינוס הבסיסי זהה עבור כולם
חלקי הדיבר, חלקים מסוימים בתחביר חלים רק על חלק דיבר מסוים.
לִרְאוֹת wninput(5WN) לתיאור של פורמט קובץ הקלט.

כל אחד שם הקובץ המצוין הוא מהצורה:

שם נתיב/להציב.סִיוֹמֶת

איפה שם נתיב הוא אופציונלי ו להציב הוא או שם עצם, פועל, adj or adv. סִיוֹמֶת עשוי להיות בשימוש
כדי להפריד קבוצות של synsets לקבצים שונים, לדוגמה שם עצם. בעל חיים ו
שם עצם. צמחקובץ קלט אחד או יותר, בכל שילוב של קטגוריות תחביריות, עשויים להיות
נָקוּב. לִרְאוֹת לקסמנים(5WN) לרשימה של קבצי הלקסיקוגרפיה ששימשו לבניית ה-
מסד נתונים מלא של WordNet.

תְפוּקָה קבצים
לִטחוֹן() מייצר את קבצי הפלט הבאים:

┌──────────────┬───────────────────────────────────────────────────┐
שם הקובץתיאור
├─────────────┼─────────────────────────────────────────────────────────┤
אינדקס.להציב │ קובץ אינדקס עבור כל קטגוריה תחבירית │
נתונים.להציב │ קובץ נתונים עבור כל קטגוריה תחבירית │
אינדקס.סנס │ אינדקס חישה │
└─────────────┴────────────────────────────────────────────────────────┘
לִרְאוֹת wndb(5WN) לתיאור של פורמטי קבצי מסד הנתונים.

בכל פעם לִטחוֹן() מופעל, כל קבצי מסד הנתונים הקיימים מוחלפים על ידי מסד הנתונים
קבצים שנוצרו מקבצי הקלט שצוינו. אם אין קבצי קלט מקובץ תחבירי
אם מצוינות קטגוריות, קבצי מסד הנתונים המתאימים לא יימחקו.

תחושה מספרים
החושים מסודרים בדרך כלל מהשימוש הרב ביותר לפחות, כאשר הנפוצים ביותר
ממוספר במובן 1תדירות השימוש נקבעת על ידי מספר הפעמים שחוש מתויג
בטקסטים השונים של קונקורדנציה סמנטית. מובנים שאינם מתויגים סמנטית עוקבים אחריהם
החושים המסודרים בסדר שרירותי. שימו לב שסידור זה הוא רק הערכה
בהתבסס על שימוש בקורפוס קטן.

השמיים tagsense_cnt שדה עבור כל ערך ב אינדקס.להציב קבצים מציין כמה מה
החושים ברשימה תויגו.

השמיים רשימת מעקב הקובץ שמסופק עם מסד הנתונים מפרט את מספר הפעמים שכל חוש מתויג
בקונקורדנציות הסמנטיות. לִטחוֹן() משתמש בנתונים מ רשימת מעקב לסדר את החושים של
כל מילה. כאשר ה מדד.להציב נוצרים קבצים, ה synset_offsets מופקים במובן
סדר מספרים, כאשר משמעות 1 ראשונה ברשימה. משמעות עם אותו מספר של משמעות סמנטית
לתגים מוקצים מספרי משמעות ייחודיים אך עוקבים. רשת המילים סקירה כללית search
מציג את כל המובנים של המילה שצוינה, בכל הקטגוריות התחביריות, ומציין
אילו מהחושים מיוצגים בטקסטים המתויגים סמנטית.

אפשרויות


-v אימות שלמות הקלט מבלי ליצור מסד נתונים.

-s דיכוי יצירת הודעות אזהרה. בדרך כלל חצץ מנוהל עם זה
אפשרות עד שכל השגיאות התחביריות והמבניות יתוקנו מאז ה-
הודעות אזהרה עלולות להקשות על זיהוי הודעות שגיאה.

-Lקובץ לוג כתוב את כל ההודעות אל קובץ לוג במקום סטדרר.

-a יצירת דוח סטטיסטי על קבצי קלט שעובדו.

-d יצירת דוח התפלגות חיושים לפי אורך מחרוזת על קבצי קלט
מעובד.

-i צור קובץ אינדקס חישה.

-o סדר חושים באמצעות רשימת מעקב.

-n צור קישורי נומינליזציה (מורפולוגיה נגזרת) במסד נתונים.

שם הקובץ קובץ קלט של הטופס המתואר ב קֶלֶט קבצים.

השתמש ב-Grind באינטרנט באמצעות שירותי onworks.net


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

פקודות לינוקס

Ad




×
פרסומת
❤️קנו, הזמינו או קנו כאן - ללא עלות, עוזר לשמור על שירותים בחינם.