هذا هو أمر "طحن" الذي يمكن تشغيله في موفر الاستضافة المجاني OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
Grind - معالجة ملفات معجم WordNet
موجز
طحن [ -v ] [ -s ] [ -Lملف تسجيل ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] اسم الملف [
اسم الملف...]
الوصف
طَحن() يعالج ملفات معجم WordNet، وينتج ملفات قاعدة بيانات مناسبة للاستخدام
مع بحث WordNet ورمز الواجهة والتطبيقات الأخرى. النحوية و
يتم التحقق من السلامة الهيكلية لملفات الإدخال. يتم الإبلاغ عن التحذيرات والأخطاء عبر
ستدير ويتم إنتاج سجل وقت التشغيل المعياري. يتم إنشاء قاعدة بيانات فقط إذا كان هناك
لا توجد أخطاء.
إدخال ملفات
تتوافق ملفات الإدخال مع الفئات النحوية المطبقة في WordNet - الاسم, الفعل,
الصفة و ظرف حال. يتكون كل ملف معجمي مُدخل من قائمة مجموعات المرادفات
(com.synsets) لجزء واحد من الكلام. على الرغم من أن بناء جملة Synset الأساسي هو نفسه بالنسبة للجميع
أجزاء الكلام، وبعض أجزاء بناء الجملة تنطبق فقط على جزء معين من الكلام.
يرى com.wninput(5WN) للحصول على وصف لتنسيق ملف الإدخال.
كل اسم الملف المحدد هو من النموذج:
اسم المسار/بعد.لاحقة
أين اسم المسار اختياري و بعد اما الاسم, الفعل, صفة or أدف. لاحقة يمكن استخدامها
لفصل مجموعات Synsets إلى ملفات مختلفة، على سبيل المثال nom.animal و
non.plant. قد يكون هناك واحد أو أكثر من ملفات الإدخال، في أي مجموعة من الفئات النحوية
محدد. يرى معجم(5WN) للحصول على قائمة بملفات المعجمي المستخدمة لبناء ملف
قاعدة بيانات WordNet كاملة.
الناتج ملفات
طَحن() ينتج ملفات الإخراج التالية:
┌──────────┬─────────────────────── ────────── ────┐
│ اسم الملف │ الوصف │
├──────────┼─────────────────────── ────────── ────┤
│مؤشر.بعد │ ملف الفهرس لكل فئة نحوية │
│البيانات.بعد │ ملف بيانات لكل فئة نحوية │
│Index.sense │ مؤشر المعنى │
└──────────┴─────────────────────── ────────── ────┘
يرى com.wndb(5WN) للحصول على وصف لتنسيقات ملفات قاعدة البيانات.
في كل مرة طَحن() عند تشغيله، تتم الكتابة فوق أي ملفات قاعدة بيانات موجودة بقاعدة البيانات
الملفات التي تم إنشاؤها من ملفات الإدخال المحددة. إذا لم يكن هناك ملفات الإدخال من النحوي
يتم تحديد الفئة، ولا تتم الكتابة فوق ملفات قاعدة البيانات المقابلة.
إحساس أرقام
يتم ترتيب الحواس عمومًا من الأكثر استخدامًا إلى الأقل استخدامًا، ومن الأكثر شيوعًا
مرقمة بمعنى 1. يتم تحديد تكرار الاستخدام من خلال عدد المرات التي يتم فيها وضع علامة على المعنى
في مختلف نصوص التوافق الدلالي. تتبع الحواس التي لم يتم وضع علامة عليها دلاليًا
الحواس المرتبة في ترتيب تعسفي. لاحظ أن هذا الترتيب هو مجرد تقدير
على أساس الاستخدام في مجموعة صغيرة.
إنّ كافة أنواع عهود الـ tagense_cnt حقل لكل إدخال في مؤشر.بعد تشير الملفات إلى عدد الملفات
تم وضع علامة على الحواس في القائمة.
إنّ كافة أنواع عهود الـ com.ctlist يسرد الملف المقدم مع قاعدة البيانات عدد المرات التي يتم فيها وضع علامة على كل حاسة
في التوافقات الدلالية. طَحن() يستخدم البيانات من com.ctlist لترتيب الحواس
كل كلمة. عندما مؤشر.بعد يتم إنشاء الملفات، و Synset_offsetيتم إخراج s بالمعنى
ترتيب الأرقام، مع المعنى 1 أولاً في القائمة. الحواس التي لها نفس العدد من الدلالات
يتم تعيين العلامات بأرقام معنى فريدة ولكن متتالية. وورد نت نظرة عامة .
يعرض جميع معاني الكلمة المحددة، في جميع الفئات النحوية، ويشير
أي من الحواس ممثلة في النصوص الموسومة دلاليا.
OPTIONS
-v التحقق من سلامة المدخلات دون إنشاء قاعدة بيانات.
-s قمع توليد رسائل التحذير. عادة طحن يتم تشغيله مع هذا
الخيار حتى يتم تصحيح كافة الأخطاء النحوية والهيكلية منذ
قد تجعل رسائل التحذير من الصعب اكتشاف رسائل الخطأ.
-Lملف تسجيل اكتب جميع الرسائل إلى ملف تسجيل بدلا من ستدير.
-a إنشاء تقرير إحصائي عن ملفات الإدخال التي تمت معالجتها.
-d توليد توزيع الحواس عن طريق تقرير طول السلسلة على ملفات الإدخال
معالجتها.
-i إنشاء ملف فهرس المعنى.
-o ترتيب الحواس باستخدام com.ctlist.
-n إنشاء روابط تسمية (مورفولوجيا مشتقة) في قاعدة البيانات.
اسم الملف ملف الإدخال للنموذج الموضح في إدخال الملفات.
استخدم Grind عبر الإنترنت باستخدام خدمات onworks.net