هذا هو الأمر htdump الذي يمكن تشغيله في موفر الاستضافة المجاني OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت
برنامج:
اسم
htdump - اكتب نسخة نصية من قاعدة بيانات المستندات ASCII
موجز
htdump [خيارات]
الوصف
يكتب Htdump إصدار نص ASCII من قاعدة بيانات المستندات بنفس شكل ملف
-t خيار htdig.
OPTIONS
-a استخدم ملفات العمل البديلة. يخبر htdump بالإلحاق .عمل لملفات قاعدة البيانات، مما يسمح
للعمل على مجموعة ثانية من قواعد البيانات.
-c ملف التكوين
استخدم المحدد ملف التكوين بدلا من الافتراضي.
-v وضع مفصل. هذا ليس له تأثير كبير.
قم بتقديم تنسيقات
وثيقة قاعدة البيانات
يبدأ كل سطر في الملف بمعرف المستند متبوعًا بقائمة اسم الحقل :
قيمنا مفصولة بعلامات التبويب. تظهر الحقول دائمًا بالترتيب المذكور أدناه:
u URL
t عنوان الاعلان
a الحالة (0 = عادي، 1 = غير موجود، 2 = غير مفهرس، 3 = قديم)
m وقت التعديل الأخير كما أبلغ عنه الخادم
s الحجم بالبايت
H مقتطفات
h وصف ميتا
l وقت آخر استرجاع
L عدد الروابط الموجودة في المستند (الروابط الصادرة)
b عدد الروابط إلى المستند (الروابط الواردة أو الروابط الخلفية)
c HopCount من هذه الوثيقة
g توقيع الوثيقة المستخدمة للكشف عن التكرارات
e عنوان البريد الإلكتروني الذي سيتم استخدامه لرسالة إعلام من htnotify
n تاريخ إرسال رسالة إعلام بالبريد الإلكتروني
S موضوع لرسالة البريد الإلكتروني الإخطار
d نص الروابط التي تشير إلى هذه الوثيقة. (على سبيل المثال <أ
href="/docURL">الوصف )
A المراسي في الوثيقة (أي
كلمة قاعدة البيانات
على الرغم من أن htdump وhtload لا يتعاملان مع قاعدة بيانات الكلمات بشكل مباشر، إلا أن الأمر يستحق ذلك
أذكرها هنا لأنك تحتاج إلى التعامل معها عند نسخ ASCII
قواعد البيانات من نظام إلى آخر. قاعدة بيانات الكلمات الأولية التي تنتجها htdig
موجود بالفعل بتنسيق ASCII، ويتم إنتاج نسخة ثنائية منه بواسطة htmerge، لـ
استخدمه عن طريق htsearch. لذلك، عند النسخ عبر إصدار ASCII لقاعدة بيانات المستندات
التي تم إنتاجها بواسطة htdump، فأنت بحاجة إلى نسخ قائمة الكلمات أيضًا، ثم تشغيل htload إلى
إنشاء قاعدة بيانات المستندات الثنائية على النظام المستهدف، ثم تشغيل htmerge
لجعل مؤشر الكلمة.
يبدأ كل سطر في ملف قائمة الكلمات بالكلمة
تليها قائمة اسم الحقل : قيمنا مفصولة بعلامات التبويب. تظهر الحقول دائمًا
بالترتيب المذكور أدناه، مع كون الأخيرين اختياريين:
i معرف المستند
l موقع الكلمة في المستند (من 1 إلى 1000)
w وزن الكلمة على أساس عوامل التسجيل
c عدد مرات ظهور الكلمة في المستند، إذا كان أكثر من 1
a رقم المرساة إذا حدثت الكلمة بعد مرساة مسماة
استخدم htdump عبر الإنترنت باستخدام خدمات onworks.net