GoGPT Best VPN GoSearch

OnWorks فافيكون

تنزيل unfluff لنظام Linux

Free download unfluff Linux app to run online in Ubuntu online, Fedora online or Debian online

هذا تطبيق لينكس يُدعى unfluff، ويمكن تنزيل أحدث إصدار منه باسم node-unfluffv3.2.0sourcecode.tar.gz. ويمكن تشغيله عبر الإنترنت من خلال موفر الاستضافة المجاني OnWorks لمحطات العمل.

قم بتنزيل وتشغيل هذا التطبيق المسمى unfluff عبر الإنترنت باستخدام OnWorks مجانًا.

اتبع هذه التعليمات لتشغيل هذا التطبيق:

- 1. قم بتنزيل هذا التطبيق على جهاز الكمبيوتر الخاص بك.

- 2. أدخل في مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX باسم المستخدم الذي تريده.

- 3. تحميل هذا التطبيق في هذا الملف.

- 4. ابدأ تشغيل OnWorks Linux عبر الإنترنت أو محاكي Windows عبر الإنترنت أو محاكي MACOS عبر الإنترنت من هذا الموقع.

- 5. من نظام تشغيل OnWorks Linux الذي بدأته للتو ، انتقل إلى مدير الملفات الخاص بنا https://www.onworks.net/myfiles.php؟username=XXXXX مع اسم المستخدم الذي تريده.

- 6. قم بتنزيل التطبيق وتثبيته وتشغيله.

SCREENSHOTS

Ad


غير منفوش


الوصف

unfluff هي مكتبة Node.js مصممة لاستخراج المحتوى الرئيسي تلقائيًا من مستند HTML، مع إزالة أشرطة التنقل والإعلانات والتذييلات والعناصر النمطية الأخرى، لتبقى لك "محتوى النص" والبيانات الوصفية (العنوان، المؤلف، التاريخ) وحقول أخرى مفيدة. إنها أداة مُصممة بشكل أساسي لتحليل المحتوى، وكشط بيانات الويب، وبناء مجموعات البيانات، أو إعادة استخدام نصوص المقالات للمعالجة اللاحقة (مثل التعلم الآلي أو التلخيص). واجهة برمجة التطبيقات بسيطة: تُدخل HTML الخام، وتُعيد كائنًا مُهيكلًا يحتوي على النص المُستخرج والحقول الأخرى. تدعم المكتبة تخزين التمثيلات الداخلية مؤقتًا لتسريع عمليات الاستخراج المتكررة. على الرغم من أن دعمها اللغوي هو الأفضل للغة الإنجليزية، إلا أنها لا تزال تُستخدم على نطاق واسع في خطوط أنابيب معالجة محتوى الويب. تُشير المكتبة إلى بعض القيود (على سبيل المثال، قد لا تكون لغات مثل الصينية/العربية/الكورية مدعومة جيدًا). ​​بفضل بساطتها وغرضها المُركز، يُمكن أن تكون أداة بناء موثوقة في خدمات الواجهة الخلفية أو أدوات واجهة سطر الأوامر.



شرح المميزات:

  • استخراج النص الرئيسي (الجسم) من مستند HTML
  • يقوم بتحليل وإرجاع البيانات الوصفية (العنوان، المؤلف، التاريخ، كشف اللغة وما إلى ذلك)
  • تخزين التمثيلات الوسيطة مؤقتًا لتحسين الأداء عند استخراج حقول متعددة
  • دعم CLI/الوحدة النمطية: يمكن تثبيته عالميًا أو استخدامه برمجيًا
  • مناسب لبناء مجموعات البيانات، وكشط المقالات، وإعادة نشر سير العمل
  • مفتوح المصدر بموجب ترخيص Apache-2.0، وسهل التكامل في مجموعات Node.js



التصنيفات

HTML / XHTML

هذا تطبيق يُمكن تنزيله أيضًا من https://sourceforge.net/projects/unfluff.mirror/. وقد استُضيف في OnWorks لتشغيله عبر الإنترنت بسهولة من أحد أنظمتنا التشغيلية المجانية.


خوادم ومحطات عمل مجانية

قم بتنزيل تطبيقات Windows و Linux

أوامر لينكس

Ad




×
الإعلانات
❤️تسوق أو احجز أو اشترِ هنا - بدون تكلفة، مما يساعد على إبقاء الخدمات مجانية.