unfluff download para sa Linux

Ito ang Linux app na pinangalanang unfluff na ang pinakabagong release ay maaaring ma-download bilang node-unfluffv3.2.0sourcecode.tar.gz. Maaari itong patakbuhin online sa libreng hosting provider na OnWorks para sa mga workstation.

 
 

I-download at patakbuhin online ang app na ito na pinangalanang unfluff sa OnWorks nang libre.

Sundin ang mga tagubiling ito upang patakbuhin ang app na ito:

- 1. Na-download ang application na ito sa iyong PC.

- 2. Ipasok sa aming file manager https://www.onworks.net/myfiles.php?username=XXXXX kasama ang username na gusto mo.

- 3. I-upload ang application na ito sa naturang filemanager.

- 4. Simulan ang OnWorks Linux online o Windows online emulator o MACOS online emulator mula sa website na ito.

- 5. Mula sa OnWorks Linux OS na kasisimula mo pa lang, pumunta sa aming file manager https://www.onworks.net/myfiles.php?username=XXXX gamit ang username na gusto mo.

- 6. I-download ang application, i-install ito at patakbuhin ito.

MGA SCREENSHOT:


unfluff


DESCRIPTION:

Ang unfluff ay isang library ng Node.js na idinisenyo upang awtomatikong i-extract ang pangunahing nilalaman mula sa isang HTML na dokumento — tinatanggal ang mga navigation bar, ad, footer at iba pang boilerplate upang maiwan sa iyo ang “body content”, metadata (title, author, date) at iba pang kapaki-pakinabang na field. Ito ay isang tool na lubos na naglalayong sa pagsusuri ng nilalaman, pag-scrape ng web, pagbuo ng mga dataset, o pag-repurposing ng teksto ng artikulo para sa downstream na pagproseso (tulad ng machine-learning o pagbubuod). Ang API ay simple: nagpapakain ka sa hilaw na HTML at nagbabalik ito ng isang structured na bagay na may nakuhang text at iba pang mga field. Sinusuportahan nito ang pag-cache ng mga panloob na representasyon upang mapabilis ang paulit-ulit na pagkuha. Bagama't pinakamainam ang suporta sa wika nito para sa English, malawak pa rin itong ginagamit sa mga pipeline sa pagpoproseso ng nilalaman ng web. Ang repositoryo ay nagtatala ng ilang mga limitasyon (hal., ang mga wika tulad ng Chinese/Arabic/Korean ay maaaring hindi suportado ng mabuti). Dahil sa pagiging simple nito at nakatutok na layunin, maaari itong maging isang maaasahang building block sa mga backend services o CLI tool.



Mga tampok

  • Kinukuha ang pangunahing nilalamang teksto (katawan) mula sa isang HTML na dokumento
  • Nag-parse at nagbabalik ng metadata (pamagat, may-akda, petsa, pagtuklas ng wika atbp)
  • Nag-cache ng mga intermediate na representasyon para sa performance kapag kumukuha ng maraming field
  • Suporta sa CLI / module: maaaring mai-install sa buong mundo o gamitin sa programmatically
  • Angkop para sa pagbuo ng mga dataset, pag-scrape ng artikulo, muling pag-publish ng mga daloy ng trabaho
  • Open-source sa ilalim ng Apache-2.0 na lisensya, madaling isama sa Node.js stacks



Kategorya

HTML/XHTML

Ito ay isang application na maaari ding makuha mula sa https://sourceforge.net/projects/unfluff.mirror/. Na-host ito sa OnWorks upang mapatakbo online sa pinakamadaling paraan mula sa isa sa aming mga libreng Operative System.



Pinakabagong Linux at Windows online na mga programa


Mga kategorya upang i-download ang Software at Mga Programa para sa Windows at Linux