এটি unfluff নামের লিনাক্স অ্যাপ যার সর্বশেষ রিলিজটি node-unfluffv3.2.0sourcecode.tar.gz নামে ডাউনলোড করা যেতে পারে। এটি ওয়ার্কস্টেশনের জন্য বিনামূল্যের হোস্টিং প্রদানকারী OnWorks-এ অনলাইনে চালানো যেতে পারে।
অনওয়ার্কস সহ আনফ্লাফ নামের এই অ্যাপটি বিনামূল্যে অনলাইনে ডাউনলোড করুন এবং চালান।
এই অ্যাপটি চালানোর জন্য এই নির্দেশাবলী অনুসরণ করুন:
- 1. আপনার পিসিতে এই অ্যাপ্লিকেশনটি ডাউনলোড করুন৷
- 2. আমাদের ফাইল ম্যানেজারে প্রবেশ করুন https://www.onworks.net/myfiles.php?username=XXXXX আপনি যে ইউজারনেম চান।
- 3. এই ধরনের ফাইল ম্যানেজারে এই অ্যাপ্লিকেশনটি আপলোড করুন।
- 4. এই ওয়েবসাইট থেকে OnWorks Linux অনলাইন বা Windows অনলাইন এমুলেটর বা MACOS অনলাইন এমুলেটর শুরু করুন।
- 5. OnWorks Linux OS থেকে আপনি এইমাত্র শুরু করেছেন, আমাদের ফাইল ম্যানেজারে যান https://www.onworks.net/myfiles.php?username=XXXXX আপনার পছন্দের ব্যবহারকারীর নাম সহ।
- 6. অ্যাপ্লিকেশনটি ডাউনলোড করুন, এটি ইনস্টল করুন এবং এটি চালান।
স্ক্রীনশটগুলি
Ad
অপ্রস্তুত
বর্ণনাঃ
unfluff হল একটি Node.js লাইব্রেরি যা একটি HTML ডকুমেন্ট থেকে স্বয়ংক্রিয়ভাবে মূল কন্টেন্ট এক্সট্র্যাক্ট করার জন্য ডিজাইন করা হয়েছে — নেভিগেশন বার, বিজ্ঞাপন, পাদচরণ এবং অন্যান্য বয়লারপ্লেট সরিয়ে ফেলা হয় যাতে আপনার কাছে "বডি কন্টেন্ট", মেটাডেটা (শিরোনাম, লেখক, তারিখ) এবং অন্যান্য দরকারী ক্ষেত্র থাকে। এটি একটি টুল যা মূলত কন্টেন্ট-বিশ্লেষণ, ওয়েব স্ক্র্যাপিং, ডেটাসেট তৈরি, অথবা ডাউনস্ট্রিম প্রসেসিং (যেমন মেশিন-লার্নিং বা সারসংক্ষেপ) এর জন্য নিবন্ধের টেক্সট পুনঃপ্রয়োগের লক্ষ্যে কাজ করে। APIটি সহজ: আপনি কাঁচা HTML ফিড করেন এবং এটি এক্সট্র্যাক্ট করা টেক্সট এবং অন্যান্য ক্ষেত্রগুলির সাথে একটি কাঠামোগত বস্তু ফেরত দেয়। এটি বারবার এক্সট্র্যাকশন দ্রুত করার জন্য অভ্যন্তরীণ উপস্থাপনা ক্যাশিং সমর্থন করে। যদিও এর ভাষা সমর্থন ইংরেজির জন্য সেরা, এটি এখনও ওয়েব-কন্টেন্ট-প্রক্রিয়াকরণ পাইপলাইনে ব্যাপকভাবে ব্যবহৃত হয়। সংগ্রহস্থলটি কিছু সীমাবদ্ধতা উল্লেখ করে (যেমন, চীনা/আরবি/কোরিয়ানের মতো ভাষাগুলি ভালভাবে সমর্থিত নাও হতে পারে)। এর সরলতা এবং কেন্দ্রীভূত উদ্দেশ্যের কারণে, এটি ব্যাকএন্ড পরিষেবা বা CLI সরঞ্জামগুলিতে একটি নির্ভরযোগ্য বিল্ডিং ব্লক হতে পারে।
বৈশিষ্ট্য
- একটি HTML ডকুমেন্ট থেকে মূল টেক্সট কন্টেন্ট (বডি) বের করে।
- মেটাডেটা পার্স করে এবং ফেরত দেয় (শিরোনাম, লেখক, তারিখ, ভাষা সনাক্তকরণ ইত্যাদি)
- একাধিক ক্ষেত্র বের করার সময় পারফরম্যান্সের জন্য মধ্যবর্তী উপস্থাপনা ক্যাশে করে।
- CLI / মডিউল সাপোর্ট: বিশ্বব্যাপী ইনস্টল করা যেতে পারে অথবা প্রোগ্রাম্যাটিকভাবে ব্যবহার করা যেতে পারে
- ডেটাসেট তৈরি, নিবন্ধ-স্ক্র্যাপিং, কর্মপ্রবাহ পুনঃপ্রকাশের জন্য উপযুক্ত।
- Apache-2.0 লাইসেন্সের অধীনে ওপেন-সোর্স, Node.js স্ট্যাকে ইন্টিগ্রেট করা সহজ।
বিভাগ
এটি এমন একটি অ্যাপ্লিকেশন যা https://sourceforge.net/projects/unfluff.mirror/ থেকেও আনা যেতে পারে। আমাদের বিনামূল্যের অপারেটিভ সিস্টেমগুলির মধ্যে একটি থেকে সবচেয়ে সহজ উপায়ে অনলাইনে চালানোর জন্য এটি OnWorks-এ হোস্ট করা হয়েছে।
