นี่คือแอป Windows ชื่อ crwlr ซึ่งสามารถดาวน์โหลดรุ่นล่าสุดเป็น v1.2.2.zip ได้ สามารถทำงานออนไลน์ได้ใน OnWorks ผู้ให้บริการโฮสติ้งฟรีสำหรับเวิร์กสเตชัน
ดาวน์โหลดและเรียกใช้แอปนี้ออนไลน์ชื่อ crwlr พร้อม OnWorks ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OS OnWorks จากเว็บไซต์นี้ แต่โปรแกรมจำลองออนไลน์ของ Windows ที่ดีกว่า
- 5. จากระบบปฏิบัติการ Windows ของ OnWorks ที่คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่นและติดตั้ง
- 7. ดาวน์โหลดไวน์จากที่เก็บซอฟต์แวร์ลีนุกซ์ดิสทริบิวชันของคุณ เมื่อติดตั้งแล้ว คุณสามารถดับเบิลคลิกที่แอปเพื่อเรียกใช้แอปด้วย Wine คุณยังสามารถลองใช้ PlayOnLinux ซึ่งเป็นอินเทอร์เฟซแฟนซีบน Wine ที่จะช่วยคุณติดตั้งโปรแกรมและเกมยอดนิยมของ Windows
ไวน์เป็นวิธีเรียกใช้ซอฟต์แวร์ Windows บน Linux แต่ไม่จำเป็นต้องใช้ Windows Wine เป็นเลเยอร์ความเข้ากันได้ของ Windows แบบโอเพ่นซอร์สที่สามารถเรียกใช้โปรแกรม Windows ได้โดยตรงบนเดสก์ท็อป Linux โดยพื้นฐานแล้ว Wine พยายามนำ Windows กลับมาใช้ใหม่ให้เพียงพอตั้งแต่เริ่มต้น เพื่อให้สามารถเรียกใช้แอปพลิเคชัน Windows เหล่านั้นทั้งหมดโดยไม่จำเป็นต้องใช้ Windows จริงๆ
ภาพหน้าจอ
Ad
รวบรวมข้อมูล
DESCRIPTION
ไลบรารีนี้มีเฟรมเวิร์กและขั้นตอนที่เรียกว่าพร้อมใช้งานมากมาย ซึ่งคุณสามารถใช้เป็นแบบเอกสารสำเร็จรูป เพื่อสร้างโปรแกรมรวบรวมข้อมูลและเครื่องขูดของคุณเอง ก่อนดำดิ่งสู่ห้องสมุด เรามาดูคำศัพท์เกี่ยวกับการรวบรวมข้อมูลและการขูดข้อมูลกันก่อน สำหรับกรณีการใช้งานส่วนใหญ่ในโลกแห่งความเป็นจริง ทั้งสองสิ่งนี้ไปด้วยกันได้ ซึ่งเป็นเหตุผลว่าทำไมไลบรารีนี้จึงช่วยและผสมผสานทั้งสองอย่างเข้าด้วยกัน โปรแกรมรวบรวมข้อมูล (เว็บ) คือโปรแกรมที่ (ดาวน์โหลด) เอกสารและไปตามลิงก์ในนั้นเพื่อโหลดเอกสารเหล่านั้นด้วย โปรแกรมรวบรวมข้อมูลสามารถโหลดลิงก์ทั้งหมดที่กำลังค้นหา (และอนุญาตให้โหลดตามไฟล์ robots.txt) จากนั้นมันก็จะโหลดอินเทอร์เน็ตทั้งหมด (หาก URL ที่เริ่มต้นด้วยนั้นไม่มีทางตัน) หรืออาจจำกัดให้โหลดเฉพาะลิงก์ที่ตรงกับเกณฑ์บางอย่าง (ในโดเมน/โฮสต์เดียวกัน เส้นทาง URL ขึ้นต้นด้วย "/foo",...) หรือตามความลึกที่กำหนดเท่านั้น ความลึก 3 หมายถึงความลึก 3 ระดับ ลิงก์ที่พบใน URL เริ่มต้นที่ให้โปรแกรมรวบรวมข้อมูลคือระดับ 1 เป็นต้น
คุณสมบัติ
- ความสุภาพของโปรแกรมรวบรวมข้อมูล (เคารพใน robots.txt, การควบคุมปริมาณ,...)
- รับลิงก์ที่สมบูรณ์จากเอกสาร HTML
- รับแผนผังไซต์จาก robots.txt และรับ URL ทั้งหมดจากแผนผังไซต์เหล่านั้น
- รวบรวมข้อมูล (โหลด) ทุกหน้าของเว็บไซต์
- ใช้วิธีการ HTTP ใดก็ได้ (GET, POST,...) และส่งส่วนหัวหรือเนื้อหาใดๆ
- วนซ้ำหน้ารายการที่มีเลขหน้า
ภาษาโปรแกรม
PHP
หมวดหมู่
นี่เป็นแอปพลิเคชันที่สามารถเรียกได้จาก https://sourceforge.net/projects/crwlr.mirror/ มีการโฮสต์ใน OnWorks เพื่อให้ทำงานออนไลน์ด้วยวิธีที่ง่ายที่สุดจากหนึ่งในระบบปฏิบัติการฟรีของเรา