นี่คือแอป Linux ชื่อ Headless Chrome Crawler ซึ่งสามารถดาวน์โหลดรุ่นล่าสุดได้เป็น 1.8.0.zip สามารถเรียกใช้ออนไลน์ใน OnWorks ผู้ให้บริการโฮสต์ฟรีสำหรับเวิร์กสเตชัน
ดาวน์โหลดและเรียกใช้แอปนี้ทางออนไลน์ที่ชื่อว่า Headless Chrome Crawler พร้อม OnWorks ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ
Ad
โปรแกรมรวบรวมข้อมูล Chrome หัวขาด
DESCRIPTION
โปรแกรมรวบรวมข้อมูลตามการร้องขอไฟล์ HTML อย่างง่ายมักจะรวดเร็ว อย่างไรก็ตาม บางครั้งมันก็จบลงด้วยการจับภาพว่างเปล่า โดยเฉพาะอย่างยิ่งเมื่อเว็บไซต์ถูกสร้างขึ้นบนเฟรมเวิร์กส่วนหน้าที่ทันสมัย เช่น AngularJS, React และ Vue.js ขับเคลื่อนโดย Headless Chrome โปรแกรมรวบรวมข้อมูลให้ API อย่างง่ายในการรวบรวมข้อมูลเว็บไซต์แบบไดนามิก รองรับทั้งการค้นหาเชิงลึกและอัลกอริธึมการค้นหาแบบกว้างก่อน บันทึกภาพหน้าจอสำหรับหลักฐานการรวบรวมข้อมูล จำลองอุปกรณ์และ User Agent คิวลำดับความสำคัญสำหรับประสิทธิภาพในการรวบรวมข้อมูล ปฏิบัติตาม robots.txt และอื่นๆ โปรแกรมรวบรวมข้อมูลแบบคงที่นั้นอิงตามการร้องขอไฟล์ HTML อย่างง่าย โดยทั่วไปจะรวดเร็ว แต่ไม่สามารถคัดลอกเนื้อหาได้เมื่อ HTML เปลี่ยนแปลงแบบไดนามิกบนเบราว์เซอร์ โปรแกรมรวบรวมข้อมูลแบบไดนามิกที่ใช้ PhantomJS และ Selenium ทำงานอย่างน่าอัศจรรย์บนแอปพลิเคชันแบบไดนามิกดังกล่าว อย่างไรก็ตาม ผู้ดูแลของ PhantomJS ได้ลาออกและแนะนำให้เปลี่ยนไปใช้ Headless Chrome ซึ่งรวดเร็วและเสถียร โปรแกรมรวบรวมข้อมูลนี้เป็นไดนามิกและอิงตาม Headless Chrome
คุณสมบัติ
- การรวบรวมข้อมูลแบบกระจาย
- กำหนดค่าการทำงานพร้อมกัน การหน่วงเวลา และลองอีกครั้ง
- ที่เก็บข้อมูลแคชแบบเสียบได้ เช่น Redis
- รองรับ CSV และ JSON Lines สำหรับการส่งออกผลลัพธ์
- หยุดชั่วคราวเมื่อร้องขอสูงสุดและกลับมาทำงานต่อเมื่อใดก็ได้
- แทรก jQuery โดยอัตโนมัติสำหรับการขูด
ภาษาโปรแกรม
JavaScript
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/headless-chrome-crawler.mirror/ มีการโฮสต์ใน OnWorks เพื่อให้ทำงานออนไลน์ในวิธีที่ง่ายที่สุดจากหนึ่งในระบบปฏิบัติการฟรีของเรา