این برنامه لینوکس با نام Headless Chrome Crawler است که آخرین نسخه آن را میتوانید با عنوان 1.8.0.zip دانلود کنید. می توان آن را به صورت آنلاین در ارائه دهنده میزبانی رایگان OnWorks برای ایستگاه های کاری اجرا کرد.
این برنامه با نام Headless Chrome Crawler را با OnWorks به صورت آنلاین دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
عکس ها
Ad
خزنده کروم بدون سر
شرح
خزنده های مبتنی بر درخواست های ساده برای فایل های HTML معمولا سریع هستند. با این حال، گاهی اوقات بدنههای خالی را به تصویر میکشد، مخصوصاً زمانی که وبسایتها بر روی چارچوبهای ظاهری مدرنی مانند AngularJS، React و Vue.js ساخته شدهاند. این خزنده با پشتیبانی از Headless Chrome، API های ساده ای را برای خزیدن وب سایت های پویا ارائه می دهد. هم از الگوریتم جستجوی عمقی و هم از الگوریتم جستجوی وسعت اول پشتیبانی کنید. اسکرینشاتها را برای شواهد خزیدن ذخیره کنید، دستگاهها و عوامل کاربر را شبیهسازی کنید، صف اولویتبندی برای کارایی خزیدن، اطاعت از robots.txt و موارد دیگر. خزنده های استاتیک بر اساس درخواست های ساده به فایل های HTML هستند. آنها به طور کلی سریع هستند، اما زمانی که HTML به صورت پویا در مرورگرها تغییر می کند، محتویات را پاک نمی کنند. خزنده های پویا مبتنی بر PhantomJS و Selenium به طور جادویی روی چنین برنامه های پویا کار می کنند. با این حال، نگهدارنده PhantomJS کنار رفته است و توصیه میکند به Headless Chrome بروید، که سریع و پایدار است. این خزنده پویا و مبتنی بر Headless Chrome است.
امکانات
- خزیدن توزیع شده
- پیکربندی همزمانی، تاخیر و تلاش مجدد
- حافظه های کش قابل اتصال مانند Redis
- از خطوط CSV و JSON برای صادرات نتایج پشتیبانی کنید
- با حداکثر درخواست مکث کنید و در هر زمان از سر بگیرید
- jQuery را به صورت خودکار برای خراشیدن درج کنید
زبان برنامه نویسی
جاوا اسکریپت
این برنامهای است که میتوان آن را از https://sourceforge.net/projects/headless-chrome-crawler.mirror/ نیز دریافت کرد. در OnWorks میزبانی شده است تا به آسانی از یکی از سیستم عامل های رایگان ما به صورت آنلاین اجرا شود.