UNPKG

supercrawler

Version:

A web crawler. Supercrawler automatically crawls websites. Define custom handlers to parse content. Obeys robots.txt, rate limits and concurrency limits.

github.com/brendonboshell/supercrawler

brendonboshell/supercrawler

27 lines (23 loc) • 618 B

JavaScript

var supercrawler = require("../lib"); var crawler = new supercrawler.Crawler({ interval: 1000, concurrentRequestsLimit: 5, urlList: new supercrawler.RedisUrlList({ redis: { port: 6379, host: '127.0.0.1' } }) }); var strUrl = "https://sweetpricing.com/" + Math.random(); crawler.getUrlList().insertIfNotExists(new supercrawler.Url({ url: strUrl })).then(function () { return crawler.getUrlList().getNextUrl().then(function () { console.log(arguments); }); }).then(function () { return crawler.getUrlList().getNextUrl().then(function () { console.log(arguments); }); });