UNPKG

supercrawler

Version:

A web crawler. Supercrawler automatically crawls websites. Define custom handlers to parse content. Obeys robots.txt, rate limits and concurrency limits.

github.com/brendonboshell/supercrawler

brendonboshell/supercrawler

25 lines (21 loc) • 524 B

JavaScript

var supercrawler = require("../lib"); var crawler = new supercrawler.Crawler({ interval: 1000, concurrentRequestsLimit: 5, urlList: new supercrawler.RedisUrlList({ redis: { port: 6379, host: '127.0.0.1' } }) }); var strUrl = "https://sweetpricing.com/" + Math.random(); crawler.getUrlList().upsert(new supercrawler.Url({ url: strUrl, errorCode: null })).then(function () { return crawler.getUrlList().upsert(new supercrawler.Url({ url: strUrl, errorCode: "NOT_EXISTS" })); });