crawl-page-mcp-server

Version:

MCP server for crawling web pages and converting to markdown

github.com/long36708/crawl-page-mcp-server

66 lines (53 loc) • 1.45 kB

Markdown

# 🚀 MCP爬虫服务快速启动指南 ## ✅ 超时和内容大小问题已解决！经过优化，服务器现在具有： - ⚡ **快速响应**: 平均1.7秒 - 🛡️ **超时保护**: 最大5秒自动断开 - 📦 **智能缓存**: 缓存命中仅需2ms - 🔗 **连接优化**: 连接池复用提升性能 - 📄 **大内容支持**: 最大10MB内容限制 ## 🎯 立即使用 ### 1. 启动服务 ```bash # 使用优化配置启动 ./start-optimized.sh # 或直接启动 npm start ``` ### 2. 基本用法 ```json { "name": "crawl_page", "arguments": { "url": "https://example.com", "format": "markdown", "timeout": 4000, "useCache": true } } ``` ### 3. 高性能配置 ```json { "url": "https://example.com", "format": "text", // 最快格式 "selector": "main", // 精确选择 "timeout": 3000, // 短超时 "useCache": true // 启用缓存 } ``` ## 📊 性能基准 | 场景 | 响应时间 | 状态 | |------|----------|------| | 快速网站 | ~1.7秒 | ✅ | | 缓存命中 | ~2ms | ✅ | | 超时控制 | <5秒 | ✅ | | 大型页面 | <3秒 | ✅ | ## 🛠️ 故障排除如果仍遇到超时： 1. 检查网络连接 2. 使用更短的timeout (2000-3000ms) 3. 启用缓存 `"useCache": true` 4. 使用CSS选择器减少处理量 ## 🎉 准备就绪！你的MCP爬虫服务现在已经完全优化，可以处理各种网站而不会超时。