扔给 AI 一个网址,它帮你把内容全部拆好
再也不用手动复制粘贴了
你有没有遇到过这种场景:
看到一个不错的文章想保存下来,但复制过来全是乱七八糟的广告和导航栏。想抓一个网页的数据,结果页面是用 JavaScript 渲染的,ctrl+c 根本复制不到正文。
更麻烦的是:你需要同时处理十几个网页,一个个打开、复制、清理,半小时就没了。
今天介绍的工具叫 web-scraper。你只需要把网址扔给 AI,它自动帮你抓取内容、去掉广告噪音、提取关键信息,干净利落。
💡 不只是"抓网页"——它会把网页里的有用信息拆出来,广告、导航、页脚这些噪音全部自动过滤。
STEP 01
它和普通"复制粘贴"有什么区别?
普通复制粘贴,你得到的是网页的"原始外貌"——导航栏、侧边栏、广告、页脚、弹窗提示,全混在一起。你需要手动删掉这些垃圾内容,才能拿到正文。
web-scraper 做的事情不一样。它像一个"内容清洁工",拿到网页后:
第一步:智能抓取。先尝试直接抓取网页。如果页面是 JavaScript 渲染的(就是那种打开时先白屏,然后内容慢慢出现的页面),它会自动启动一个"无头浏览器"来渲染页面,确保内容完整加载。
第二步:去噪。自动识别并移除导航栏、广告、侧边栏、页脚、评论区域这些与正文无关的内容。就像把一筐苹果里的烂叶子全挑掉,只留下能吃的部分。
第三步:结构化。提取标题、作者、发布时间、正文等关键信息,整理成干净的格式。如果你需要,还可以用 AI 进一步提取关键实体和摘要。
💡 从"一坨混杂的 HTML"到"干净的结构化内容",全程自动,你不需要写任何代码。
STEP 02
哪些场景特别有用?
信息收集。做竞品分析时需要看十几篇文章,一个个打开太慢。把所有网址给 AI,它并行抓取,几分钟全部整理好。
内容整理。看到好文章想归档,但原始网页可能随时下线。抓取后保存为 Markdown,永久可用,不依赖原网站。
数据提取。电商商品页、房产信息页、招聘页……这些页面里有结构化数据,手动复制效率极低。web-scraper 可以自动提取价格、规格、参数等关键信息。
新闻监控。需要跟踪特定话题的最新报道?配合定时任务,每天自动抓取相关网页,汇总成报告。
知识库构建。把散落在各个网站的文档统一抓取下来,整理成自己的知识库,后续 AI 可以直接检索使用。
💡 只要你能打开一个网页,web-scraper 就能帮你把内容"提"出来。静态页面、动态页面、新闻、博客、文档站,都支持。
STEP 03
为什么不是简单发个 HTTP 请求?
懂技术的人可能会想:抓网页不就是一个 curl 请求的事吗?
确实,对于一个纯静态网页来说,curl 够用了。但现实中的网页远比想象中复杂:
现在大部分网站都用 JavaScript 动态加载内容。你用 curl 抓到的可能只是一个"空壳"——页面框架在,但正文要等 JavaScript 执行后才显示。curl 看不到这些内容。
还有一些网站做了反爬虫措施:检测你的请求是不是来自真实浏览器,不是就直接拒绝。curl 请求没有浏览器指纹,很容易被拦。
web-scraper 的做法是级联回退:先尝试最简单的 HTTP 抓取;如果失败了或者内容为空,自动切换到 Puppeteer 无头浏览器渲染,模拟真实浏览器环境来获取内容。整个过程对你完全透明。
打个比方:HTTP 抓取像用勺子舀水,简单快速但只能舀浅层。遇到深层内容就舀不到了。web-scraper 会自动判断:勺子够用就用勺子,勺子够不到就换潜水泵。
💡 额外福利:抓取后还能调用 AI 对内容做摘要、提取关键实体(人名、公司、数字等),直接给你最有价值的信息。
STEP 04
怎么用?
安装很简单,一行命令:
clawhub install web-scraper
装好之后,直接跟 AI 说你要抓什么。比如:
"帮我抓取这个页面的内容:https://xxx.com/article"
AI 会自动调用 web-scraper,抓取内容、去掉噪音、提取关键信息,然后把干净的结果给你。
也可以批量处理:
"帮我抓取这 5 个网址的内容,整理成一份报告"
AI 会并行抓取所有页面,汇总后统一输出。
这个 Skill 免费开源,代码在 cnb.cool/cnbll/web-scraper,可以查看和二次开发。
💡 使用前提:需要 OpenClaw 环境。如果你还没有,可以联系技术支持帮忙搭建。
STEP 05
适合谁?
内容运营——每天要整理大量行业资讯,手动复制太慢。让 AI 帮你批量抓取和整理,效率提升 10 倍。
市场调研——竞品分析、行业报告收集。把相关网址一股脑给 AI,几分钟出一份整理好的素材。
数据分析师——从多个网页提取结构化数据,合并成统一格式用于分析。
知识管理爱好者——收集散落各处的文档,构建自己的知识库。配合 AI 检索,随时调用。
💡 不需要会编程。会聊天就会用——告诉 AI 你要抓什么,它帮你搞定。
━━━━━━━━
从"手动复制"到"一句话抓取"
网页内容抓取这个事,手动做是体力活,让 AI 做就是一句话的事。web-scraper 把"打开网页 → 复制 → 粘贴 → 清理 → 整理"这条五步流程,压缩成一步。
👉 安装命令:clawhub install web-scraper
👉 开源地址:cnb.cool/cnbll/web-scraper
cnb.cool/cnbll
全部开源 · 克隆即可使用
━━━━━━━━
关注公众号【鸿爪派】
获取最新 Skill 发布 · 实战教程 · 独家内容
本文首发于「鸿爪派」公众号