Huginn监测网页变化并推送
以图灵社区每周特价页面为例: https://www.ituring.com.cn/tag/36527
抓取内容
这个页面每周一都会更新三个半价电子书,先分析页面xpath,找出规律.
复制后粘贴,可以看到三本书的xpath分别是:
//*[@id="tag-book"]/div/ul/li[1]/div[2]/h4/a
//*[@id="tag-book"]/div/ul/li[2]/div[2]/h4/a
//*[@id="tag-book"]/div/ul/li[3]/div[2]/h4/a
只有中间的li[]
内容不一样.
因此options部分,xpath部分可以用li[*]
匹配所有情况.可以这样写:
{
"expected_update_period_in_days": "2",
"url": "https://www.ituring.com.cn/tag/36527",
"type": "html",
"mode": "on_change",
"extract": {
"url": {
"xpath": "//*[@id=\"tag-book\"]/div/ul/li[*]/div[2]/h4/a",
"value": "@href"
},
"title": {
"xpath": "//*[@id=\"tag-book\"]/div/ul/li[*]/div[2]/h4/a",
"value": "@title"
}
}
}
推送内容
使用slack agent推送.
options部分:
{
"webhook_url": "https://hooks.slack.com/services/xxxx/xxxxxxxx",
"channel": "#book",
"username": "Huginn",
"message": "{{title}} https://www.ituring.com.cn{{url}}",
"icon": ""
}
效果
点击查看更多内容
以上内容来自于网络,如有侵权联系即删除

相关文章
- 实战用puppeteer 和puppeteer-cluster 获取某站所有有用链接
- CDH+Kylin三部曲之一:准备工作
- Java9系列第8篇-JPMS模块化编程
- 定制ListView的界面
- 使用HTTP协议访问网络
- 【书单】这几本书帮你渡过应届生最难求职季,对社畜也有用~
- 攻克金融系统开发难点,借助SpreadJS实现在线导入Excel自定义报表
- 从0开始搭建Huginn定时监控黄金价格脚本
下一篇: Webview的用法