采集知乎上的问题和回答,源于覃师宁博客在网站内容建设过程需要相关网友的内容素材提供思路建议。但是懒得搜索关键字一篇一篇的去知乎查看,那么如何采集知乎问题和答案呢
一开始也百度谷歌搜索关键词查询,得到的答案无非就是火车头、python之流,一番尝试,火车头需要自己写规则且火车头采集器是收费的,python则是编程语言为了爬取文章还需要学习编程,无奈作罢。
那么有没有其他办法爬取采集知乎问答呢,小确幸覃师宁博客早年建站需要购买了水淼个人型VIP。
但是打开万能文章采集器,没有关于知乎的采集项,只有各大搜索引擎、还有头条和一点资讯的采集。
那么如何采集知乎,换个思路!知乎的相关问题和答案在百度搜索引擎都是收录的,那么能不能先采集问题和相关回答url,在使用水淼万能文章采集器--根据URL列表采集文章呢?
想到就要去做,打开水淼关键词网址采集器--输入关键词采集列表
- site:www.zhihu.com intitle:app赚钱
这段代码解释就是,只搜索知乎收录网页且标题带”app赚钱“关键字的文章
顺利采集到知乎相关问题回答在百度首页的页面地址,如图
下一步水淼万能文章采集器--根据URL列表采集文章--粘贴要采集的文章URL列表--点击“开始采集”
这里只做演示,所以采集了几个做个文章样式
事实证明,水淼万能文章采集器搭配水淼关键词网址采集器是完全可以采集到知乎相关问题和对应的答案的。水淼软件是收费的,价格一千来块钱,对于有批量采集需要朋友价格还算公道,互联网也有对应的pojie软件,但是肯定没有及时更新的版本好用,看个人经济能力来吧。