admin管理员组文章数量:1516870
HTML资源嗅探,scrapy
首先我们要使用scrapy shell 最好先安装ipython, 这个应用能让我们在python中使用Tab来补齐命令
pip install ipython
我们开始抓取一个网站
进入我们的项目目录
root@uliweb:~/spider/boge# pwd
/root/spider/boge
root@uliweb:~/spider/boge# scrapy shell 外链网址已屏蔽
2014-06-04 08:22:37+0800 [scrapy] INFO: Scrapy 0.22.2 started (bot: boge)
2014-06-04 08:22:37+0800 [scrapy] INFO: Optional features available: ssl, http11
2014-06-04 08:22:37+0800 [scrapy] INFO: Overridden settings: {'NEWSPIDER_MODULE': 'boge.spiders', 'SPIDER_MODULES': ['boge.spiders'], 'LOGSTATS_INTERVAL': 0, 'BOT_NAME': 'boge'}
2014-06-04 08:22:37+0800 [scrapy] INFO: Enabled extensions: TelnetConsole, CloseSpider, WebService, CoreStats, SpiderState
2014-06-04 08:22:37+0800 [scrapy] INFO: Enabled downloader middlewares: HttpAuthMiddleware, DownloadTimeoutMiddleware,
版权声明:本文标题:HTML资源嗅探,scrapy 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://www.betaflare.com/biancheng/1701105055a336987.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。


发表评论