微信公众号:Python爬虫与数据挖掘,回复“书籍”有福利

手把手教你进行Scrapy中item类的实例化操作

接下来我们将在爬虫主体文件中对Item的值进行填充。

1、首先在爬虫主体文件中将Item模块导入进来,如下图所示。

手把手教你进行Scrapy中item类的实例化操作

2、第一步的意思是说将items.py中的ArticleItem类导入到爬虫主体文件中去,将两个文件串联起来,其中items.py的部分内容如下图所示。

手把手教你进行Scrapy中item类的实例化操作

3、将这个ArticleItem类导入之后,接下来我们就可以对这个类进行初始化,并对其进行相应值的填充。首先去parse_detail函数下对其进行实例化,实例化的方法也十分简单,如下图所示。

手把手教你进行Scrapy中item类的实例化操作

4、接下来,我们将填充对应的值。实际上我们在之前通过Xpath或者CSS选择器已经获取到了目标数据,如下图所示,现在要做的就是依次填充目标字段的值。

手把手教你进行Scrapy中item类的实例化操作

5、我们可以像字典一样来给目标字段传值,例如item[“title”]= title,其他的目标字段的填充也是形如该格式,填充完成之后如下图所示。

手把手教你进行Scrapy中item类的实例化操作

其中,目标字段可以参考items.py中定义的item,这样可以加快填充的速度。

6、到这里,我们已经将需要填充的字段全部填充完成了,之后我们需要调用yield,这点十分重要。再调用yield之后,实例化后的item就会自动传递到pipeline当中去。可以看到下图中的pipelines.py中默认给出的代码,说明pipeline其实是可以接收item的。

手把手教你进行Scrapy中item类的实例化操作

7、到这里,关于实例化item的步骤就已经完成了,是不是比较简单呢?我们后面把pipeline配置起来,一步一步的将Scrapy串起来。

—————— End ——————

往期精彩文章推荐:

看完本文有收获?请转发分享给更多的人

Python爬虫与数据挖掘

入群请在微信后台回复【入群】

在公众号后台回复下列关键词可以免费获取相应的学习资料:

Python、网络爬虫 、书籍、数据分析、机器学习、数据结构、

大数据、服务器、Spark、Redis、C++、C、php、

mysql、java、Android、面试题、课堂、其他

喜欢 (11)
取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦



Warning: copy(C:\inetpub\wordpress/avatar/.png): failed to open stream: No such file or directory in C:\inetpub\wordpress\wp-content\themes\XHBlog\functions.php on line 264

Warning: filesize(): stat failed for C:\inetpub\wordpress/avatar/.png in C:\inetpub\wordpress\wp-content\themes\XHBlog\functions.php on line 269

Warning: copy(C:\inetpub\wordpress/avatar/.png): failed to open stream: No such file or directory in C:\inetpub\wordpress\wp-content\themes\XHBlog\functions.php on line 270
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址