Scrapy CSS选择器

网络爬虫

浏览数:49

2019-11-1

官方文档的CSS选择器太简短,整理了一个比较全的。

*                                           
选择所有节点

#container                            
选择id为container的节点

.container                             
选择所有class包含container的节点

li a                                         
选取所有li 下所有a节点

ul + p                                     
选取ul后面的第一个p元素

div#container > ul                 
选取id为container的div的第一个ul子元素

ul ~p                                     
选取与ul相邻的所有p元素

a[title]                                   
 选取所有有title属性的a元素

a[href="http://jobbole.com"]       
选取所有href属性为http://jobbole.com的a元素

a[href*="jobbole"]                  
选取所有href属性值中包含jobbole的a元素

a[href^="http"]                       
选取所有href属性值中以http开头的a元素

a[href$=".jpg"]                       
选取所有href属性值中以.jpg结尾的a元素

input[type=radio]:checked    
选择选中的radio的元素

div:not(#container)              
 选取所有id为非container 的div属性

li:nth-child(3)                         
选取第三个li元素

li:nth-child(2n)                       
选取第偶数个li元素

作者:SeanCheney