城北·IT俱乐部日常经验分享·城北博客

浏览: 413    评论: 0

在使用Python制作爬虫时经常会用到selenium,现就selenium经常要用到一些函数及属性作说明:


在使用Python制作爬虫时经常会用到selenium,现就selenium经常要用到一些函数及属性作说明:


from selenium import webdriver


driver=webdriver.Firefox()


url="http://xxxx.com"


driver.get(url)


driver.close()


获得driver并且访问网站url以后,就可以用相应的函数或属性得到值了:


1. 查找元素


查找单个元素


通过id定位:find_element_by_id()


通过name定位:find_element_by_name()


通过class定位:find_element_by_class_name()


通过tag定位:find_element_by_tag_name()


通过link定位:find_element_by_link_text()


通过partial_link定位:find_element_by_partial_link_text()


通过xpath定位:find_element_by_xpath()


通过css定位:find_element_by_css_selector()


下面是查找多个元素(这些方法将返回一个列表):


find_elements_by_name( )


find_elements_by_xpath( )


find_elements_by_link_text( )


find_elements_by_partial_link_text( )


find_elements_by_tag_name( )


find_elements_by_class_name( )


find_elements_by_css_selector( )


2. 操作元素方法:


按第3点定位元素后,就可以操作元素了,常用操作方法如下:


clear 清除元素的内容


send_keys 模拟按键输入


click 点击元素


submit 提交表单


fromselenium.webdriver.common.keysimportKeys


elem_user = driver.find_element_by_name("username")


elem_user.clear


elem_user.send_keys("15201615157"


elem_pwd = driver.find_element_by_name("password"


elem_pwd.clear


elem_pwd.send_keys("******"


elem_pwd.send_keys(Keys.RETURN)


#driver.find_element_by_id("loginBtn").click()


#driver.find_element_by_id("loginBtn").submit()


首先通过name定位用户名和密码,再调用方法clear()清除输入框默认内容,如“请输入密码”等提示,通过send_keys("**")输入正确的用户名和密码,最后通过click()点击登录按钮或send_keys(Keys.RETURN)相当于回车登录,submit()提交表单。


3. 获取Element属性值


通过Element接口可以获取常用的值。


size 获取元素的尺寸


text 获取元素的文本


get_attribute(name) 获取属性值


location 获取元素坐标,先找到要获取的元素,再调用该方法


page_source 返回页面源码


driver.title 返回页面标题


current_url 获取当前页面的URL


is_displayed() 设置该元素是否可见


is_enabled() 判断元素是否被使用


is_selected() 判断元素是否被选中


tag_name 返回元素的tagName


图片解释如下:



4. 鼠标操作


在现实的自动化测试中关于鼠标的操作不仅仅是click()单击操作,还有很多包含在ActionChains类中的操作。如下:


context_click(elem) 右击鼠标点击元素elem,另存为等行为


double_click(elem) 双击鼠标点击元素elem,地图web可实现放大功能


drag_and_drop(source,target) 拖动鼠标,源元素按下左键移动至目标元素释放


move_to_element(elem) 鼠标移动到一个元素上


click_and_hold(elem) 按下鼠标左键在一个元素上


perform() 在通过调用该函数执行ActionChains中存储行为


举例如下所示,获取通过鼠标右键另存为百度图片logo。代码:


import time


from selenium.webdriver.common.keys import Keys


from selenium.webdriver.common.action_chains import ActionChains


driver = webdriver.Firefox()


driver.get("http://www.baidu.com")


#鼠标移动至图片上 右键保存图片


elem_pic = driver.find_element_by_xpath("//div[@id='lg']/img")


print elem_pic.get_attribute("src")


action = ActionChains(driver).move_to_element(elem_pic)


action.context_click(elem_pic)


#重点:当右键鼠标点击键盘光标向下则移动至右键菜单第一个选项


action.send_keys(Keys.ARROW_DOWN)


time.sleep(3)


action.send_keys('v') #另存为


action.perform()


#获取另存为对话框(失败)


alert.switch_to_alert()


alert.accept()


5. 键盘操作


在webdriver的Keys类中提供了键盘所有的按键操作,当然也包括一些常见的组合键操作如Ctrl+A(全选)、Ctrl+C(复制)、Ctrl+V(粘贴)。更多键参考官方文档对应的编码。


send_keys(Keys.ENTER) 按下回车键


send_keys(Keys.TAB) 按下Tab制表键


send_keys(Keys.SPACE) 按下空格键space


send_keys(Kyes.ESCAPE) 按下回退键Esc


send_keys(Keys.BACK_SPACE) 按下删除键BackSpace


send_keys(Keys.SHIFT) 按下shift键


send_keys(Keys.CONTROL) 按下Ctrl键


send_keys(Keys.ARROW_DOWN) 按下鼠标光标向下按键


send_keys(Keys.CONTROL,'a') 组合键全选Ctrl+A


send_keys(Keys.CONTROL,'c') 组合键复制Ctrl+C


send_keys(Keys.CONTROL,'x') 组合键剪切Ctrl+X


send_keys(Keys.CONTROL,'v') 组合键粘贴Ctrl+V


以下是例子,大家自行参阅


#coding=utf-8


#输入框输入内容


elem = driver.find_element_by_id("kw")


elem.send_keys("Eastmount CSDN")


#删除一个字符CSDN 回退键


elem.send_keys(Keys.BACK_SPACE)


#输入空格+"博客"


elem.send_keys(Keys.SPACE)


elem.send_keys(u"博客")


#ctrl+a 全选输入框内容


elem.send_keys(Keys.CONTROL,'a')


#ctrl+x 剪切输入框内容


elem.send_keys(Keys.CONTROL,'x')


#输入框重新输入搜索


elem.send_keys(Keys.CONTROL,'v')


#通过回车键替代点击操作


driver.find_element_by_id("su").send_keys(Keys.ENTER)


driver.quit()


最后城北提醒一下,很多人在操作Keys键盘时,老是出错但不知道原因.其实这是个小问题,要需要KEYS需要在次引入from selenium.webdriver.common.keys import Keys

就OK了

全文详见:http://it-club.cn/post/188.html

TOP


相关内容

评论列表


发表评论
来宾的头像