python2.7 - python selenium报PATH异常
新手尝试第一次用selenium爬东西,但是第一步就卡住了 我的代码: from bs4 import BeautifulSoup from selenium import webdriver import urllib driver=webdriver.PhantomJS('C:\phantomjs-2.1.1-windows\bin\phantomjs.exe') def search(keyword): url_keyword=urllib.quote(keyword) url="https://www.baidu.com/s?ie=UTF-8&wd="+keyword print url driver.get(url) bsObj=BeautifulSoup(driver.page_source,"html5lib") with open("temp.txt","w") as f: f.write(bsObj.pr
230 2022-07-19
编程技术问答社区
python - selenium新建了5个标签页但是通过window_handles只能获取一个句柄是怎么回事?
问 题 大家好,我刚开始学习使用selenium写一个操作浏览器的小脚本。 我想在一个火狐浏览器窗口下新开n个标签页,我在网上查到可以使用键盘事件:Keys.CONTROL + 't'实现,确实能够生效。 但问题是,接下来我需要操作这些新打开的标签页,网上的方法是通过driver.window_handles获取句柄。按道理说六个tab应该获取6个句柄,但是我输出发现始终只有一个句柄,我的代码如下: from selenium import webdriver from selenium.webdriver.common.keys import Keys driver = webdriver.Firefox() # 默认的火狐浏览器 for i in range(5): # 这句代码相当于在浏览器窗口下按下ctrl+t打开一个新的标签页 driver.find_element_by_tag_name('body').send_keys(Keys.CON
1718 2022-07-19
编程技术问答社区
python - selenium2.53.1启动火狐47.0报错
问 题 >>> br=webdriver.Firefox() Traceback (most recent call last): File "", line 1, in File "D:\Python27\lib\site-packages\selenium\webdriver\firefox\webdriver.py", line 103, in __init__ self.binary, timeout) File "D:\Python27\lib\site-packages\selenium\webdriver\firefox\extension_connection.py", line 51, in __init__ self.binary.launch_browser(self.profile, timeout=timeout) File "D:\Python27\lib\site-packages\selen
148 2022-07-19
编程技术问答社区
python - Phantomjs添加到环境变量后为什么webdriver.PhantomJS()不能用默认的path参数?
已经将phantomjs添加到环境变量中,按照selenium的文档里说这样就可以用webdriver.PhantomJS()的executable_path的默认参数运行了,但实测会报错. from selenium import webdriver driver = webdriver.PhantomJS() driver.get(url) print(driver.page_source) driver.quit() 以下是报错内容: Traceback (most recent call last): File "D:Pythonlibsite-packagesseleniumwebdrivercommonservice.py", line 74, in start stdout=self.log_file, stderr=self.log_file) File "D:Pythonlibsubprocess.py", line 707, in init
492 2022-07-17
编程技术问答社区
python - selenium或request获取网页内容
目标是获取历史上某天是否是节假日,主要是国内假期会根据农历进行调整。 思路:基于某万年历网页获取具体日期的放假情况。 问题: 直接访问链接,默认显示当天信息。 切换日期时 url不变。 request 返回的jason对象只返回类似元旦这样的固定节假日,并没有返回前后两天的国家调休假期。 切换月份的时候,这个request URL直接用于python urllib request urlopen没有效果。 request URL要怎么处理?或者说用 selenum webdriver更方便? my code url = 'http://union2.50bang.org/web/ajax29?uId2=SPTNPQRLSX&r=http://tools.2345.com/rili.htm&fBL=1920*1080&lO=javascript:;?nytjsplit=http://tools.2345.com/rili.htm' request_obj =
958 2022-07-17
编程技术问答社区
网页爬虫 - python爬虫用selenium访问一个网址返回的是个json字符串,怎么获取这个json字符串?
问 题 网上给的都是find_element的什么的,但我这里只是个json字符串. from selenium import webdriver Chrome_login=webdriver.Chrome() Chrome_login.get('https://www.zhihu.com/api/v4/members/qing-shi-yong-zhen-shi-xing-ming/followees?offset=0&limit=20') {"paging": {"is_end": false, "totals": 166, "previous": "http://www.zhihu.com/api/v4/members/qing-shi-yong-zhen-shi-xing-ming/followees?limit=20&offset=0", "is_start": true, "next": "http://www.zhihu.com/api/v4/members/
124 2022-07-17
编程技术问答社区