「python 爬蟲 失敗」的推薦目錄:
- 關於python 爬蟲 失敗 在 コバにゃんチャンネル Youtube 的最讚貼文
- 關於python 爬蟲 失敗 在 大象中醫 Youtube 的最佳貼文
- 關於python 爬蟲 失敗 在 大象中醫 Youtube 的精選貼文
- 關於python 爬蟲 失敗 在 [問題] 爬蟲網頁登入失敗- 看板Python - 批踢踢實業坊 的評價
- 關於python 爬蟲 失敗 在 Python Taiwan | 在爬蟲時如果遇到反爬蟲機制的第一件事 ... 的評價
- 關於python 爬蟲 失敗 在 新手#新手對Dcard爬蟲被擋ip該如何解決- 軟體工程師板 的評價
- 關於python 爬蟲 失敗 在 給初學者的Python 網頁爬蟲與資料分析(4) 擷取資料及下載圖片 的評價
- 關於python 爬蟲 失敗 在 Python Selenium 網頁爬蟲:登入帳戶By 彭彭 - YouTube 的評價
python 爬蟲 失敗 在 大象中醫 Youtube 的最佳貼文
python 爬蟲 失敗 在 大象中醫 Youtube 的精選貼文
python 爬蟲 失敗 在 Python Taiwan | 在爬蟲時如果遇到反爬蟲機制的第一件事 ... 的推薦與評價
在爬蟲時如果遇到反爬蟲機制的第一件事一定是加上user-agents 來模仿真人瀏覽網頁。對於PChome 來說,加上user-agents 確實可以成功request 到資料, ... ... <看更多>
python 爬蟲 失敗 在 新手#新手對Dcard爬蟲被擋ip該如何解決- 軟體工程師板 的推薦與評價
爬少量的時候沒問題,上百篇會出問題,目前嘗試過以下方法都沒有效果:1.切換user-agent,2.以十篇為一單位做time delay - 爬蟲,python,request. ... <看更多>
python 爬蟲 失敗 在 [問題] 爬蟲網頁登入失敗- 看板Python - 批踢踢實業坊 的推薦與評價
爬蟲網址:
https://fe.xuanen.com.tw/fe02.aspx?module=login_page&files=login&PT=1
小弟嘗試獲取運動中心場地資訊
由於登入的驗證碼是由asp產生的
因此我的想法是先建一個session
再將asp產生的驗證碼圖片存下來後
再用人工辨識(之後再想辦法用自動辨識)
接著將帳號/密碼/驗證碼以post送出
若登入成功就能順利得到場地資訊
但嘗試以下程式碼仍無法順利登入成功
目前不知道該從哪方面debug起
還請版上高手賜教
程式碼:
url_login =
"https://fe.xuanen.com.tw/fe02.aspx?Module=login_page&files=login"
url_book =
"https://fe.xuanen.com.tw/fe02.aspx?module=net_booking&files=booking_place&StepFlag=2&PT=1&D=%s&D2=%s"%(date,section)
url_cap = "https://fe.xuanen.com.tw/NewCaptcha.aspx"
#build session
session = requests.session()
response=session.get(url_login)
#get captcha
valcode = session.get(url_cap)
file.write(valcode.content)
file.close()
img = Image.open('cap.png')
img.show()
verify_code = input("Please enter verification code:")
#send login info
post_headers = {
'Accept': '*/*',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'zh-TW,zh;q=0.9,en-US;q=0.8,en;q=0.7',
'Connection': 'keep-alive',
'Content-Length': '347',
'Referer':
'https://fe.xuanen.com.tw/fe02.aspx?module=login_page&files=login&PT=1',
'Content-Type': 'multipart/form-data;
boundary=----WebKitFormBoundary8iz7GC2K2CIsJHHu',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.60 Safari/537.36'
}
form_data = {
'loginid': user_name,
'loginpw': passwd,
'Captcha_text': verify_code,
}
r = session.post(url_login, headers = post_headers, data=form_data)
# get court info
r = session.get(url_book)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.53.60 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1648782741.A.4EA.html
... <看更多>