2734-python+selenium爬蟲按關(guān)鍵詞搜索實現(xiàn)自動化抓取淘寶商品寫入mongodb數(shù)據(jù)庫
使用selenium、webdriver爬取淘寶的圖片、商品、價格等信息。在命令行界面輸入爬取的參數(shù),把參數(shù)信息記錄到txt文件中,運行爬蟲程序后,先使用手機掃碼登陸,然后pc端網(wǎng)頁會自動翻淘寶的網(wǎng)頁,知道翻到淘寶的最后一頁,就會停止對商品的爬取
web端功能:
1.下拉框選擇商品搜索
2.點擊圖片放大
3.點擊詳情,查看商品詳情
4.用餅圖查看交易量占比
運行:
1.新建命令行記錄文件。命令行記錄文件是記錄爬蟲時,你輸入的商品名字和數(shù)據(jù)庫名字(具體位置是E:\a\cmd.txt) 2.pip安裝selenium,然后查看你的chrome版本,根據(jù)你的版本安裝webdriver.exe。具體教程: 3.啟動爬蟲(商品名字是要在淘寶搜索的商品,數(shù)據(jù)庫名字是爬取的商品要存在哪個數(shù)據(jù)庫里面,數(shù)據(jù)庫名字最好是拼音或者英文) python crawl_taobao.py -k 商品名字 -d 數(shù)據(jù)庫名字 4.啟動web: python runserver.py
運行環(huán)境
python+pycharm
項目技術(shù)
python+selenium+mongodb+layui
數(shù)據(jù)庫文件
mongodb
依賴包文件
>pip install pyquery
>pip install pymongo




本源碼地址:http://www.jsxyx.com.cn/vip/python/2020/0626/21300.html