物流信息查询

lengyue869 · 发表于 2024-7-5 15:58:26

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

找了很久都没找到免费的查询快递信息的网站
下面这个网站可以查询，但是点击查询按钮后，用F12可用看到物流信息，但是查看网页源代码又看不到物流信息
https://www.kuaidi.com/

import logging
import time
from DrissionPage import ChromiumPage, ChromiumOptions
from DrissionPage.common import By
from DrissionPage.common import Settings
from DrissionPage import WebPage, ChromiumOptions, SessionOptions
import base64
import bs4
from bs4 import BeautifulSoup
# 配置日志
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
# 初始化浏览器
def initialize_browser():
co = ChromiumOptions()
co.set_argument('--start-maximized')
so = SessionOptions()
page = WebPage(chromium_options=co, session_or_options=so)
Settings.raise_when_ele_not_found = False
page.set.NoneElement_value('无元素')
return page
# 快递查询
def express_query(exp_number):
page.get("https://www.kuaidi.com/")
ele_input=page.ele((By.ID, 'search'))
ele_input.clear()
ele_input.input(exp_number)
page.ele('.=search_bn js_submit').click()
page.wait.eles_loaded('class=marginbot')
page.change_mode()#切换成SessionPage模式
# 解析HTML
soup = BeautifulSoup(page.html, 'html.parser')
print(soup)
# 查找所有的跟踪记录
tracking_records = soup.find_all('li', class_='marginbot')
print(tracking_records)
# 提取时间戳和详情
result_list = []
for record in tracking_records:
time_s = record.find('span', class_='time_s').text.strip()
kd_con = record.find('span', class_='kd_con').text.strip()
result_list.append({'time': time_s, 'details': kd_con})
#输出结果
print(result_list)
if __name__ == "__main__":
page = initialize_browser()
exp_number = 'YT1870762630265'
express_query(exp_number)

复制代码

lengyue869 · 发表于 2024-7-5 17:09:32

generate_query_id 函数还需要更新一下
以下有什么规律? 还是可以从网页源代码解析出来?

KDQUERY1720167631718  查询时间  2024/07/05 16:20
KDQUERY1720167694333  查询时间  2024/07/05 16:21
KDQUERY1720167806456  查询时间  2024/07/05 16:23
KDQUERY1720167856116  查询时间  2024/07/05 16:24
KDQUERY1720167857068  查询时间  2024/07/05 16:24
KDQUERY1720167899105  查询时间  2024/07/05 16:24

import logging
import time
import random
from fake_useragent import UserAgent
import json
import requests
# 配置日志
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
def generate_query_id():
timestamp = int(time.time())
custom_time_code = str(timestamp)[-6:] # 截取时间戳的最后6位作为时间编码
# 生成随机序列号
sequence_number = str(random.randint(10000, 99999)) # 生成5位数的随机序列号
# 拼接查询编号
query_id = f"KDQUERY{custom_time_code}{sequence_number}"
return query_id
def get_express_type(exp_name):
exp_dic = {
"申通": "shentong",
"圆通": "yuantong",
"韵达": "yunda",
"百世": "huitongkuaidi",
"优速": "youshuwuliu",
"中通": "zhongtong",
"EMS": "ems",
"顺丰": "shunfeng",
"天天": "tiantian",
"宅急送": "zhaijisong",
"中国邮政": "youzhengguonei",
"全峰": "quanfengkuaidi",
"速尔": "suer",
"国通": "guotongkuaidi"
}
return exp_dic[exp_name]
# 快递查询
def express_query(exp_name,exp_number):
headers = {
"User-Agent": UserAgent().random,
"Referer": "https://www.kuaidi.com/"
}
# 解析HTML
query_id = generate_query_id()
query_url=f"https://www.kuaidi.com/index-ajaxselectcourierinfo-{exp_number}-{get_express_type(exp_name)}-{query_id}.html"
print(query_url)
html = requests.post(query_url, headers=headers)
j_text = json.loads(html.text)
if j_text['success']:
datas=j_text['data']
for data in datas:
print(f"{data['time']}, {data['context']}")
if __name__ == "__main__":
exp_name="圆通"
exp_number = 'YT1870762630265'
express_query(exp_name,exp_number)

复制代码

lengyue869 · 发表于 2024-7-9 13:53:25

lengyue869 发表于 2024-7-5 17:09
generate_query_id 函数还需要更新一下
以下有什么规律? 还是可以从网页源代码解析出来?

up up !~~~

账号		自动登录	找回密码
密码			立即注册

物流信息查询

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块