鱼C论坛

 找回密码
 立即注册
查看: 22718|回复: 303

[技术交流] 爬虫_同花顺行情中心股票数据-回复 有彩蛋

  [复制链接]
发表于 2019-1-7 18:05:25 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import json
import requests
from bs4 import BeautifulSoup
import time
import pandas as pd

def get_one_page(url):
    try:
        headers = {
            'Host': 'q.10jqka.com.cn',
            'Referer': 'http//q.10jqka.com.cn/',
            'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.112 Safari/537.36',
            'X-Requested-With': 'XMLHttpRequest'
        }
        response = requests.get(url, headers=headers)
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None

def parse_one_page(html):
    soup = BeautifulSoup(html, 'lxml')
    tr_list = soup.select('tbody tr')
    yeji = []
    for each_tr in tr_list:
        td_list = each_tr.select('td')
        data = {
            '股票价格': td_list[1].text,
            '股票简称': td_list[2].text,
            '现价': td_list[3].text,
            '涨幅': td_list[4].text,
            '涨跌': td_list[5].text,
            '涨速': td_list[6].text,
            '换手': td_list[7].text
        }
        yeji.append(data)
    return yeji

def main(offset):
    url = 'http://q.10jqka.com.cn/index/index/board/all/field/zdf/order/desc/page/%s/ajax/1/'%offset
    html = get_one_page(url)
    data.extend(parse_one_page(html))

if __name__ == '__main__':
    data = []
    for i in range(1, 10):
        main(offset=i)
        time.sleep(10)
    json_result = json.dumps(data)
    with open('data.json', 'w') as f:
        f.write(json_result)
    with open('data.json', 'r') as f:
        data = f.read()
    data = json.loads(data)
    df = pd.DataFrame(data, columns=['股票价格', '股票简称', '现价', '涨幅', '涨跌', '涨速', '换手'])
    df.to_csv("data1.csv", index=False, encoding='utf_8_sig')
游客,如果您要查看本帖隐藏内容请回复
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-1-7 19:52:23 | 显示全部楼层
本帖最后由 alphamast 于 2019-1-8 01:32 编辑

bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-1-8 08:45:35 | 显示全部楼层
alphamast 发表于 2019-1-7 19:52
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need ...

你得安装bs4库就可以了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-8 20:45:54 | 显示全部楼层
彩蛋在哪里
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-12 19:31:00 | 显示全部楼层
一个比一个优秀,秀得我头皮发麻
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-12 21:16:15 | 显示全部楼层
123
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-1-14 04:27:10 From FishC Mobile | 显示全部楼层
看我四条A
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-14 08:23:15 | 显示全部楼层
见识一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-14 15:07:32 | 显示全部楼层
小白请教楼主,这个爬下来,之后还要做数据清洗和筛选的吧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-14 18:01:29 | 显示全部楼层
大佬666
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-17 18:41:10 | 显示全部楼层
好东西,谢谢楼主
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-26 16:54:48 | 显示全部楼层
感謝大大
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-28 13:37:07 | 显示全部楼层
彩蛋是输出的结果吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-28 15:02:50 | 显示全部楼层
就是想看一看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-1-29 11:57:16 | 显示全部楼层
想看想看,向您学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-1 14:31:35 | 显示全部楼层
45
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-4-4 20:53:56 | 显示全部楼层
学习学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-8 15:45:44 | 显示全部楼层
66
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-4-8 16:00:07 | 显示全部楼层
运行后无结果,
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-8 21:46:14 | 显示全部楼层
你好,我运行了您的代码没有报错,也没有输出结果
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-10-7 10:18

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表