鱼C论坛

 找回密码
 立即注册
查看: 435|回复: 4

同时在a股上市和香港上市的股票清单格式转换

[复制链接]
发表于 2018-11-30 11:43:43 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
请大佬帮忙通过正则把下面这一坨同时在a股上市和香港上市的股票清单转换成正常人能看懂的 Dataframe,多谢

序号A股代码 A股名称 H股代码 H股名称 A股价格(RMB) H股价格(HKD) 两地比价(H*0.88/A) A股涨跌幅 H股涨跌幅 成交量比(H/A) 1 000585 东北电气 00042 东北电气 3.48 1.040 0.26 -0.57% 4.00% 0.004884 2 600600 青岛啤酒 00168 青岛啤酒股份 23.61 15.300 0.57 0.47% -4.38% 0.003425 3 600377 宁沪高速 00177 江苏宁沪高速公路 6.28 6.200 0.87 -0.63% -3.43% 0.034749 4 600860 北人股份 00187 北人印刷机械股份 6.19 1.240 0.18 1.81% -1.59% 0.000272 5 600806 昆明机床 00300 昆明机床 13.42 6.080 0.40 -1.25% -2.09% 0.000691 6 600685 广船国际 00317 广州广船国际股份 27.1 18.320 0.59 0.15% -2.55% 0.001492 7 600808 马钢股份 00323 马鞍山钢铁股份 5.76 4.300 0.66 0.00% -4.23% 0.003426 8 600688 S上石化 00338 上海石油化工股份 6.46 2.310 0.31 1.73% -7.23% 0.036661 9 000898 鞍钢股份 00347 鞍钢股份 13.59 14.400 0.93 0.82% -2.96% 0.002048 10 000666 经纬纺机 00350 经纬纺织机械股份 4.93 1.460 0.26 0.20% -3.31% 0.000985 11 600362 江西铜业 00358 江西铜业股份 25.75 14.460 0.49 2.63% -3.08% 0.005389 12 600028 中国石化 00386 中国石油化工股份 10.14 7.150 0.62 2.32% -2.72% 0.019158 13 601390 中国中铁 00390 中国中铁 5.51 5.500 0.88 -0.72% -3.34% 0.004166 14 601333 广深铁路 00525 广深铁路股份 4.4 3.480 0.70 -0.23% -3.87% 0.002979 15 600548 深高速 00548 深圳高速公路股份 5.96 4.330 0.64 1.19% 0.00% 0.011660 16 600775 南京熊猫 00553 南京熊猫电子股份 6.13 1.830 0.26 3.03% 1.67% 0.010328 17 601588 北辰实业 00588 北京北辰实业股份 8.21 2.340 0.25 0.12% -2.90% 0.000903 18 600115 东方航空 00670 中国东方航空股份 7.39 2.210 0.26 0.27% -5.15% 0.005690 19 000756 新华制药 00719 山东新华制药股份 5.13 1.800 0.31 1.38% 1.12% 0.003414 20 601111 中国国航 00753 中国国航 10.17 3.680 0.32 6.83% -5.15% 0.002238 21 000063 中兴通讯 00763 中兴通讯 60.9 35.000 0.51 -5.29% -5.91% 0.003679 22 601857 中国石油 00857 中国石油股份 15.14 9.630 0.56 2.16% -3.70% 0.047145 23 600332 广州药业 00874 广州药业股份 11.54 4.700 0.36 -0.35% -5.43% 0.002428 24 600011 华能国际 00902 华能国际电力股份 7.21 4.930 0.60 1.84% -2.76% 0.016735 25 600585 海螺水泥 00914 安徽海螺水泥股份 39.74 47.750 1.06 -2.17% -4.50% 0.005922 26 000921 ST 科龙 00921 海信科龙 3.81 0.890 0.21 0.00% 0.00% 0.000000 27 601939 建设银行 00939 建设银行 5.88 5.910 0.88 -0.84% -2.64% 0.059746 28 601991 大唐发电 00991 大唐发电 10.62 4.300 0.36 0.28% -3.59% 0.064457 29 600012 皖通高速 00995 安徽皖通高速公路 5.17 5.390 0.92 -0.39% -1.10% 0.001510 30 601998 中信银行 00998 中信银行 5.54 4.400 0.70 -1.25% -1.57% 0.011681 31 600871 S仪化 01033 仪征化纤股份 4.52 1.090 0.21 0.00% -3.54% 0.047456 32 601005 重庆钢铁 01053 重庆钢铁股份 5.52 2.760 0.44 0.73% -2.82% 0.001053 33 600029 南方航空 01055 中国南方航空股份 8.09 2.890 0.31 2.15% -6.77% 0.000989 34 600874 创业环保 01065 天津创业环保股份 8.79 2.210 0.22 3.66% 0.00% 0.000758 35 600027 华电国际 01071 华电国际电力股份 4.96 2.070 0.37 1.85% -1.90% 0.011030 36 600875 东方电气 01072 东方电气 31.87 23.500 0.65 2.97% 2.40% 0.001629 37 601088 中国神华 01088 中国神华 33.93 28.550 0.74 3.01% -3.06% 0.008191 38 600876 *ST洛玻 01108 洛阳玻璃股份 3.47 0.870 0.22 1.17% 0.00% 0.000000 39 600026 中海发展 01138 中海发展股份 20.85 22.400 0.95 -0.62% -6.67% 0.013620 40 600188 兖州煤业 01171 兖州煤业股份 20.53 13.740 0.59 5.61% -0.87% 0.009694 41 601186 中国铁建 01186 中国铁建 9.59 10.300 0.95 -0.93% -0.19% 0.003282 42 601398 工商银行 01398 工商银行 4.91 5.140 0.92 -1.21% -3.20% 0.031887 43 000488 晨鸣纸业 01812 晨鸣纸业 11.47 6.300 0.48 1.68% -2.33% 0.000581 44 200488 晨鸣B 01812 晨鸣纸业 6.7 6.300 0.83 -3.18% -2.33% 0.002035 45 601898 中煤能源 01898 中煤能源 15.12 12.940 0.75 2.02% -4.01% 0.004745 46 601919 中国远洋 01919 中国远洋 20.54 18.700 0.80 0.74% -2.81% 0.006915 47 601318 中国平安 02318 中国平安 40.32 48.050 1.05 -3.93% -7.24% 0.005129 48 000338 潍柴动力 02338 潍柴动力 45 29.650 0.58 2.69% -4.66% 0.001056 49 601600 中国铝业 02600 中国铝业 14.12 8.400 0.52 2.02% -5.62% 0.007605 50 601628 中国人寿 02628 中国人寿 22.88 25.950 1.00 -0.74% -3.71% 0.055013 51 601866 中海集运 02866 中海集运 5 2.800 0.49 -0.40% -5.08% 0.018404 52 601808 中海油服 02883 中海油田服务 23.95 12.700 0.47 0.76% -4.94% 0.017600 53 601899 紫金矿业 02899 紫金矿业 8.34 6.300 0.66 0.72% -3.08% 0.002849 54 601328 交通银行 03328 交通银行 7.64 8.760 1.01 -0.13% -3.31% 0.013041 55 600036 招商银行 03968 招商银行 22.7 24.000 0.93 0.13% -3.81% 0.009693 56 601988 中国银行 03988 中国银行 4.16 3.310 0.70 -0.24% -3.50% 0.073876
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-11-30 13:00:34 | 显示全部楼层
本帖最后由 塔利班 于 2018-11-30 15:55 编辑
import pandas as pd
s='序号 A股代码 A股名称 H股代码 H股名称 A股价格(RMB) H股价格(HKD) 两地比价(H*0.88/A) A股涨跌幅 H股涨跌幅 成交量比(H/A) 1 000585 东北电气 00042 东北电气 3.48 1.040 0.26 -0.57% 4.00% 0.004884 2 600600 青岛啤酒 00168 青岛啤酒股份 23.61 15.300 0.57 0.47% -4.38% 0.003425 3 600377 宁沪高速 00177 江苏宁沪高速公路 6.28 6.200 0.87 -0.63% -3.43% 0.034749 4 600860 北人股份 00187 北人印刷机械股份 6.19 1.240 0.18 1.81% -1.59% 0.000272 5 600806 昆明机床 00300 昆明机床 13.42 6.080 0.40 -1.25% -2.09% 0.000691 6 600685 广船国际 00317 广州广船国际股份 27.1 18.320 0.59 0.15% -2.55% 0.001492 7 600808 马钢股份 00323 马鞍山钢铁股份 5.76 4.300 0.66 0.00% -4.23% 0.003426 8 600688 S上石化 00338 上海石油化工股份 6.46 2.310 0.31 1.73% -7.23% 0.036661 9 000898 鞍钢股份 00347 鞍钢股份 13.59 14.400 0.93 0.82% -2.96% 0.002048 10 000666 经纬纺机 00350 经纬纺织机械股份 4.93 1.460 0.26 0.20% -3.31% 0.000985 11 600362 江西铜业 00358 江西铜业股份 25.75 14.460 0.49 2.63% -3.08% 0.005389 12 600028 中国石化 00386 中国石油化工股份 10.14 7.150 0.62 2.32% -2.72% 0.019158 13 601390 中国中铁 00390 中国中铁 5.51 5.500 0.88 -0.72% -3.34% 0.004166 14 601333 广深铁路 00525 广深铁路股份 4.4 3.480 0.70 -0.23% -3.87% 0.002979 15 600548 深高速 00548 深圳高速公路股份 5.96 4.330 0.64 1.19% 0.00% 0.011660 16 600775 南京熊猫 00553 南京熊猫电子股份 6.13 1.830 0.26 3.03% 1.67% 0.010328 17 601588 北辰实业 00588 北京北辰实业股份 8.21 2.340 0.25 0.12% -2.90% 0.000903 18 600115 东方航空 00670 中国东方航空股份 7.39 2.210 0.26 0.27% -5.15% 0.005690 19 000756 新华制药 00719 山东新华制药股份 5.13 1.800 0.31 1.38% 1.12% 0.003414 20 601111 中国国航 00753 中国国航 10.17 3.680 0.32 6.83% -5.15% 0.002238 21 000063 中兴通讯 00763 中兴通讯 60.9 35.000 0.51 -5.29% -5.91% 0.003679 22 601857 中国石油 00857 中国石油股份 15.14 9.630 0.56 2.16% -3.70% 0.047145 23 600332 广州药业 00874 广州药业股份 11.54 4.700 0.36 -0.35% -5.43% 0.002428 24 600011 华能国际 00902 华能国际电力股份 7.21 4.930 0.60 1.84% -2.76% 0.016735 25 600585 海螺水泥 00914 安徽海螺水泥股份 39.74 47.750 1.06 -2.17% -4.50% 0.005922 26 000921 ST科龙 00921 海信科龙 3.81 0.890 0.21 0.00% 0.00% 0.000000 27 601939 建设银行 00939 建设银行 5.88 5.910 0.88 -0.84% -2.64% 0.059746 28 601991 大唐发电 00991 大唐发电 10.62 4.300 0.36 0.28% -3.59% 0.064457 29 600012 皖通高速 00995 安徽皖通高速公路 5.17 5.390 0.92 -0.39% -1.10% 0.001510 30 601998 中信银行 00998 中信银行 5.54 4.400 0.70 -1.25% -1.57% 0.011681 31 600871 S仪化 01033 仪征化纤股份 4.52 1.090 0.21 0.00% -3.54% 0.047456 32 601005 重庆钢铁 01053 重庆钢铁股份 5.52 2.760 0.44 0.73% -2.82% 0.001053 33 600029 南方航空 01055 中国南方航空股份 8.09 2.890 0.31 2.15% -6.77% 0.000989 34 600874 创业环保 01065 天津创业环保股份 8.79 2.210 0.22 3.66% 0.00% 0.000758 35 600027 华电国际 01071 华电国际电力股份 4.96 2.070 0.37 1.85% -1.90% 0.011030 36 600875 东方电气 01072 东方电气 31.87 23.500 0.65 2.97% 2.40% 0.001629 37 601088 中国神华 01088 中国神华 33.93 28.550 0.74 3.01% -3.06% 0.008191 38 600876 *ST洛玻 01108 洛阳玻璃股份 3.47 0.870 0.22 1.17% 0.00% 0.000000 39 600026 中海发展 01138 中海发展股份 20.85 22.400 0.95 -0.62% -6.67% 0.013620 40 600188 兖州煤业 01171 兖州煤业股份 20.53 13.740 0.59 5.61% -0.87% 0.009694 41 601186 中国铁建 01186 中国铁建 9.59 10.300 0.95 -0.93% -0.19% 0.003282 42 601398 工商银行 01398 工商银行 4.91 5.140 0.92 -1.21% -3.20% 0.031887 43 000488 晨鸣纸业 01812 晨鸣纸业 11.47 6.300 0.48 1.68% -2.33% 0.000581 44 200488 晨鸣B 01812 晨鸣纸业 6.7 6.300 0.83 -3.18% -2.33% 0.002035 45 601898 中煤能源 01898 中煤能源 15.12 12.940 0.75 2.02% -4.01% 0.004745 46 601919 中国远洋 01919 中国远洋 20.54 18.700 0.80 0.74% -2.81% 0.006915 47 601318 中国平安 02318 中国平安 40.32 48.050 1.05 -3.93% -7.24% 0.005129 48 000338 潍柴动力 02338 潍柴动力 45 29.650 0.58 2.69% -4.66% 0.001056 49 601600 中国铝业 02600 中国铝业 14.12 8.400 0.52 2.02% -5.62% 0.007605 50 601628 中国人寿 02628 中国人寿 22.88 25.950 1.00 -0.74% -3.71% 0.055013 51 601866 中海集运 02866 中海集运 5 2.800 0.49 -0.40% -5.08% 0.018404 52 601808 中海油服 02883 中海油田服务 23.95 12.700 0.47 0.76% -4.94% 0.017600 53 601899 紫金矿业 02899 紫金矿业 8.34 6.300 0.66 0.72% -3.08% 0.002849 54 601328 交通银行 03328 交通银行 7.64 8.760 1.01 -0.13% -3.31% 0.013041 55 600036 招商银行 03968 招商银行 22.7 24.000 0.93 0.13% -3.81% 0.009693 56 601988 中国银行 03988 中国银行 4.16 3.310 0.70 -0.24% -3.50% 0.073876'
L=s.split()
columns=[]
while True:
    if not L[0].isdigit():
        columns.append(L.pop(0))
    else:
        break
length=len(columns)
T=[]
while L:
    T.append(L[:length])
    L=L[length:]
res=pd.DataFrame(T,columns=columns)
print(res)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-30 14:50:34 | 显示全部楼层
本帖最后由 graceasyi 于 2018-11-30 14:52 编辑
import re


content = "***"                # 文本太长了,这里省略了,要运行自己替换一下
pattern = re.compile(r' \d{1,2} \d{6} ', re.S)
ref = pattern.findall(content)
res = pattern.split(content)
print(res[0])
for i in range(len(ref)):
    print(ref[i], end=' ')
    print(res[i + 1])

结果:

序号A股代码 A股名称 H股代码 H股名称 A股价格(RMB) H股价格(HKD) 两地比价(H*0.88/A) A股涨跌幅 H股涨跌幅 成交量比(H/A)
1 000585  东北电气 00042 东北电气 3.48 1.040 0.26 -0.57% 4.00% 0.004884
2 600600  青岛啤酒 00168 青岛啤酒股份 23.61 15.300 0.57 0.47% -4.38% 0.003425
3 600377  宁沪高速 00177 江苏宁沪高速公路 6.28 6.200 0.87 -0.63% -3.43% 0.034749
4 600860  北人股份 00187 北人印刷机械股份 6.19 1.240 0.18 1.81% -1.59% 0.000272
5 600806  昆明机床 00300 昆明机床 13.42 6.080 0.40 -1.25% -2.09% 0.000691
6 600685  广船国际 00317 广州广船国际股份 27.1 18.320 0.59 0.15% -2.55% 0.001492
7 600808  马钢股份 00323 马鞍山钢铁股份 5.76 4.300 0.66 0.00% -4.23% 0.003426
8 600688  S上石化 00338 上海石油化工股份 6.46 2.310 0.31 1.73% -7.23% 0.036661
9 000898  鞍钢股份 00347 鞍钢股份 13.59 14.400 0.93 0.82% -2.96% 0.002048
10 000666  经纬纺机 00350 经纬纺织机械股份 4.93 1.460 0.26 0.20% -3.31% 0.000985
11 600362  江西铜业 00358 江西铜业股份 25.75 14.460 0.49 2.63% -3.08% 0.005389
12 600028  中国石化 00386 中国石油化工股份 10.14 7.150 0.62 2.32% -2.72% 0.019158
13 601390  中国中铁 00390 中国中铁 5.51 5.500 0.88 -0.72% -3.34% 0.004166
14 601333  广深铁路 00525 广深铁路股份 4.4 3.480 0.70 -0.23% -3.87% 0.002979
15 600548  深高速 00548 深圳高速公路股份 5.96 4.330 0.64 1.19% 0.00% 0.011660
16 600775  南京熊猫 00553 南京熊猫电子股份 6.13 1.830 0.26 3.03% 1.67% 0.010328
17 601588  北辰实业 00588 北京北辰实业股份 8.21 2.340 0.25 0.12% -2.90% 0.000903
18 600115  东方航空 00670 中国东方航空股份 7.39 2.210 0.26 0.27% -5.15% 0.005690
19 000756  新华制药 00719 山东新华制药股份 5.13 1.800 0.31 1.38% 1.12% 0.003414
20 601111  中国国航 00753 中国国航 10.17 3.680 0.32 6.83% -5.15% 0.002238
21 000063  中兴通讯 00763 中兴通讯 60.9 35.000 0.51 -5.29% -5.91% 0.003679
22 601857  中国石油 00857 中国石油股份 15.14 9.630 0.56 2.16% -3.70% 0.047145
23 600332  广州药业 00874 广州药业股份 11.54 4.700 0.36 -0.35% -5.43% 0.002428
24 600011  华能国际 00902 华能国际电力股份 7.21 4.930 0.60 1.84% -2.76% 0.016735
25 600585  海螺水泥 00914 安徽海螺水泥股份 39.74 47.750 1.06 -2.17% -4.50% 0.005922
26 000921  ST 科龙 00921 海信科龙 3.81 0.890 0.21 0.00% 0.00% 0.000000
27 601939  建设银行 00939 建设银行 5.88 5.910 0.88 -0.84% -2.64% 0.059746
28 601991  大唐发电 00991 大唐发电 10.62 4.300 0.36 0.28% -3.59% 0.064457
29 600012  皖通高速 00995 安徽皖通高速公路 5.17 5.390 0.92 -0.39% -1.10% 0.001510
30 601998  中信银行 00998 中信银行 5.54 4.400 0.70 -1.25% -1.57% 0.011681
31 600871  S仪化 01033 仪征化纤股份 4.52 1.090 0.21 0.00% -3.54% 0.047456
32 601005  重庆钢铁 01053 重庆钢铁股份 5.52 2.760 0.44 0.73% -2.82% 0.001053
33 600029  南方航空 01055 中国南方航空股份 8.09 2.890 0.31 2.15% -6.77% 0.000989
34 600874  创业环保 01065 天津创业环保股份 8.79 2.210 0.22 3.66% 0.00% 0.000758
35 600027  华电国际 01071 华电国际电力股份 4.96 2.070 0.37 1.85% -1.90% 0.011030
36 600875  东方电气 01072 东方电气 31.87 23.500 0.65 2.97% 2.40% 0.001629
37 601088  中国神华 01088 中国神华 33.93 28.550 0.74 3.01% -3.06% 0.008191
38 600876  *ST洛玻 01108 洛阳玻璃股份 3.47 0.870 0.22 1.17% 0.00% 0.000000
39 600026  中海发展 01138 中海发展股份 20.85 22.400 0.95 -0.62% -6.67% 0.013620
40 600188  兖州煤业 01171 兖州煤业股份 20.53 13.740 0.59 5.61% -0.87% 0.009694
41 601186  中国铁建 01186 中国铁建 9.59 10.300 0.95 -0.93% -0.19% 0.003282
42 601398  工商银行 01398 工商银行 4.91 5.140 0.92 -1.21% -3.20% 0.031887
43 000488  晨鸣纸业 01812 晨鸣纸业 11.47 6.300 0.48 1.68% -2.33% 0.000581
44 200488  晨鸣B 01812 晨鸣纸业 6.7 6.300 0.83 -3.18% -2.33% 0.002035
45 601898  中煤能源 01898 中煤能源 15.12 12.940 0.75 2.02% -4.01% 0.004745
46 601919  中国远洋 01919 中国远洋 20.54 18.700 0.80 0.74% -2.81% 0.006915
47 601318  中国平安 02318 中国平安 40.32 48.050 1.05 -3.93% -7.24% 0.005129
48 000338  潍柴动力 02338 潍柴动力 45 29.650 0.58 2.69% -4.66% 0.001056
49 601600  中国铝业 02600 中国铝业 14.12 8.400 0.52 2.02% -5.62% 0.007605
50 601628  中国人寿 02628 中国人寿 22.88 25.950 1.00 -0.74% -3.71% 0.055013
51 601866  中海集运 02866 中海集运 5 2.800 0.49 -0.40% -5.08% 0.018404
52 601808  中海油服 02883 中海油田服务 23.95 12.700 0.47 0.76% -4.94% 0.017600
53 601899  紫金矿业 02899 紫金矿业 8.34 6.300 0.66 0.72% -3.08% 0.002849
54 601328  交通银行 03328 交通银行 7.64 8.760 1.01 -0.13% -3.31% 0.013041
55 600036  招商银行 03968 招商银行 22.7 24.000 0.93 0.13% -3.81% 0.009693
56 601988  中国银行 03988 中国银行 4.16 3.310 0.70 -0.24% -3.50% 0.073876
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-30 15:39:48 | 显示全部楼层
换个方法,finditer
import re


content = "***"       # 文本太长了,这里省略了,要运行自己替换一下
pattern = re.compile(r' \d{1,2} \d{6} ', re.S)
ref = re.finditer(pattern, content)
zb = [0]
for i in ref:
    zb.append(i.span()[0])
    print(content[zb[-2]:zb[-1]])
print(content[zb[-1]:])
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-11-30 15:58:34 | 显示全部楼层
发现之前没对齐是ST那里有个空格,已改= =
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-24 09:15

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表