海皇 发表于 2020-8-21 16:29:05

求助

['\n                                    官网:\n                                     http://www.qq.com ', '\n                                    官网:\n                                     www.qcloud.com ', '\n                                    官网:\n                                     https://wxy.qq.com/ ', '\n                                    官网:\n                                     www.tencentmusic.com ', '\n                                    官网:\n                                     https://www.actencent.com/ ', '\n                                    官网:\n                                     https://www.tencent.com/ ', '\n                                    地址:上海市徐汇区虹梅路1801号C区201室\n                              ', '\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦24层\n                              ', '\n                                    官网:\n                                     www.tencentx.com ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)\n                              ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路腾讯大厦36层。\n                              ', '\n                                    地址:西藏自治区林芝市巴宜区八一镇广东路58号星程酒店8103房\n                              ', '\n                                    官网:\n                                     https://zj.qq.com/ ', '\n                                    官网:\n                                     www.tencentcloud.com ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路腾讯大厦35层\n                              ', '\n                                    官网:\n                                     http://ln.qq.com/ ', '\n                                    地址:北京市昌平区回龙观东大街338号创客广场A1-12-001\n                              ', '\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦35层\n                              ', '\n                                    官网:\n                                     www.tencent.com ', '\n                                    官网:\n                                     www.gdtengnan.com ']
如何把全部的\n和符号取消

聂嘉辉 发表于 2020-8-21 16:48:50

正则表达式

Twilight6 发表于 2020-8-21 16:54:32


这样试试看:

#coding=utf-8
temp = ['\n                                    官网:\n                                     http://www.qq.com ', '\n                                    官网:\n                                     www.qcloud.com ', '\n                                    官网:\n                                     https://wxy.qq.com/ ', '\n                                    官网:\n                                     www.tencentmusic.com ', '\n                                    官网:\n                                     https://www.actencent.com/ ', '\n                                    官网:\n                                     https://www.tencent.com/ ', '\n                                    地址:上海市徐汇区虹梅路1801号C区201室\n                              ', '\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦24层\n                              ', '\n                                    官网:\n                                     www.tencentx.com ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)\n                              ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路腾讯大厦36层。\n                              ', '\n                                    地址:西藏自治区林芝市巴宜区八一镇广东路58号星程酒店8103房\n                              ', '\n                                    官网:\n                                     https://zj.qq.com/ ', '\n                                    官网:\n                                     www.tencentcloud.com ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路腾讯大厦35层\n                              ', '\n                                    官网:\n                                     http://ln.qq.com/ ', '\n                                    地址:北京市昌平区回龙观东大街338号创客广场A1-12-001\n                              ', '\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦35层\n                              ', '\n                                    官网:\n                                     www.tencent.com ', '\n                                    官网:\n                                     www.gdtengnan.com ']
for i in temp:
    print(''.join(i.split()))

疾风怪盗 发表于 2020-8-21 16:55:49

a = ['\n                                    官网:\n                                     http://www.qq.com ',
   '\n                                    官网:\n                                     www.qcloud.com ',
   '\n                                    官网:\n                                     https://wxy.qq.com/ ',
   '\n                                    官网:\n                                     www.tencentmusic.com ',
   '\n                                    官网:\n                                     https://www.actencent.com/ ',
   '\n                                    官网:\n                                     https://www.tencent.com/ ',
   '\n                                    地址:上海市徐汇区虹梅路1801号C区201室\n                              ',
   '\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦24层\n                              ',
   '\n                                    官网:\n                                     www.tencentx.com ',
   '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)\n                              ',
   '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路腾讯大厦36层。\n                              ',
   '\n                                    地址:西藏自治区林芝市巴宜区八一镇广东路58号星程酒店8103房\n                              ',
   '\n                                    官网:\n                                     https://zj.qq.com/ ',
   '\n                                    官网:\n                                     www.tencentcloud.com ',
   '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路腾讯大厦35层\n                              ',
   '\n                                    官网:\n                                     http://ln.qq.com/ ',
   '\n                                    地址:北京市昌平区回龙观东大街338号创客广场A1-12-001\n                              ',
   '\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦35层\n                              ',
   '\n                                    官网:\n                                     www.tencent.com ',
   '\n                                    官网:\n                                     www.gdtengnan.com ']
b = []
for i in a:
    #print(i)
    b.append(i.replace('\n','').replace(' ',''))
print(b)

海皇 发表于 2020-8-21 17:06:53

Twilight6 发表于 2020-8-21 16:54
这样试试看:

然后可以怎么导入进Excel表格里,大佬{:10_254:}

Twilight6 发表于 2020-8-21 17:23:24

海皇 发表于 2020-8-21 17:06
然后可以怎么导入进Excel表格里,大佬

你这都没有明确对应关系,这里官网这么多,地址 却很少,这么写表格呢

海皇 发表于 2020-8-21 17:44:27

本帖最后由 海皇 于 2020-8-21 17:54 编辑

Twilight6 发表于 2020-8-21 17:23
你这都没有明确对应关系,这里官网这么多,地址 却很少,这么写表格呢

实际上我爬取的是官网的那一行,但是有些没有官网导致判断成了地址这一行爬到官网那一行去了{:10_245:}

Twilight6 发表于 2020-8-21 17:54:40

海皇 发表于 2020-8-21 17:44
实际上我爬取的是官网的那一行,但是有些没有官网导致判断成了地址这一行爬到官网那一行去了


那帮你只写入官方网址了:

# coding = UTF-8
importpandasas pd

dict1 = {'官网网址': []}
temp = ['\n                                    官网:\n                                     http://www.qq.com ', '\n                                    官网:\n                                     www.qcloud.com ', '\n                                    官网:\n                                     https://wxy.qq.com/ ', '\n                                    官网:\n                                     www.tencentmusic.com ', '\n                                    官网:\n                                     https://www.actencent.com/ ', '\n                                    官网:\n                                     https://www.tencent.com/ ', '\n                                    地址:上海市徐汇区虹梅路1801号C区201室\n                              ', '\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦24层\n                              ', '\n                                    官网:\n                                     www.tencentx.com ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)\n                              ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路腾讯大厦36层。\n                              ', '\n                                    地址:西藏自治区林芝市巴宜区八一镇广东路58号星程酒店8103房\n                              ', '\n                                    官网:\n                                     https://zj.qq.com/ ', '\n                                    官网:\n                                     www.tencentcloud.com ', '\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路腾讯大厦35层\n                              ', '\n                                    官网:\n                                     http://ln.qq.com/ ', '\n                                    地址:北京市昌平区回龙观东大街338号创客广场A1-12-001\n                              ', '\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦35层\n                              ', '\n                                    官网:\n                                     www.tencent.com ', '\n                                    官网:\n                                     www.gdtengnan.com ']
for i in temp:
    if i.split() == '官网:':
      dict1['官网网址'].append(i.split())

df = pd.DataFrame(dict1)
df.to_excel('1.xlsx', index=False)

海皇 发表于 2020-8-22 09:23:57

Twilight6 发表于 2020-8-21 17:54
那帮你只写入官方网址了:

谢谢,大佬{:10_254:}

海皇 发表于 2020-8-22 10:58:38

本帖最后由 海皇 于 2020-8-22 11:39 编辑

Twilight6 发表于 2020-8-21 17:54
那帮你只写入官方网址了:

['\n                                    地址:深圳市南山区粤海街道麻岭社区科技中一路腾讯大厦35层\n                              ',
'\n                                    地址:北京市海淀区知春路49号3层西部309\n                              ',
'\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)(经营场所:深圳市南山区高新园科技中一路腾讯大厦11楼东)\n                              ',
'\n                                    地址:深圳市前海深港合作区临海大道59号海运中心主塔楼21楼2119P\n                              ', '
\n                                    地址:深圳市前海深港合作区临海大道59号海运中心主塔楼2109K\n                              ',
'\n                                    地址:深圳市南山区高新区科技中一路腾讯大厦35层\n                              ',
'\n                                    品牌/产品:腾讯影业\n\n\n                              ',
'\n                                    投资机构:腾讯投资\n\n\n                              ',
'\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)\n                              ',
'\n                                    投资机构:腾讯投资\n\n\n                              ',
'\n                                    投资机构:腾讯投资\n\n\n                              ',
'\n                                    投资机构:腾讯投资\n\n\n                              ',
'\n                                    地址:浙江省杭州市江干区丁桥东路880号3楼308室\n                              ',
'\n                                    地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);经营地址:深圳市南山区粤海街道科技中一路万利达大厦13层。\n                              ',
'\n                                    投资人:腾讯电商(香港)有限公司\n\n\n                              ',
'\n                                    地址:沈阳市沈河区中山路339号19层\n                              ',
'\n                                    品牌/产品:腾讯众创空间\n\n\n                              ',
'\n                                    投资人:深圳市腾讯产业投资基金有限公司\n\n\n                              ',
'\n                                    地址:香港湾仔皇后大道东1号太古广场三座29楼\n                              ',
'\n                                    地址:广州市越秀区广州大道中289号南方传媒大厦B座九楼全层(仅限办公用途)\n                              '
]

大佬我想问就是为啥使用你发给我的那个代码反而没有导入到列表里面
g_addr_list =
使用完这个还是没有用
页: [1]
查看完整版本: 求助