[已解决]爬取的数据带有换行符

齐紫荆。 · 发表于 2020-4-2 17:50:06

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

从网上爬取的数据，里面带换行符，没法排版出去，求大佬解答下

最佳答案

月排行榜 / 总排行榜

zltzlt

2020-4-2 17:58:45

import requests
import bs4
from bs4 import BeautifulSoup
r = requests.get('https://yanyu.huijiwiki.com/wiki/伙伴成长以及加点属性排行一览')
r.encoding = r.apparent_encoding
html = r.text
soup = BeautifulSoup(html, "html.parser")
table = soup.find('table').children
ulist = []
for tr in table:
if isinstance(tr, bs4.element.Tag):
td = tr('td')
if not td:
continue
ulist.append([td[0].string, td[1].string, td[2].string, td[3].string])
print(*(" ".join(j[:-1] for j in i) for i in ulist), sep="\n")

复制代码

跳转到最佳答案楼层

zltzlt · 发表于 2020-4-2 17:51:53

发代码，不要只贴张图

齐紫荆。 · 发表于 2020-4-2 17:53:02

zltzlt 发表于 2020-4-2 17:51
发代码，不要只贴张图

import requests
import bs4
from bs4 import BeautifulSoup

r = requests.get('https://yanyu.huijiwiki.com/wiki/伙伴成长以及加点属性排行一览')
r.encoding = r.apparent_encoding
html = r.text
soup = BeautifulSoup(html,"html.parser")
table = soup.find('table').children
ulist = []

for tr in table:
if isinstance(tr,bs4.element.Tag):
      td = tr('td')
      if td ==[]:
         continue
      ulist.append([td[0].string,td[1].string,td[2].string,td[3].string])

print(ulist)

zltzlt · 发表于 2020-4-2 17:54:18

这样可以吗：

import requests
import bs4
from bs4 import BeautifulSoup
r = requests.get('https://yanyu.huijiwiki.com/wiki/伙伴成长以及加点属性排行一览')
r.encoding = r.apparent_encoding
html = r.text
soup = BeautifulSoup(html, "html.parser")
table = soup.find('table').children
ulist = []
for tr in table:
if isinstance(tr, bs4.element.Tag):
td = tr('td')
if not td:
continue
ulist.append([td[0].string, td[1].string, td[2].string, td[3].string])
print(*("".join(i) for i in ulist), sep="\n")

复制代码

齐紫荆。 · 发表于 2020-4-2 17:56:16

zltzlt 发表于 2020-4-2 17:54
这样可以吗：

不行，还是就一列下来，

zltzlt · 发表于 2020-4-2 17:58:45

这个最佳答案由 zltzlt 给出，感谢 zltzlt 的回答。

单击隐藏图章

import requests
import bs4
from bs4 import BeautifulSoup
r = requests.get('https://yanyu.huijiwiki.com/wiki/伙伴成长以及加点属性排行一览')
r.encoding = r.apparent_encoding
html = r.text
soup = BeautifulSoup(html, "html.parser")
table = soup.find('table').children
ulist = []
for tr in table:
if isinstance(tr, bs4.element.Tag):
td = tr('td')
if not td:
continue
ulist.append([td[0].string, td[1].string, td[2].string, td[3].string])
print(*(" ".join(j[:-1] for j in i) for i in ulist), sep="\n")

复制代码

齐紫荆。 · 发表于 2020-4-2 18:00:16

zltzlt 发表于 2020-4-2 17:58

谢大佬

账号		自动登录	找回密码
密码			立即注册