鱼C论坛

 找回密码
 立即注册
查看: 6820|回复: 79

[已解决]请问这个爬虫怎么了|小小敬意

[复制链接]
发表于 2021-8-10 21:02:14 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request as url
from urllib.parse import urlencode
import json as j

head = {}
head['User-Agent'] = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrom'
data = {\
'client': "pc",\
'exchange':'false',\
'fr':"browser_pc",\
'from':"auto",\
'needQc':'1',\
's':"d78cdd5a1a76770c398ca51493d3a2c0",\
'text':"I like FishC.com",\
'to':"zh-CHS",\
'uuid':"12681881-4857-4a6a-be0e-8c7bd28a73d3"}
data = urlencode(data).encode('utf-8')

ps=url.ProxyBasicAuthHandler({'http':'223.244.179.85:3256'})
opener = url.build_opener(ps)
opener.addheaders = [head]
name = url.Request(r'https://fanyi.sogou.com/api/transpc/text/result',data,head)
response = opener.open(name)
html = response.read().decode('utf-8')


print(html)
不仅进不去还报错
最佳答案
2021-8-11 17:13:59
本帖最后由 nahongyan1997 于 2021-8-11 17:15 编辑

给你看看我这打印出来的东西,我什么都没动
Python 3.8.8 (C:\Users\Administrator\AppData\Local\Programs\Python\Python38\python.exe)
>>> %Run 1.py
b'{"status":0,"info":"success","zly":"zly","node":"1","data":{"translate":{"zly":"zly","errorCode":"0","qc_type":"2","index":"content0","from":"en","source":"sogou","text":"I like FishC.com","to":"zh-CHS","id":"a5ffe05c-34dd-4467-8308-9cb786a9a93d","dit":"\xe6\x88\x91\xe5\x96\x9c\xe6\xac\xa2FishC.com","orig_text":"I like FishC.com","diff_text":"\xee\x90\x8aI like FishC.com\xee\x90\x8b\xee\x90\x8cilikefishc.com\xee\x90\x8d","qc_text":"ilikefishc.com","md5":""},"detect":{"zly":"zly","detect":"en","errorCode":"0","language":"\xe8\x8b\xb1\xe8\xaf\xad","id":"573c5190-fa84-11eb-913f-31d41187ce12","text":"I like FishC.com"},"sgtkn":"CB157737AF83C5C3B3B67D8E1C7E84C5B48B72CD611394A3","wordCard":{"title":false,"show":false,"usual_Dict":"","second_query":"","exchange":"","levelList":""},"detail":"","book":"","network":"","pic":"","voice":"","keywords":[{"key":"like","value":"\xe5\x83\x8f\xef\xbc\x9b\xe7\x9b\xb8\xe4\xbc\xbc\xef\xbc\x9b\xe7\xb1\xbb\xe4\xbc\xbc\xef\xbc\x9b\xe4\xbe\x8b\xe5\xa6\x82\xef\xbc\x9b\xe5\xa5\xbd\xe6\xaf\x94\xef\xbc\x9b\xe5\xa6\x82\xe5\x90\x8c\xef\xbc\x9b\xe7\xac\xa6\xe5\x90\x88\xe2\x80\xa6\xe7\x9a\x84\xe6\x96\xb9\xe5\xbc\x8f\xef\xbc\x9b\xe8\x83\xbd\xe6\x96\x99\xe6\x83\xb3\xe5\x88\xb0\xe7\x9a\x84\xef\xbc\x9b\xe6\x9c\x89\xe2\x80\xa6\xe7\x89\xb9\xe7\x82\xb9\xe7\x9a\x84\xef\xbc\x9b\xe5\x90\x8c\xe2\x80\xa6 \xe4\xb8\x80\xe6\xa0\xb7\xef\xbc\x9b\xe5\xa6\x82\xef\xbc\x9b\xe5\xa5\xbd\xe5\x83\x8f\xef\xbc\x9b\xe5\x90\x8c\xe6\xa0\xb7\xe7\x9a\x84\xe4\xba\xba\xef\xbc\x9b\xe5\x96\x9c\xe7\x88\xb1\xef\xbc\x9b\xe5\x90\x8c\xe6\xa0\xb7\xe7\x9a\x84\xe4\xba\x8b\xef\xbc\x9b\xe7\x9b\xb8\xe5\x90\x8c\xe7\x9a\x84\xef\xbc\x9b\xe5\x90\x8c\xe6\xa0\xb7\xe7\x9a\x84\xef\xbc\x9b\xe9\x80\xbc\xe7\x9c\x9f\xe7\x9a\x84\xef\xbc\x9b\xe5\x83\x8f\xe7\x9a\x84\xef\xbc\x9b\xe4\xbb\xa5\xe2\x80\xa6\xe7\x9a\x84\xe6\x96\xb9\xe5\xbc\x8f\xef\xbc\x9b\xe5\xa5\xbd\xe5\x83\x8f\xe5\x9c\xa8\xe8\xaf\xb4\xef\xbc\x9b\xe5\x96\x9c\xe6\xac\xa2\xef\xbc\x9b\xe5\xb8\x8c\xe6\x9c\x9b\xef\xbc\x9b\xe6\x83\xb3\xe8\xa6\x81\xef\xbc\x9b\xe8\xae\xa4\xe4\xb8\xba\xef\xbc\x9b\xe4\xb8\x8d\xe6\x83\x85\xe6\x84\xbf\xef\xbc\x9b\xe6\x83\x85\xe6\x84\xbf\xe8\xa6\x81\xef\xbc\x9b\xe5\xae\x81\xe8\xa6\x81\xef\xbc\x9b\xe6\x84\x9f\xe8\xa7\x89"}],"isAutoMatch":false,"kana":""}}'
b'{"status":0,"info":"success","zly":"zly","node":"1","data":{"translate":{"zly":"zly","errorCode":"0","qc_type":"2","index":"content0","from":"en","source":"sogou","text":"I like FishC.com","to":"zh-CHS","id":"a5ffe05c-34dd-4467-8308-9cb786a9a93d","dit":"\xe6\x88\x91\xe5\x96\x9c\xe6\xac\xa2FishC.com","orig_text":"I like FishC.com","diff_text":"\xee\x90\x8aI like FishC.com\xee\x90\x8b\xee\x90\x8cilikefishc.com\xee\x90\x8d","qc_text":"ilikefishc.com","md5":""},"detect":{"zly":"zly","detect":"en","errorCode":"0","language":"\xe8\x8b\xb1\xe8\xaf\xad","id":"573c5190-fa84-11eb-913f-31d41187ce12","text":"I like FishC.com"},"sgtkn":"CB157737AF83C5C3B3B67D8E1C7E84C5B48B72CD611394A3","wordCard":{"title":false,"show":false,"usual_Dict":"","second_query":"","exchange":"","levelList":""},"detail":"","book":"","network":"","pic":"","voice":"","keywords":[{"key":"like","value":"\xe5\x83\x8f\xef\xbc\x9b\xe7\x9b\xb8\xe4\xbc\xbc\xef\xbc\x9b\xe7\xb1\xbb\xe4\xbc\xbc\xef\xbc\x9b\xe4\xbe\x8b\xe5\xa6\x82\xef\xbc\x9b\xe5\xa5\xbd\xe6\xaf\x94\xef\xbc\x9b\xe5\xa6\x82\xe5\x90\x8c\xef\xbc\x9b\xe7\xac\xa6\xe5\x90\x88\xe2\x80\xa6\xe7\x9a\x84\xe6\x96\xb9\xe5\xbc\x8f\xef\xbc\x9b\xe8\x83\xbd\xe6\x96\x99\xe6\x83\xb3\xe5\x88\xb0\xe7\x9a\x84\xef\xbc\x9b\xe6\x9c\x89\xe2\x80\xa6\xe7\x89\xb9\xe7\x82\xb9\xe7\x9a\x84\xef\xbc\x9b\xe5\x90\x8c\xe2\x80\xa6 \xe4\xb8\x80\xe6\xa0\xb7\xef\xbc\x9b\xe5\xa6\x82\xef\xbc\x9b\xe5\xa5\xbd\xe5\x83\x8f\xef\xbc\x9b\xe5\x90\x8c\xe6\xa0\xb7\xe7\x9a\x84\xe4\xba\xba\xef\xbc\x9b\xe5\x96\x9c\xe7\x88\xb1\xef\xbc\x9b\xe5\x90\x8c\xe6\xa0\xb7\xe7\x9a\x84\xe4\xba\x8b\xef\xbc\x9b\xe7\x9b\xb8\xe5\x90\x8c\xe7\x9a\x84\xef\xbc\x9b\xe5\x90\x8c\xe6\xa0\xb7\xe7\x9a\x84\xef\xbc\x9b\xe9\x80\xbc\xe7\x9c\x9f\xe7\x9a\x84\xef\xbc\x9b\xe5\x83\x8f\xe7\x9a\x84\xef\xbc\x9b\xe4\xbb\xa5\xe2\x80\xa6\xe7\x9a\x84\xe6\x96\xb9\xe5\xbc\x8f\xef\xbc\x9b\xe5\xa5\xbd\xe5\x83\x8f\xe5\x9c\xa8\xe8\xaf\xb4\xef\xbc\x9b\xe5\x96\x9c\xe6\xac\xa2\xef\xbc\x9b\xe5\xb8\x8c\xe6\x9c\x9b\xef\xbc\x9b\xe6\x83\xb3\xe8\xa6\x81\xef\xbc\x9b\xe8\xae\xa4\xe4\xb8\xba\xef\xbc\x9b\xe4\xb8\x8d\xe6\x83\x85\xe6\x84\xbf\xef\xbc\x9b\xe6\x83\x85\xe6\x84\xbf\xe8\xa6\x81\xef\xbc\x9b\xe5\xae\x81\xe8\xa6\x81\xef\xbc\x9b\xe6\x84\x9f\xe8\xa7\x89"}],"isAutoMatch":false,"kana":""}}'
{'data': {'book': '',
          'detail': '',
          'detect': {'detect': 'en',
                     'errorCode': '0',
                     'id': '573c5190-fa84-11eb-913f-31d41187ce12',
                     'language': '英语',
                     'text': 'I like FishC.com',
                     'zly': 'zly'},
          'isAutoMatch': False,
          'kana': '',
          'keywords': [{'key': 'like',
                        'value': '像;相似;类似;例如;好比;如同;符合…的方式;能料想到的;有…特点的;同… '
                                 '一样;如;好像;同样的人;喜爱;同样的事;相同的;同样的;逼真的;像的;以…的方式;好像在说;喜欢;希望;想要;认为;不情愿;情愿要;宁要;感觉'}],
          'network': '',
          'pic': '',
          'sgtkn': 'CB157737AF83C5C3B3B67D8E1C7E84C5B48B72CD611394A3',
          'translate': {'diff_text': '\ue40aI like '
                                     'FishC.com\ue40b\ue40cilikefishc.com\ue40d',
                        'dit': '我喜欢FishC.com',
                        'errorCode': '0',
                        'from': 'en',
                        'id': 'a5ffe05c-34dd-4467-8308-9cb786a9a93d',
                        'index': 'content0',
                        'md5': '',
                        'orig_text': 'I like FishC.com',
                        'qc_text': 'ilikefishc.com',
                        'qc_type': '2',
                        'source': 'sogou',
                        'text': 'I like FishC.com',
                        'to': 'zh-CHS',
                        'zly': 'zly'},
          'voice': '',
          'wordCard': {'exchange': '',
                       'levelList': '',
                       'second_query': '',
                       'show': False,
                       'title': False,
                       'usual_Dict': ''}},
'info': 'success',
'node': '1',
'status': 0,
'zly': 'zly'}
>>>
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-8-10 21:03:18 | 显示全部楼层
求助
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-10 21:03:36 | 显示全部楼层

回帖奖励 +10 鱼币

我问一下,网站有没有问题
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-10 21:04:12 | 显示全部楼层
wangka 发表于 2021-8-10 21:03
我问一下,网站有没有问题

报什么错
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-10 21:07:44 | 显示全部楼层
本帖最后由 wangka 于 2021-8-10 21:17 编辑

你的逗号!,,看看呢?
爬虫是不断更新的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-10 21:25:47 | 显示全部楼层

回帖奖励 +10 鱼币

报错问题发一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-10 21:34:19 | 显示全部楼层

回帖奖励 +10 鱼币

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-10 21:41:51 | 显示全部楼层

回帖奖励 +10 鱼币

666
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-10 21:47:43 | 显示全部楼层
布吉岛
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-10 22:03:30 | 显示全部楼层

回帖奖励 +10 鱼币

上面两位鱼油,要和平讨论呀
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-10 22:06:01 | 显示全部楼层
我猜你对基本爬虫的原理,都没搞清楚。。
而且这还是直接调用人家的api,你难道是人家内部员工?

其次,基本的拼写错误(明显的复制粘贴错误),没发现吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-11 07:45:39 From FishC Mobile | 显示全部楼层

回帖奖励 +10 鱼币

磊之茶 发表于 2021-8-10 21:03
求助

所有翻译网站,待翻译词句都是被加密的,如果是你自己提交请求,那么你要提交加密以后的字符串
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-11 08:48:59 | 显示全部楼层
6666666
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-11 08:58:57 | 显示全部楼层
我帮你把代码改好了呦,记得设置最佳答案呦。
from urllib.request import *
from urllib.parse import urlencode
import json as j
from pprint import pprint
from gzip import GzipFile
from io import BytesIO

header = {
    "Accept": "application/json, text/plain, */*",
    "Accept-Encoding": "gzip, deflate, br",
    "Accept-Language": "zh-CN,zh;q=0.9,ko;q=0.8,ga;q=0.7",
    "Connection": "keep-alive",
    "Sec-Fetch-Mode": "cors",
    "Sec-Fetch-Site": "same-origin",
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36",
    "Host": "fanyi.sogou.com",
    "Origin": "https://fanyi.sogou.com",
    "Referer": "https://fanyi.sogou.com/text",
    "Content-Type": "application/json;charset=UTF-8",
    "Cookie": "ABTEST=0|1628641545|v17; IPLOC=CN2102; SUID=1C377177EF53A00A0000000061131909; SNUID=AF83C5C3B3B67D8E1C7E84C5B48B72CD; FUV=7780e23e4a0de1b60632bc7d414ef4d0; SGINPUT_UPSCREEN=1628641551176; SUV=1628641551193"
    }

data = {
    'client': "pc",
    'exchange':'false',
    'fr':"browser_pc",
    'from':"auto",
    'needQc':'1',
    's':"d78cdd5a1a76770c398ca51493d3a2c0",
    'text':"I like FishC.com",
    'to':"zh-CHS",
    'uuid':"12681881-4857-4a6a-be0e-8c7bd28a73d3"
    }

data = j.dumps(data).encode('utf-8')

header["Content-Length"] = len(data)

ps=ProxyHandler({'http':'223.244.179.85:3256'})
opener = build_opener(ps)
Req = Request(r'https://fanyi.sogou.com/api/transpc/text/result',data,header)
response = opener.open(Req)
html = GzipFile(fileobj=BytesIO(response.read())).read()
result = j.loads(html)

pprint(result)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-11 09:04:44 | 显示全部楼层

回帖奖励 +10 鱼币

居然没有鱼币,再来一次
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-11 09:05:00 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-11 09:32:49 | 显示全部楼层

回帖奖励 +10 鱼币

我顶一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-11 11:36:44 | 显示全部楼层
感谢分享!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-11 12:08:30 | 显示全部楼层
看不懂!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-11 12:33:23 | 显示全部楼层

回帖奖励 +10 鱼币

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-13 07:43

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表