求助!爬虫怎么爬处理后的邮箱地址
爬邮箱地址的时候看到这个,这到底是个啥东西,晕了(太长了图片放不上来)邮箱 : <span _tsites_encrypt_field="_tsites_encrypt_field" id="_tsites_encryp_tsothercontact_tsccontent" style="display:none;">0140e72838473b26a6d68be302af5d26ab4c2478dbb8995840ba5af40acd690f743b582d59846c1dec813216076d81ebff6ed5e45a9446f574945a3622ea34a6acb39fcde2482d1957fff32881e5e53ce630d06fcd69a9dbf3de95fe9e2602a7a556103b4bc0291e3ca9d83065992ee7acddde90763827db12cf2658f588529c</span>
希望大佬们能给点思路,这是加密了吗?怎么加密的?{:10_269:} LLLLoik 发表于 2021-12-12 11:09
完全不会html,复制的时候可能标签对不上,抱歉
看起来老师的邮箱字段被加密了。可能得用selenium爬了。
你的爬虫的代码发一下吧,我们看看url的页面情况。 代码发全 suchocolate 发表于 2021-12-11 18:14
代码发全
<div class="t_jbxx_nr">
<p>
副教授
硕士生导师
</p>
<!--性别-->
<p>性别:男</p>
<!--出生年月-->
<!--毕业院校-->
<p>毕业院校:某大学</p>
<!--学历-->
<p>学历:博士研究生毕业</p>
<!--学位-->
<p>学位:工学博士学位</p>
<!--在职信息-->
<p>在职信息:在职</p>
<!--所在单位-->
<p>所在单位:电子工程学院</p>
<!--入职时间-->
<!--职务-->
<!--
-->
<!--学科-->
<!--办公地点-->
<p>办公地点:老科技楼</p>
<!--联系方式-->
<!--email-->
<p>电子邮箱:<span _tsites_encrypt_field="_tsites_encrypt_field" id="_tsites_encryp_tsteacher_tsemail" style="display:none;">9a50806b229eb39ce23c5aabb42092b3959a9829049e45d52d52a91d6cf36e819c534ebbb46eb01d68e6f1a27b673f01f7086d0208acf209fc49069da90613fd3b3e1330b074f15661c3079417d9f0c8316df9ff203e5a996a3ccb6a1b0264a687ddd236e2d98efe3f7f222921937582d6a7325383563b2f856f59d80b2fe94b</span></p>
</div><script language="javascript" src="/system/resource/tsites/tsitesencrypt.js"></script>
网页html个人信息整段的代码就是这些,我主要是想了解一下这个邮箱地址是经过什么处理变成这样的,解不出来就算了 LLLLoik 发表于 2021-12-12 11:08
网页html个人信息整段的代码就是这些,我主要是想了解一下这个邮箱地址是经过什么处理变成这样的,解不 ...
完全不会html,复制的时候可能标签对不上,抱歉 应该是加密了,要原网址,分析js,才能判断加密方式和密钥 suchocolate 发表于 2021-12-11 16:42
看起来老师的邮箱字段被加密了。可能得用selenium爬了。
你的爬虫的代码发一下吧,我们看看url的页面情 ...
不用了不用了,我也只是想先稍微了解一下,前几天比较忙没能及时看到,感谢大佬的解答了
页:
[1]