全局代理 ip地址怎么看
python3内存中字符串的编码是Unicode的形式,我们一般获取的html都是编码过的,我们需要解码。
由于自己异常稀少的知识储量,选择了urllib.request(PS:网上大家都说requests是为人类写的模块,很多方法名都很人性化,可惜我不是很熟悉,以后有机会可以,用request重写一下。)
我这里选择用bs4.BeautifulSoup进行数据提取。这个可能相对简单一点。提取流程:1. chrome中输入西刺代理官网地址F12搜索所需的代理IP信息在html中的位置。
2. 确认BeautifulSoup中tag是否相同全局代理 ip地址怎么看。初步发现我们所需要的ip和端口信息在,tr(table的行)的td(标准单元格)中。