Python 人类的HTML解析器:requests_html

Python 人类的HTML解析器:requests_html该库旨在使解析HTML(例如,抓取Web)尽可能简单直观。使用该库时,您将自动获得:全面的JavaScript支持!CSS选择器(又称jQuery风格,多亏了PyQuery)。XPath Selectors,让您感到昏厥。模拟的用户代理(如真实的Web浏览器)。自动跟随重定向。连接池和cookie持久性。您知道和喜欢的请求体验具有神奇的

- 阅读全文 -

Python 网络爬虫:requests

Python 网络爬虫:requestsrequests库的安装pip install requestsrequests库的使用方法r=requests.get(url,params=None,**kwargs)url:页面的url链接params:url中的额外参数,字典或字节流**kwargs:其他12个参数requests 的相关操作r.status_code检查返回的Response对象的

- 阅读全文 -

Python 轻量级数据交换格式 JSON

Python 轻量级数据交换格式 JSONJSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。它是基于 JavaScript Programming Language , Standard ECMA-262 3rd Edition - December 1999 的一个子集。 JSON采用完

- 阅读全文 -

Python 打包发布:Pyinstaller

Python 打包发布:Pyinstaller如何让自己编写的python源代码生成一个可执行的文件,如.exe呢?在创建了独立应用(自包含该应用的依赖包)之后,还可以使用 PyInstaller 将Python程序生成可直接运行的程序,这个程序就可以被分发到对应的 Windows 或 Mac OS X 还有Linux 平台上运行。含 PyInstaller 模块,因此需要自行安装 PyInsta

- 阅读全文 -

Python 迭代器和生成器

Python 迭代器和生成器迭代是Python最强大的功能之一,是访问集合元素的一种方式,一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。迭代器有两个基本的方法:iter() 和 next()。list = [1,2,3,4] # 创造迭代器对象 iteror = iter(list) print(next(iteror))

- 阅读全文 -