- Pandas数据分析快速上手500招(微课视频版)
- 罗帅 罗斌编著
- 272字
- 2023-07-17 18:40:21
050 从压缩格式的文本文件中读取数据
此案例主要通过在read_csv()函数中设置compression参数值,实现从压缩格式的文本文件中读取数据,并据此创建DataFrame。当在Jupyter Notebook中运行此案例代码之后,将从压缩文件(myspace.zip)中读取该压缩文件包含的文本文件(myspace.txt)的数据,效果分别如图050-1和图050-2所示。
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P61_4098.jpg?sign=1738961464-uINw362rWx74WTP1yNxAw6TpGmBASQz4-0-02a9875b96700b084d984d84626799b7)
图050-1
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P61_4099.jpg?sign=1738961464-Kl8EuUDzT8OOzitqr9YSHozlc87VxDvz-0-9df1a6defb4dc0c28aa384321e47b4fc)
图050-2
主要代码如下。
![](https://epubservercos.yuewen.com/DC5573/26580753209033106/epubprivate/OEBPS/Images/Figure-P62_35774.jpg?sign=1738961464-161CEQXZjEszsxOrB6Zu9s3VCBsz6sGn-0-6e5a22401d3dc9072c018b4b1f4e180d)
在上面这段代码中,pd.read_csv('myspace.zip',delim_whitespace=True,compression='zip')表示读取压缩文件(myspace.zip)的数据,参数compression='zip'表示压缩格式是zip。如果压缩文件(myspace.zip)的压缩格式是zip,也可以省略compression参数值,即pd.read_csv('myspace.zip',delim_whitespace=True)也能实现完全相同的功能。如果压缩文件(myspace.arj)的压缩格式是zip,则必须设置compression='zip',即执行pd.read_csv('myspace.arj',delim_whitespace=True,compression='zip')才能正确读取压缩文件(myspace.arj)的数据,执行pd.read_csv('myspace.arj',delim_whitespace=True)代码将报错。
此案例的主要源文件是MyCode\H197\H197.ipynb。