可以快速用Python进行数据分析的几个小技巧

来源:互联网 编辑:wan玩得好手游小编更新:2024-10-30 05:43:30 人气:

数据分析不仅是数据分析师、数据挖掘工程师、数据科学家的必备技能之一,也是日常工作中进行业务分析的不可或缺的环节。

可以快速用Python进行数据分析的几个小技巧

可以快速用Python进行数据分析的几个小技巧

欢迎点击上方“关注”,公众号将持续提供优质内容

一些小提示和小技巧可能是非常有用的,特别是在编程领域。有时候使用一点点技术,既可以节省时间,还可能为项目添彩。

小编在本章节介绍几种非常受益的方法,后续章节会逐一介绍其他技巧,如有兴趣,欢迎关注,有疑问可以留言。

Pandas中数据框数据的Profiling过程

Profiling(分析器)是一个帮助我们理解数据的过程,而Pandas Profiling是一个Python包,它可以简单快速地对Pandas 的数据框数据进行探索性数据分析。

Pandas中df.describe()和df.info()函数可以实现初步的数据分析。但是它们只提供了对数据非常基本的概述,对于大型数据集没有太大帮助。

而Pandas中的Profiling功能简单通过一行代码就能显示大量统计信息包括直方图、众数、相关系数、分位数、描述统计量、其他信息——类型、单一变量值、缺失值等。

用法

import pandas as pd
import pandas_profiling
df = pd.read_csv('titanic/train.csv')
pandas_profiling.ProfileReport(df)

一行代码就能实现在Jupyter Notebook中显示完整的数据分析报告,该报告非常详细,且包含了必要的图表信息。

Pandas实现交互式作图

Pandas有一个内置的.plot()函数作为DataFrame类的一部分。但是,使用此功能呈现的可视化不是交互式的,这使得它没那么吸引人。同样,使用pandas.DataFrame.plot()函数绘制图表也不能实现交互。

如果我们需要在不对代码进行重大修改的情况下用Pandas绘制交互式图表怎么办呢?这个时候就可以用Cufflinks库来实现。

Cufflinks库可以将有强大功能的plotly和拥有灵活性的pandas结合在一起,非常便于绘图。下面就来看使用Cufflinks库的方法。

import pandas as pd
#importing plotly and cufflinks in offline mode
import cufflinks as cf
import plotly.offline
cf.go_offline()
cf.set_config_file(offline=False, world_readable=True)
df.iplot()

Magic命令

Magic命令是Jupyter notebook中的一组便捷功能,旨在解决标准数据分析中的一些常见问题。使用命令%lsmagic可以看到所有的可用命令。

可以快速用Python进行数据分析的几个小技巧

Magic命令有两种:

  • 行magic命令(line magics),以单个%字符为前缀,在单行输入操作;
  • 单元magic命令(cell magics),以双%%字符为前缀,可以在多行输入操作。如果设置为1,则不用键入%即可调用Magic函数。

%matplotlib notebook

函数用于在Jupyter notebook中呈现静态matplotlib图。用notebook替换inline,可以轻松获得可缩放和可调整大小的绘图。但记得这个函数要在导入matplotlib库之前调用。

可以快速用Python进行数据分析的几个小技巧

%run

用%run函数在notebook中运行一个python脚本试试。

%run file.py
%%writefile

%% writefile是将单元格内容写入文件中。

欢迎玩家到【wan玩得好手游】查看最新变态版手游攻略,只需要在百度输入【wan玩得好手游】就可以浏览最新上线送满vip的变态手游攻略了,更多有关BT手游的攻略和资讯,敬请关注玩得好手游!

更多...

热门推荐

更多...

相关文章