核心功能-自动化数据探索

数据探索是数据科学项目的第一步,你需要了解数据的基本信息才能进一步分析更深的价值。

一般我们会用pandas、matplotlib等工具来探索数据,但需要自己编写大量代码,如果想提高效率,Dtale是个不错的选择。

Dtale特点是用一行代码生成自动化分析报告,它结合了Flask后端和React前端,为我们提供了一种查看和分析Pandas数据结构的简便方法。

我们可以在Jupyter上实用Dtale。

需要的第三方库:

Dtale - 自动生成分析报告

实现代码



### Importing Seaborn Library For Some Datasets


import seaborn as sns


 


### Printing Inbuilt Datasets of Seaborn Library


print(sns.get_dataset_names())


 


### Loading Titanic Dataset


df=sns.load_dataset('titanic')


 


### Importing The Library


import dtale


 


#### Generating Quick Summary


dtale.show(df)