Python自动化数据探索

软件开发大郭
0 评论
/
19 阅读
/
650 字
19 2022-12
分类:

核心功能-自动化数据探索

数据探索是数据科学项目的第一步,你需要了解数据的基本信息才能进一步分析更深的价值。

一般我们会用pandas、matplotlib等工具来探索数据,但需要自己编写大量代码,如果想提高效率,Dtale是个不错的选择。

Dtale特点是用一行代码生成自动化分析报告,它结合了Flask后端和React前端,为我们提供了一种查看和分析Pandas数据结构的简便方法。

我们可以在Jupyter上实用Dtale。

需要的第三方库:

Dtale - 自动生成分析报告

实现代码

### Importing Seaborn Library For Some Datasets
import seaborn as sns
 
### Printing Inbuilt Datasets of Seaborn Library
print(sns.get_dataset_names())
 
### Loading Titanic Dataset
df=sns.load_dataset('titanic')
 
### Importing The Library
import dtale
 
#### Generating Quick Summary
dtale.show(df)
    暂无数据