第2章 源数据获取

在现代的生产系统中,数据库被广泛应用于存储和管理数据,如客户订单数据、银行交易数据等。这些未经处理、直接从生产系统获取的数据库或文件数据被称为源数据。在多数情况下,源数据不能直接用于数据分析,需要额外进行抽取、转换和装载操作。本章将分别介绍数据库、Excel和CSV文件这3种常规源数据的抽取,以及生成记录、生成随机数和获取系统信息3种源数据生成的方法。

学习目标

(1)掌握数据库连接的创建方法和参数设置。

(2)熟悉抽取源数据和生成数据的常用方法。

(3)掌握常用抽取源数据和生成数据组件的参数与设置。