A.利用ETL工具将分布的、异构数据源中的数据,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中
B.利用日志采集工具把实时采集的数据作为流计算系统的输入,进行实时处理分析
C.利用网页爬虫程序到互联网网站中爬取数据
D.对分析结果进行可视化呈现,帮助人们更好地理解数据、分析数据
A.基本元数据包括日志文件和简历执行处理的时序调度信息
B.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息
C.基本元数据包括与企业相关的管理方面的数据和信息
D.基本元数据与数据源、数据仓库、数据集市和应用程序等结构相关的信息
A.Thrift,Avro,Syslog,Kafka等数据源上收集数据
B.本地文件数据采集
C.应用系统产生的日志采集
D.大量数据的实时数据采集
A.业务数据源系统
B.人行征信系统
C.信贷系统
D.征信报数系统