目录2
背景:数据快速入湖,分析更加智能,应用更加多样,服务更加开放4
数据湖的定义与特性6
从对比中理解数据湖概念 — 优势篇7
从对比中理解数据湖概念 — 劣势篇8
数据湖是大数据概念的延伸9
数据湖体系的架构规划11
持久层(Persitent Layer):存放所有从内部和外部获取的结构化、半结构化和非结构化数据
分析沙箱(Analytics Sandbox):数据科学家和分析师被授予持久层的访问权限并使用进行数据研究和实验
探索数据源(Curated):数据分析师会将有商业价值的数据进行处理并创建新的数据源以提供给业务分析师
可操作层(Operational layer):业务分析师继续精炼已处理过的数据,和数据管理团队一起将这些数据转换为更为容易操作和使用的数据,存放之以便得到更广泛的使用。
大数据湖体系规划15
大数据湖存储能力规划——统一标准/分区存储16
下载完整方案,转发+点赞+评论,私信获取方案。
文章引用的资料均通过互联网等公开渠道合法获取,仅作为行业交流和学习使用,并无任何商业目的。其版权归原资料作者或出版社所有,作者不对所涉及的版权问题承担任何法律责任。若版权方、出版社认为本文章侵权,请立即通知作者删除。