天天实时:大数据Flink进阶(二):数据架构的演变
数据架构的演变
近年来随着越来越多的大数据技术被开源,例如:HDFS、Spark等,伴随这些技术的发展与普及, 促使企业数据架构的演进——从传统的关系型数据存储架构逐步演化为分布式处理和存储的架构。我们通过数据架构的演变角度来了解下为什么今天Flink实时计算引擎会爆火起来。
一、业务处理-单体架构
传统单体架构最大的特点是集中式数据存储,一个企业中可能有很多业务系统,例如:订单系统、CRM系统、ERP系统等,这些系统的数据一般存储在关系型数据库中,这些存储的数据一般反应当前的业务状态,也就是存储的是支撑业务正常运转的事务数据,例如:系统订单交易量、网站活跃用户数、每个用户在线的状态等,针对这些数据库的操作也主要是增删改查操作,单体架构如下:
(资料图片仅供参考)
单体架构初期的效率很高,但是随着时间的推移,业务越来越多,业务系统逐渐变得庞大,越来越难维护与升级,并且不同的业务系统之间可能有一些共同的业务模块,并且一单业务系统依赖的数据库有问题会导致整个业务系统变的不可用,为了解决以上问题,企业开始逐渐采用微服务架构作为企业业务系统的架构体系。
二、业务处理-微服务架构
微服务架构的核心思想是一个应用由多个小的、相互独立的微服务组成,这些服务运行在自己的进程中,开发和发布都没有依赖,不同的服务能依据不同的业务需求,构建不同的技术架构之上,组成不同的业务系统应用。
微服务架构将系统拆解成不同独立的服务模块,每个模块分别使用各自独立的数据库,这种模式解决了业务系统的扩展问题,也带来了新的问题——业务交易数据过于分散在不同的系统中,很难将数据进行集中化管理。微服务架构如下:
无论是单体架构还是微服务架构主要针对的还是企业的业务系统,也就是业务平台,对应的数据库存储的数据也是增删改查的事务型数据,这些业务系统上主要进行的也是OLTP业务操作,对于企业内部进行数据分析(OLAP分析)或者数据挖掘之类的应用,则需要通过从不同的数据库中进行数据抽取,将数据从不同的数据库中进行周期性同步到数据仓库中,然后在数据仓库中进行统一规范的清洗分析处理,最终结果提供给不同的数据集市和应用。
三、数据分析-大数据Lambda架构
最初很多公司构建分析系统对应的数据仓库都是基于关系型数据库之上,例如:MySQL、Oracle数据库,但是随着企业数据量的增长,关系型数据库已经无法支撑海量数据集的存储与分析,这时随着大数据相关技术的兴起,很多企业基于大数据相关技术构建数据分析对应的数据仓库,例如: Hadoop中的HDFS 、Hive。
基于大数据平台构建数据仓库的过程,数据往往都是周期性的从业务系统中同步到大数据平台,完成一系列ETL转换操作后,最终形成报表数据提供给数据集市展示使用,这就是通常我们说的离线数据分析。但是对于一些实时性要求比较高的应用,例如:实时报表系统,则必须有非常低的延时展示统计结果,这就是我们说的实时数据分析。企业中这个时期采用Lambda架构来处理离线数据和实时数据的分析,大数据Lambda架构如下:
Lambda架构在一定程度上解决了不同计算场景问题,但是带来的问题是框架太多导致平台复杂度过高、运维成本高,例如,在这个时期要完成离线计算需要使用Hive、MapReduce离线计算框架,完成实时计算需要使用Storm实时计算框架,对相应的开发和维度带来很高的成本。
后来随着Apache Spark分布式计算框架的出现,Spark可以处理离线数据,同时可以将实时数据作为微批处理来应对实时处理场景,总之,Spark可以让Lambda架构使用一套计算框架完成批处理和实时处理计算,但是Spark本身是基于批数据处理模式处理流式数据,并不能完美高效的处理实时要求非常高的场景。
关于大数据分析架构演变过程中在大数据中除了有Lambda架构之外,还有Kappa架构、混合架构及湖仓一体架构,以上各个架构都是在大数据不同时期针对公司业务数据分析场景提出的,都是解决企业数据分析过程中业务痛点问题的架构。
四、有状态流计算架构
Lambda架构中针对实时数据处理我们可以使用Spark计算框架进行分析,Spark针对实时数据进行分析本质是将实时流数据看成微批进行处理,数据产生的本质是一条条真实的事件,这种处理实际上针对实时流事件分析有一定的延迟,很难在实时计算过程中进行实时计算并直接产生统计结果,因为这需要计算框架满足高性能、高吞吐、低延时等目标。随着有状态流计算架构的提出,从一定程度上满足了企业对实时流数据处理的高性能、高吞吐、低延时目标,企业可以基于实时的流式数据,维护所有计算过程的状态,所谓状态就是计算过程中产生的中间计算结果,每次计算新的数据进入到流式系统中都是基于中间状态结果的基础上进行运算,最终产生正确的统计结果。
基于有状态计算的方式最大的优势是不需要将原始数据重新从外部存储中拿出来,从而进行全量计算,因为这种计算方式的代价可能是非常高的。从另一个角度讲,用户无须通过调度和协调各种批量计算工具,从数据仓库中获取数据统计结果,然后再落地存储,这些操作全部都可以基于流式计算完成,可以极大地减轻系统对其他框架的依赖,减少数据计算过程中的时间损耗以及硬件存储。有状态计算架构如下:
可以看出有状态流计算架构将会逐步成为企业作为构建数据平台的架构模式,Apache Flink 就是有状态的流计算架构,通过实现Google Dataflow流式计算模型实现了高吞吐、低延迟、高性能兼具的实时流式计算框架,同时Flink支持高度容错的状态管理,防止状态在计算过程中因为系统异常而 出现数据丢失,Flink周期性地通过分布式快照技术Checkpoints实现状态的持久化维护,即使在系统停机或者异常情况下都能正确的计算出来结果。
标签:
推荐文章
- 天天实时:大数据Flink进阶(二):数据架构的演变
- 全球快资讯:南非约翰内斯堡大学举办中医推广活动
- 环球热点!关正杰经典歌曲咏梅_关正杰经典歌曲
- 天天通讯!“打残孩子手,留着恶心”老师在班级群里的建议是恨铁不成钢吗?
- 视点!奔驰“大降价”!大7座SUV,从30万降至22.28万,还要啥CRV?
- 新动态:cc霜的作用与功效_cc霜的作用
- 环球快资讯丨玉米行情:陈化稻谷拍卖延期,盘面震荡走强!
- 天天热议:龙岩新型冠状病毒肺炎疫情:3月17日龙岩疫情最新消息今天数据统计情况通报
- 天天微头条丨伊朗最高国家安全委员会秘书将于下周访问伊拉克
- 精选!仙剑奇侠传4结局分析详解_仙剑奇侠传4结局
- 天天百事通!人教版五年级下册第二单元测试卷_部编版五年级语文上册第二单元测试卷
- 天天观察:成都武侯区社保缴费标准基数及比例2023年一览表 成都武侯区社保缴纳比例表2022-2023年
- 【快播报】水电上网持续走弱 市场交易获强力支撑——四川电力市场 2023年第11周盘点
- 全球速递!梦幻西游:暴力3攻队超级家族,8回合赢珍宝阁,10回合赢曲阜!
- 当前时讯:国金证券(600109):3月16日北向资金增持182.98万股
- 当前动态:2019年个人所得税税率表附加费用_2019年新个人所得税税率表
- 每日热议!德必集团回复股东质询函,向金旅德必继续提供借款具有必要性
- 精选!基于800V架构打造 起亚EV9官图正式发布
- 【全球速看料】垒知集团:中信建投、健顺投资等多家机构于3月14日调研我司
- 每日快看:哈尔滨市红十字中心医院将举办世界唐氏综合征日义诊咨询活动
- 今日讯!韩泰轮胎工厂起火 40万条轮胎烧毁 人员受伤 损失惨重!
- 热推荐:印度历史悠久,语言文字众多,而近代主要的语文演进是怎样的?
- 当前观点:梅州新型冠状病毒肺炎疫情:3月16日梅州疫情最新消息今天数据统计情况通报
- 天天动态:人教版六年级数学教学计划第一学期_小学六年级数学教学计划第一学期
- 【环球快播报】手机号码估价网移动版_手机号码估价网
- 动态焦点:气愤!小 S 被扒帮韩国偷文化,祥云、故宫图腾成了传统韩服元素
- 天天微资讯!什么是品种法特点及使用范围_什么是品种法其特点有哪些
- 全球热资讯!英国猎迷反潜机_关于英国猎迷反潜机的简介
- 世界动态:烟雨江湖田鹏武学搭配_烟雨江湖田鹏身世攻略
- 【环球热闻】2022年十大汽车质量新闻 盘点2022年国内汽车召回
- 【世界独家】“旅游+”拉动休闲度假需求(消费视窗·聚焦消费新场景)
- 全球快消息!小缇娜的奇幻之地兑换码
- 热议:横纹斜鳞蛇多少度会被冻死_横纹斜鳞蛇
- 每日资讯:qq闹钟电脑版_qq闹钟
- 全球微动态丨今起全国法院电子送达文书可在线核验
- 每日速递:张家界武陵源区军地坪街道:开展“戒烟宣传进村入户”活动
- 全球播报:新华指数|终端需求改善有限 天然橡胶价格小幅回落
- 当前焦点!美国公示“丫丫”“乐乐”回国申请,公示期31天
- 【环球新视野】厂家直供检测甲烷气体探测器的甲烷气体分析仪检测设备,非探测器产品
- 【世界播资讯】废水零排放技术解决煤化工废水污染环境问题
- 头条焦点:中超联赛赛程表最新时间表(中超联赛赛程)
- 环球动态:以字是什么结构部首(以字是什么结构)
- 每日看点!2023厦门马拉松参赛号码查询指南(附查询入口)
- 环球快资讯:同城淘宝店怎么补单(同城淘宝)
- 【天天报资讯】手游梦三国马超出装(梦三国马超出装)
- 世界今头条!眼镜镜片的选择_眼镜镜片的选择重要吗
- 快报:津腔评韵沪上唱响爱国情怀
- 环球观速讯丨3月13日-3月19日,杨浦这些点位能接种疫苗!老年人接种疫苗热点问题解答
- 天天即时:s7冠军是谁哪个国家的(s7冠军是谁)
- 【世界报资讯】“护士兼职摆摊两周赚1万5”火上热搜,这届年轻人为何热衷摆摊?
- 环球通讯!数字遥测_关于数字遥测简介
- 实时:手机怎么看dwg文件_dwg手机怎么打开
- 焦点滚动:12年的坚持 日本摄影家用镜头记录真实的福岛
- 世界今头条!广西实领建材有限公司
最新资讯
- 环球通讯!个人独资企业个人所得税税率最新(个人独资企业个人所得税税率)
- 【世界新视野】棷
- 世界快报:鼠标右键设置的软件_鼠标右键设置
- 环球时讯:泰拉瑞亚不出圣骑士_泰拉瑞亚圣骑士出现条件
- 环球快消息!深信服:可转债发行引来两次问询,募投项目前景如何?
- 每日速看!台军“叛逃”大陆,理由很奇葩,台湾军方不敢承认
- 天天微头条丨apec2014
- 资讯推荐:159代餐粉怎么吃_159代餐长期使用的危害
- 【环球报资讯】意媒:如果小因扎吉离任,国米将考虑聘请尤里奇或与巴黎竞争莫塔
- 环球实时:脸胖的男生适合什么发型不烫发_脸胖的男生适合什么发型
- 世界要闻:虾能不能和红薯一起吃吗 虾和红薯适合同吃吗
- 微资讯!董明珠:“五险一金”应该统一标准,不能以工资高低来定
- 速讯:步步高点读机t600怎么下资料_步步高点读机t600
- 世界快播:西安儿童画展里,满屏的色情和性暗示……
- 世界百事通!英国动画奖_关于英国动画奖的简介
- 今日快讯:大话西游2召唤兽大全_大话西游2召唤兽模拟加点
- 当前速读:如何用ps去水印_如何用ps去水印
- 世界视点!法拉第未来2022年净亏5.5亿美元,FF 91或本月投产
- 世界信息:曼联本赛季利用快攻打进12球,是五大联赛各项赛事最多的球队
- 全球观热点:基因的显性效应_基因的显形效应
- 前沿热点:工伤保险基数越高越好吗(工伤保险基数)
- 环球微头条丨杨舒_说一说杨舒的简介
- 每日头条!铁血武工队传奇全集下载_铁血武工队传奇第二部全集
- 新动态:【TIKI赛后】合理的策略和高压逼抢帮助米兰闯进欧冠八强
- 环球速递!鲁媒:泰山队备战提速莫伊塞斯、克雷桑将归队,多小将外租练级
- 全球热点!共进股份:闻远通信在研产品中并无直接VR产品
- 当前报道:001225基金今天净值多少_001225基金今天净值
- 环球热点!【机构关注】3月8日机构评级调高的个股
- 即时看!合肥北二环西延初步效果图公开
- 天天亮点!手机流量不能用是怎么回事华为_手机流量不能用是怎么回事
- 焦点报道:网站被管理员暂停访问_你被禁止访问这个网站请联系网站管理员
- 环球播报:佛山医保个人账户余额怎么查看 线上线下查询方法
- 关注:线差什么意思_线差是什么意思
- 世界观天下!北京周边度假村_6个必去度假村介绍
- 天天快播:空乘招聘排队7小时面试3分钟是什么情况
- 天天最资讯丨池昌旭参加过哪些综艺节目
- 环球即时看!云南烟草国际有限公司开展“三•八”妇女节活动
- 热资讯!施工占道丨马练营路与经北街3月10日起东、西半幅分段施工
- 世界速讯:气缸的工作原理是什么
- 全球热资讯!你拍一我拍一儿歌歌词_你拍一我拍一儿歌歌词是什么
- 世界新消息丨杨新民
- 环球热讯:新县苏河派出所:热心救助走失老人获赞
- 即时焦点:【竞价寻龙】08日竞价成交量暴涨股抢先看
- 天天百事通!端午节当天做什么
- 热推荐:星雅西南通用航空 成都有限公司_对于星雅西南通用航空 成都有限公司简单介绍
- 天天最资讯丨高铁都能刷身份证吗_高铁可以刷身份证吗
- 天天快消息!310002是哪个银行的帐号_什么是支付宝帐号
- 【时快讯】海南2023年安排204个重点项目?含免税城、大悦城、万象城等
- 当前关注:指甲油十大品牌排行榜 指甲油品牌排行榜前十名
- 全球微头条丨现代汽车在美国召回26169辆2012-2013年飞思汽车