一套 SQL 搞定数据仓库？Flink有了新尝试

2020-03-19 08:52:21

原创李劲松(之信) 阿里技术今天

阿里妹导读：数据仓库是公司数据发展到一定规模后必然需要提供的一种基础服务，也是“数据智能”建设的基础环节。迅速获取数据反馈不仅有利于改善产品及用户体验，更有利于公司的科学决策，因此获取数据的实时性尤为重要。

目前企业的数仓建设大多是离线一套，实时一套。业务要求低延时的使用实时数仓;业务复杂的使用离线数仓。架构十分复杂，需要使用很多系统和计算框架，这就要求企业储备多方面的人才，导致人才成本较高，且出了问题难以排查，终端用户也需要熟悉多种语法。本文分析目前的数仓架构，探索离线和实时数仓是否能放在一起考虑，探索Flink的统一架构是否能解决大部分问题。

文末有福利，可下载电子书。

数仓架构

数据仓库可以分为三层：ODS(原始数据层)、DW(数据仓库层)、ADS(应用数据层)。

1. ODS (Operation Data Store) 层

从日志或者业务DB传输过来的原始数据，传统的离线数仓做法也有直接用CDC (Change Data Capture) 工具周期同步到数仓里面。用一套统一的Kafka来承接这个角色，可以让数据更实时的落入数仓，也可以在这一层统一实时和离线的。

2. DW (Data warehouse) 层

DW层一般也分为DWD层和DWS层：

DWD (Data warehouse detail) 层：明细数据层，这一层的数据应该是经过清洗的，干净的、准确的数据，它包含的信息和ODS层相同，但是它遵循数仓和数据库的标准Schema定义。

DWS (Data warehouse service) 层：汇总数据层，这一层可能经过了轻度的聚合，可能是星型或雪花模型的结构数据，这一层已经做了一些业务层的计算，用户可以基于这一层，计算出数据服务所需数据。

3. ADS (Application Data Store) 层

和DWS不同的是，这一层直接面向用户的数据服务，不需要再次计算，已经是最终需要的数据。

主要分为两条链路：

业务DB和日志 -> Kafka -> 实时数仓 (Kafka + Dim维表) -> BI DB -> 数据服务

业务DB和日志 -> Kafka -> 离线数仓 (Hive metastore + HDFS) -> BI DB -> 数据服务

主流的数仓架构仍然是Lambda架构，Lambda架构虽然复杂，但是它能覆盖业务上需要的场景，对业务来说，是最灵活的方式。

Lambda架构分为两条链路：

传统离线数据具有稳定、计算复杂、灵活的优点，运行批计算，保证T+1的报表产生和灵活的Ad-hoc查询。

实时数仓提供低延时的数据服务，传统的离线数仓往往都是T+1的延时，这导致分析人员没法做一些实时化的决策，而实时数仓整条链路的延迟最低甚至可以做到秒级，这不但加快了分析和决策，而且也给更多的业务带来了可能，比如实时化的监控报警。Flink的强项是实时计算、流计算，而Kafka是实时数仓存储的核心。

上图标出了1-9条边，每条边代表数据的转换，就是大数据的计算，本文后续将分析这些边，探索Flink在其中可以发挥的作用。

Flink一栈式计算

元数据

先说下元数据的管理，离线数仓有Hive metastore来管理元数据，但是单纯的Kafka不具备元数据管理的能力，这里推荐两种做法：

1. Confluent schema registry

搭建起schema registry服务后，通过confluent的url即可获取到表的schema信息，对于上百个字段的表，它可以省编写Flink作业时的很多事，后续Flink也正在把它的schema推断功能结合Confluent schema registry。但是它仍然省不掉创建表的过程，用户也需要填写Confluent对应的URL。

2. Catalog

目前Flink内置已提供了HiveCatalog，Kafka的表可以直接集成到Hive metastore中，用户在SQL中可以直接使用这些表。但是Kafka的start-offset一些场景需要灵活的配置，为此，Flink也正在提供 LIKE [1] 和 Table Hints [2] 等手段来解决。

Flink中离线数仓和实时数仓都使用Hive Catalog：

use catalog my_hive;

-- build streaming database and tables;

create database stream_db;

use stream_db;

create table order_table (

id long,

amount double,

user_id long,

status string,

ts timestamp,

… -- 可能还有几十个字段

ts_day string,

ts_hour string

) with (

‘connector.type’ = ‘kafka’,

… -- Kafka table相关配置

);

-- build batch database and tables;

create database batch_db;

use batch_db;

create table order_table like stream_db.order_table (excluding options)

partitioned by (ts_day, ts_hour)

with (

‘connector.type’ = ‘hive’,

… -- Hive table相关配置

);

使用Catalog，后续的计算可以完全复用批和流，提供相同的体验。

数仓导入

计算①和⑤分别是实时数仓的导入和离线数仓的导入，近来，更加实时的离线数仓导入越来越成为数据仓库的常规做法，Flink的导入可以让离线数仓的数据更实时化。

以前主要通过DataStream + StreamingFileSink的方式进行导入，但是不支持ORC和无法更新HMS。

Flink streaming integrate Hive后，提供Hive的streaming sink [3]，用SQL的方式会更方便灵活，使用SQL的内置函数和UDF，而且流和批可以复用，运行两个流计算作业。

insert into [stream_db.|batch_db.]order_table select … from log_table;

数据处理

计算②和⑥分别是实时数仓和离线数仓的中间数据处理，这里面主要有三种计算：

ETL：和数据导入一样，批流没有区别。

维表Join：维表补字段是很常见的数仓操作，离线数仓中基本都是直接Join Hive表即可，但是Streaming作业却有些不同，下文将详细描述。

Aggregation：Streaming作业在这些有状态的计算中，产生的不是一次确定的值，而可能是不断变化的值。

维表Join

与离线计算不同，离线计算只用关心某个时间点的维表数据，而Streaming的作业持续运行，所以它关注的不能只是静态数据，需要是动态的维表。

另外为了Join的效率，streaming作业往往是join一个数据库表，而不仅仅是Hive表。

例子：

-- stream 维表

use stream_db;

create table user_info (

user_id long,

age int,

address,

primary key(user_id)

) with (

‘connector.type’ = ‘jdbc’,

...

);

-- 将离线数仓的维表导入实时数仓中

insert into user_info select * from batch_db.user_info;

-- 维表Join，SQL批流复用

insert into order_with_user_age select * from order_table join user_info for system_time as of order_table.proctime on user_info.user_id = user_info.user_id;

这里有个非常麻烦的事情，那就是在实时数仓中，需要按时周期调度更新维表到实时维表数据库中，那能不能直接Join离线数仓的Hive维表呢?目前社区也正在开发Hive维表，它有哪些挑战：

Hive维表太大，放不进Cache中：

考虑Shuffle by key，分布式的维表Join，减少单并发Cache的数据量

考虑将维表数据放入State中

维表更新问题：

简单的方案是TTL过期

复杂一些的方案是实现Hive streaming source，并结合Flink的watermark机制

有状态计算和数据导出

例子：

select age, avg(amount) from order_with_user_age group by age;

一句简单的聚合SQL，它在批计算和流计算的执行模式是完全不同的。

Streaming的聚合和离线计算的聚合最大的不同在于它是一个动态表[4]，它的输出是在持续变化的。动态表的概念简单来说，一个streaming的count，它的输出是由输入来驱动的，而不是像batch一样，获取全部输入后才会输出，所以，它的结果是动态变化的：

如果在SQL内部，Flink内部的retract机制会保证SQL 的结果的与批一样。

如果是外部的存储，这给sink带来了挑战。

有状态计算后的输出：

如果sink是一个可更新的数据库，比如HBase/Redis/JDBC，那这看起来不是问题，我们只需要不断的去更新就好了。

但是如果是不可更新的存储呢，我们没有办法去更新原本的数据。为此，Flink提出了Changelog的支持[5]，想内置支持这种sink，输出特定Schema的数据，让下游消费者也能很好的work起来。

例子：

-- batch：计算完成后，一次性输出到mysql中，同key只有一个数据

-- streaming：mysql里面的数据不断更新，不断变化

insert into mysql_table select age, avg(amount) from order_with_user_age group by age;

-- batch: 同key只有一个数据，append即可

insert into hive_table select age, avg(amount) from order_with_user_age group by age;

-- streaming: kafka里面的数据不断append，并且多出一列，来表示这是upsert的消息，后续的Flink消费会自动做出机制来处理upsert

insert into kafka_table select age, avg(amount) from order_with_user_age group by age;

AD-HOC与OLAP

离线数仓可以进行计算⑨，对明细数据或者汇总数据都可以进行ad-hoc的查询，可以让数据分析师进行灵活的查询。

目前实时数仓一个比较大的缺点是不能Ad-hoc查询，因为它本身没有保存历史数据，Kafka可能可以保存3天以上的数据，但是一是存储成本高、二是查询效率也不好。

一个思路是提供OLAP数据库的批流统一Sink组件：

Druid sink

Doris sink

Clickhouse sink

HBase/Phoenix sink

总结

本文从目前的Lambda架构出发，分析了Flink一栈式数仓计算方案的能力，本文中一些Flink新功能还在快速迭代演进中，随着不断的探索和实践，希望朝着计算一体化的方向逐渐推进，将来的数仓架构希望能真正统一用户的离线和实时，提供统一的体验：

统一元数据

统一SQL开发

统一数据导入与导出

将来考虑统一存储

参考

[1]https://cwiki.apache.org/confluence/display/FLINK/FLIP-110%3A+Support+LIKE+clause+in+CREATE+TABLE

[2]https://cwiki.apache.org/confluence/display/FLINK/FLIP-113%3A+Supports+Table+Hints

[3]https://cwiki.apache.org/confluence/display/FLINK/FLIP-115%3A+Filesystem+connector+in+Table

[4]https://ci.apache.org/projects/flink/flink-docs-master/dev/table/streaming/dynamic_tables.html

[5]https://cwiki.apache.org/confluence/display/FLINK/FLIP-105%3A+Support+to+Interpret+and+Emit+Changelog+in+Flink+SQL

福利来了

从容应对生产环境中的技术难题

《Apache Flink 十大技术难点实战》

电子书免费下载

本书由 Apache Flink 核心贡献者及一线大厂生产环境使用者总结分享，内容全面丰富，涵盖原理解析、应用实践、demo演示、生产环境常见问题排查与解法、Flink 1.10 生态应用原理与实践，助力大数据开发者真正解决Flink生产应用难题!

相关新闻

日照莒县夏庄初中举办语文诗歌朗诵大赛 2021-12-20
华林证券异动上榜连续三个交易日内涨幅偏离值累计达20%的证券 2021-12-20
流金岁月发布关于接待机构投资者调研情况的公告 2021-12-20
ETF联接基金总数达286只今年新成立达到82只创历史新高 2021-12-20
今日发行新产品鹏华中证500指数增强拟任基金经理苏俊杰 2021-12-20
今日发行新产品永赢慧盈一年持有债券发起 2021-12-20
解决客户投资基金三大难题四川天府银行基金投顾业务正式上线 2021-12-20
贝壳在其官方微信公众号再次回应浑水的做空报告 2021-12-20
北交所上市公司新安洁终止创业板转板 2021-12-20
开展H股回购及退市计划的筹划论证及前期准备工作 2021-12-20
世界咖啡连锁品牌：星巴克遭遇食品安全“风波” 2021-12-20
A股市场掀起一波妖股炒作浪潮 2021-12-20
五粮液第二十五届12·18共商共建共享大会”在宜宾举行 2021-12-20
实习生代购购买迪士尼品牌商品高价格转售上海迪士尼：即刻终止合同 2021-12-20
不晚于2030年阿里巴巴实现自身运营碳中和 2021-12-20
微信不绑银行卡可以实名认证吗？要如何操作？ 2021-12-17
广汽本田型格什么时候上市？ 2021-12-17
购房小知识：二手房最佳房龄是多少？ 2021-12-17
励普教育：北京市财政局发布CPA、初中级会计与职称对应新规 2021-12-17
如果十几年前贷款没还怎么办?会有哪些后果？ 2021-12-17
携程金融去消费有支付码吗？为什么用不了？ 2021-12-17
省钱小知识：哪家银行定期存款利率高呢？ 2021-12-17
自由职业不交税有人查吗？有什么后果？ 2021-12-17
为什么360借条突然不能借了？贷款的条件是什么？ 2021-12-17
欠了信用社10万被信用社起诉了要怎么办？要不要坐牢？ 2021-12-17
建行快贷需要什么条件？ 2021-12-17
越来越多的苹果产业链公司在谋求上市 2021-12-17
紫光集团是否资不抵债？ 2021-12-17
汉废帝刘贺为什么只做了27天皇上？ 2021-12-17
流传至今的马勺文化的独特魅力 2021-12-17
楚庄王绝缨主要讲的是什么故事？ 2021-12-17
励普教育提醒：3地可领二建证书 1地证书还未制作 2021-12-17
《小敏家》：“言有尽而意无穷”的空间里是人生况味的共情 2021-12-17
爱奇艺被爆大规模裁员引发公众热议 2021-12-17
《带你去见我妈》正式宣布定档明年1月7日 2021-12-17
将要来的是义务教育课程改革 2021-12-17
大学这张商业行为不能想打就打 2021-12-17
电竞行业人才缺口大电竞专业究竟教什么学什么 2021-12-17
枫叶教育共实现营收人民币21.51亿元 2021-12-17
OPPO、荣耀发新手机小米市场份额或将进一步受压 2021-12-17
影视IP精品有声剧备受追捧 2021-12-17
珍酒系列产品价格体系进行调整 2021-12-17
万科内部发文宣布上海区域公司组织架构及人事调整 2021-12-17
服贸会经落下帷幕大金融机构畅谈服贸会收获 2021-12-17
有信心有能力继续保持货币信贷合理增长 2021-12-17
居然之家：业绩承诺延时规避对赌难关 2021-12-17
通州区市场监督管理局对餐饮食品安全大检查进行通报 2021-12-17
曹操出行探路2.0版本似乎是曹操出行引进网约车背景专业依据 2021-12-17
春节吃猪肉、灌腊肠不可缺少的“年味儿”市场上猪肉供应情况怎么样呢？ 2021-12-17
美联储15日的决议没让市场失望 2021-12-17
足疗按摩与观影掀起“影院式足道”的风潮 2021-12-17
义务教育阶段之外高中阶段和学前阶段教育工作同样备受关注 2021-12-17
信用卡业务营销风险管控资金流向将迎来统一规范管理 2021-12-17
回盛生物什么时候发债？该公司主营业务是什么? 2021-12-16
中国银行有哪些方法信用卡积分兑换？ 2021-12-16
微信零钱转银行卡要多少手续费呢？ 2021-12-16
贷款已经还清了为什么还在扣款呢？ 2021-12-16
选择生命人寿保险怎么样？ 2021-12-16
贷款小知识：小贷让提前线下还款怎么回事呢？ 2021-12-16
邮政无界卡是白金卡吗?是什么等级的? 2021-12-16
如何注销小鹅花钱呢？要何操作？ 2021-12-16
历史上的王绩是哪个朝代的诗人？他的作品有什么？ 2021-12-16
历史上同治皇帝是怎么死的呢？ 2021-12-16
支付宝的余额不能用的是怎么回事？ 2021-12-16
银行申请信用卡或者贷款为什么纯白户老是被拒？ 2021-12-16
孩子心情不好要怎么去开导？ 2021-12-16
知者不惑仁者不忧勇者不惧是出自哪里？ 2021-12-16
气温骤然降低面肌痉挛患者勿用冷水洗脸 2021-12-16
术中实时测量股骨远端与胫骨平台的截骨角度 2021-12-16
青岛市科技局印发《青岛市科学技术局园区培育计划项目管理办法》 2021-12-16
逐年测算入园需求普惠园布局三年一调整 2021-12-16
物联网等科技“走进”农田，让智慧农业成为新时代的发展方向 2021-12-16
数字驱动·智领未来”为主题的中小企业数字化转型论坛在京举办 2021-12-16
实现政务服务“秒批”“秒办”推行“极简审批”模式 2021-12-16
加强教育APP管理推动与“双减”政策衔接提出明确要求 2021-12-16
如何有效减轻家长实际困难促进学生健康成长与个性发展？ 2021-12-16
一张美术与设计学类高考试卷是如何评分的? 2021-12-16
以‘双减’政策下的学校教育创新”为题在广州奥林匹克中学车陂路校区开幕 2021-12-16
华东师范大学闵行校区绿色化学材料大楼项目正式开工 2021-12-16
义务教育阶段实施德智体美劳“五育并举” 也是“办人民满意的教育”民生关切 2021-12-16
植发市场长坡厚雪未来有望高度繁荣 2021-12-16
受18部委印发“十四五”时期“无废城市”影响A股环保板块拉升走高 2021-12-16
美联储公布利率决议后美股走高 2021-12-16
受军工领域探索接入元宇宙场景建模仿真方法消息影响元宇宙概念股继续活跃 2021-12-16
北京地铁开设的便利店开始试营业地铁便利店陆续“下水” 2021-12-16
知网的论文版权风波仍在发酵 2021-12-16
针对社会高度关注泛娱乐化网络短视频内容审核标准新修 2021-12-16
土耳其里拉一再暴跌金融机构已经不抱希望 2021-12-16
年关将至啤酒销售进入淡季行业依然热度不减 2021-12-16
央行新一期公开市场操作如期而至 2021-12-16
我国国民经济正继续恢复实体经济稳中有升 2021-12-16
北京“金科新区”慢行系统建设等综合治理急需跟进 2021-12-16
公积金贷款能便宜多少利息？能不能省钱？ 2021-12-15
没贷款却常常接到催款电话是怎么回事？这种情况是否需要还款？ 2021-12-15
工资卡没激活可以打钱吗？工资卡要怎么激活? 2021-12-15
怎样才能查到信用卡逾期记录？有什么办法吗？ 2021-12-15
银行分期能不能一次性还款？要支付多少手续费？ 2021-12-15
私家车一般买哪些保险最划算? 2021-12-15
个人没有信用记录可以贷款吗难度大吗? 2021-12-15
放款前刷了4万信用卡有关系吗？会影响放款吗？ 2021-12-15

热搜榜

财经

更多>

科技