使用 Merge Into 进行数据表的增量更新
特点:如果数据存在则更新,如果不存在则插入
示例:北斗渔船位置的实时数据表
1.复制虚拟机文件
2.在VMware中分别打开三个虚拟机
3.设置NAT模式,固定IP,可上网
4.运行一下
使用flume完成数据的接收
场景:source是通过tcp发送,chnnel处理过滤字段,sink存在集群中
现在IDEA编译成功topo后,使用WinSCP将打包好的包传到主节点
注意:打包之前–要讲 [ 本地模式 ] 改为 [ 集群模式 ]
1 | //本地测试模式 |
前提是要先把flume和kafka独立的部分先搭建好。
下载插件包
下载flume-kafka-plus:https://github.com/beyondj2ee/flumeng-kafka-plugin
把lib目录下的
现在IDEA编译成功topo后,使用WinSCP将打包好的包传到主节点
注意:打包之前–要讲 [ 本地模式 ] 改为 [ 集群模式 ]
1 | //本地测试模式 |
在IDEA的maven项目中编写Topology出错:
NoClassFound找不到主类:解决–
在pom.xml中,找到
1 | kafka中的topic不新建也可以使用 |