NiceFlow

类似Kettle工具，主要实现数据ETL处理

未来功能

插件基类

onSuccess 功能
onError 功能
插件字段、字段注释功能
自动建表功能
batch处理和stream处理
savepoint功能

插件开发

IF组件-变量，选择不同分支 A->IF->B/C
For组件-值/变量,循环执行分支 A->For->B[获取一行记录]->执行一个子流程->B[是否执行完成]->C[执行另外一个分支]
While组件-变量，
Switch组件-值/变量，切换不同分支
Join组件，多个数据进行合并
mapping组件，字典映射

Edge属性开发

edge 类型设置

"properties":{
  "type": "copy/condition[True/False]/Execution[SUCCESS/ERROR]"
}

cli

数据探索
支持数据源配置加密/解密
支持定时执行任务
YouPlot

core

系统变量支持【全局变量、Flow变量】 1.上一步行数 2.时间变量 3.参考
支持HTTP、HDFS、COS、S3直接访问数据源
支持Git读取任务【动态读取任务】
支持数据源配置加密
插件执行异常通知【飞书、钉钉、邮件、HTTP】
支持代码中编写任务
支持日志入数据库
支持日志写到web页面
支持不用格式任务【xml,json,yaml】

集群

开发集群模式

测试

DEMO案例

问题

如何实现增量更新，哪种方式比较高效，不会出错
如何实现数据同步，同步过程中不出现问题【多数据，少数据】
-- 同步完成后查询两端数据量是否一致

数据监控如何实现，能够监控数据层面的问题
-- 任务是否停止告警
如何实现报表展示

辅助命令【基本信息探查】

查询hive文件大小/文件数目

dbs=$(hadoop fs -ls /user/hive/warehouse | awk '{print $8}')

for db in $dbs
do
echo "统计库：$db"
tables=$(hadoop fs -ls "$db" | awk '{print $8}')
for table in $tables
do
echo "统计表：$table"
size=$(hadoop fs -count -h "$table" | awk '{print $3}')
echo "表 $table 占用空间为：$size"
echo "$table,$size" >> result.csv
done
done

maxcompute 表大小/文件数目/count数目
表分区信息
表元数据信息
表创建时间/修改时间/更新时间
mysql 数据库表数目/数量/每天新增数量

plugin组件功能

task任务【retry重复执行、delay延迟执行、onSuccess、onError、process、init】

重要：plugin分type，一个plugin有多个type实现不同的功能，比如mysqlOutput插件，可以有insert类型、可以有update类型、也可以有merge功能

for循环
while循环
if判断
switch分流
串行和并行
任务执行【异步执行】
任务时间打印
自定义插件功能
数据库自动建表
自动字段类型转换【自动建表】

flow功能

增加变量
flow工作流【flow工作流参数、子流程、暂停、启动】
执行引擎【远程执行引擎、本地执行引擎、分布式执行引擎】
日志展示
日志监控，性能监控
store任务【mysql、mongo】
xml、 json加载flow、任务热加载
任务管理Rest-API 【】
新增、修改、删除、启动、停止、任务日志、任务开发
数据增量同步
保存上一次同步字段信息

概念参考

类型信息 https://www.dusaiphoto.com/article/164/
实现插件系统 https://github.com/srn-g/pypluginbase/blob/main/src/PluginManager.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

TODO.md

TODO.md

NiceFlow

未来功能

插件基类

插件开发

Edge属性开发

cli

core

集群

测试

DEMO案例

问题

辅助命令【基本信息探查】

plugin组件功能

flow功能

概念参考

Files

TODO.md

Latest commit

History

TODO.md

File metadata and controls

NiceFlow

未来功能

插件基类

插件开发

Edge属性开发

cli

core

集群

测试

DEMO案例

问题

辅助命令【基本信息探查】

plugin组件功能

flow功能

概念参考