96SEO 2026-02-20 09:36 11
commandLine.hasOption(CliFrontendOptions.HELP))

HelpFormatter();formatter.setLeftPadding(4);formatter.setWidth(80);formatter.printHelp(
pipelinePipelineExecution.ExecutionInfo
createExecutor(commandLine).run();//
resultprintExecutionInfo(result);}这里首先是初始化了一下选项,这里用到了Apache
这个工具类,可以很方便的处理命令行参数大概的步骤有3步1.定义阶段
定义要解析的命令选项,对应的每个选项就是一个Option类,Options类是Option类的一个集合2.解析阶段
通过CommandLineParser的parser方法将main方法的args参数解析,获得一个CommandLine对象3.查询阶段
就是具体使用解析后的结果,可以通过hasOption来判断是否有该选项,getOptionValue来获取选项对应的值
具体可以参考我的另外一系列文章,有详细介绍这个工具的用法超强命令行解析工具
解析了入参后就判断入参args是否是空或者是否包含-h或者–help这个选项,如果是的话就打印一下帮助信息
PipelineExecution.ExecutionInfo
createExecutor(commandLine).run();static
IllegalArgumentException(Missing
Paths.get(unparsedArgs.get(0));if
(!Files.exists(pipelineDefPath))
FileNotFoundException(String.format(Cannot
getGlobalConfig(commandLine);//
getFlinkHome(commandLine);Configuration
FlinkEnvironmentUtils.loadFlinkConfiguration(flinkHome);//
Arrays.stream(Optional.ofNullable(commandLine.getOptionValues(CliFrontendOptions.JAR)).orElse(new
String[0])).map(Paths::get).collect(Collectors.toList());//
CliExecutor(pipelineDefPath,flinkConfig,globalPipelineConfig,commandLine.hasOption(CliFrontendOptions.USE_MINI_CLUSTER),additionalJars);}可以看到最后是构建了一个CliExecutor类,并执行了它的run方法.
CLI这个类库,代码比较简单这里主要细看一下各个选项都有什么作用
org.apache.flink.cdc.cli;import
org.apache.commons.cli.Options;/**
Option.builder().longOpt(flink-home).hasArg().desc(Path
Option.builder(h).longOpt(help).desc(Display
Option.builder().longOpt(global-config).hasArg().desc(Path
Option.builder().longOpt(jar).hasArgs().desc(JARs
Option.builder().longOpt(use-mini-cluster).hasArg(false).desc(Use
Options().addOption(HELP).addOption(JAR).addOption(FLINK_HOME).addOption(GLOBAL_CONFIG).addOption(USE_MINI_CLUSTER);}
指定flink-home的地址,有了这个参数我们就可以不使用系统环境自带的FLINK_HOME,可以使用指定的flink版本
flink-cdc.yaml文件,这里面的参数很少,我看只有配置一个并发度,其他的配置没看到,这块有感兴趣的老铁可以再仔细看看
使用mini-cluster模式启动,mini-cluster相当于就是本地local模式启动,会用多个现成模拟JobManager,TaskManager,ResourceManager,Dispatcher等组件,一般用于测试
com.ververica.cdc.cli.parser.PipelineDefinitionParser;
com.ververica.cdc.cli.parser.YamlPipelineDefinitionParser;
com.ververica.cdc.cli.utils.FlinkEnvironmentUtils;
com.ververica.cdc.common.annotation.VisibleForTesting;
com.ververica.cdc.common.configuration.Configuration;
com.ververica.cdc.composer.PipelineComposer;
com.ververica.cdc.composer.PipelineExecution;
com.ververica.cdc.composer.definition.PipelineDef;import
pipelineDefPath;this.flinkConfig
flinkConfig;this.globalPipelineConfig
globalPipelineConfig;this.useMiniCluster
useMiniCluster;this.additionalJars
PipelineExecution.ExecutionInfo
YamlPipelineDefinitionParser();PipelineDef
pipelineDefinitionParser.parse(pipelineDefPath,
composer.compose(pipelineDef);//
FlinkEnvironmentUtils.createComposer(useMiniCluster,
composer;}VisibleForTestingvoid
composer;}VisibleForTestingpublic
flinkConfig;}VisibleForTestingpublic
globalPipelineConfig;}VisibleForTestingpublic
方法首先是构建了一个yaml解析器用于解析yaml配置文件然后调用parser
获得一个PipelineDef类,这相当与将yaml配置文件转换成了一个配置实体Bean,方便之后操作接下来获取到PipelineComposer对象,然后调用compose
方法传入刚刚的配置实体BeanPiplineDef对象,就获得了一个PiplineExecution对象最后调用execute方法启动任务(这个方法底层就是调用了flink
StreamExecutionEnvironment.executeAsync方法)
################################################################################
################################################################################
table.create.properties.light_schema_change:
truetable.create.properties.replication_num:
doris_sync.table_\.*sink-table:
2这个类的主要目标就是要将这个yaml文件解析成一个实体类PipelineDef方便之后的操作代码解释就直接写到注释中了
com.ververica.cdc.cli.parser;import
org.apache.flink.shaded.jackson2.com.fasterxml.jackson.core.type.TypeReference;
org.apache.flink.shaded.jackson2.com.fasterxml.jackson.databind.JsonNode;
org.apache.flink.shaded.jackson2.com.fasterxml.jackson.databind.ObjectMapper;
org.apache.flink.shaded.jackson2.com.fasterxml.jackson.dataformat.yaml.YAMLFactory;import
com.ververica.cdc.common.configuration.Configuration;
com.ververica.cdc.composer.definition.PipelineDef;
com.ververica.cdc.composer.definition.RouteDef;
com.ververica.cdc.composer.definition.SinkDef;
com.ververica.cdc.composer.definition.SourceDef;import
com.ververica.cdc.common.utils.Preconditions.checkNotNull;/**
解析的核心工具方法,可以获取yaml文件中的值,或者将其中的值转换成java实体类private
mapper.readTree(pipelineDefPath.toFile());//
toSourceDef(checkNotNull(root.get(SOURCE_KEY),
toSinkDef(checkNotNull(root.get(SINK_KEY),
这里是路由配置,是个数组,而且是个可选项,所以这里优雅的使用了Optional对root.get(ROUTE_KEY)
然后调用ifPresent方法来判断,如果参数存在的时候才会执行的逻辑,就是遍历数组然后加到
ArrayList();Optional.ofNullable(root.get(ROUTE_KEY)).ifPresent(node
routeDefs.add(toRouteDef(route))));//
参数,是可选项,这个如果不指定,配置就是用的flink-cdc中的配置Configuration
toPipelineConfig(root.get(PIPELINE_KEY));//
用户配置,这的addAll实际上就是HashMap的putAll,新值会把旧值覆盖,所以用户的配置优先级大于全局配置Configuration
Configuration();pipelineConfig.addAll(globalPipelineConfig);pipelineConfig.addAll(userPipelineConfig);//
mapper.convertValue(sourceNode,
checkNotNull(sourceMap.remove(TYPE_KEY),
Configuration.fromMap(sourceMap));}private
checkNotNull(sinkMap.remove(TYPE_KEY),Missing
sinkMap.remove(NAME_KEY);return
Configuration.fromMap(sinkMap));}private
checkNotNull(routeNode.get(ROUTE_SOURCE_TABLE_KEY),Missing
configuration,ROUTE_SOURCE_TABLE_KEY).asText();
checkNotNull(routeNode.get(ROUTE_SINK_TABLE_KEY),Missing
configuration,ROUTE_SINK_TABLE_KEY).asText();String
Optional.ofNullable(routeNode.get(ROUTE_DESCRIPTION_KEY)).map(JsonNode::asText).orElse(null);return
mapper.convertValue(pipelineConfigNode,
Configuration.fromMap(pipelineConfigMap);}
com.ververica.cdc.cli.utils;import
org.apache.flink.shaded.jackson2.com.fasterxml.jackson.core.type.TypeReference;
org.apache.flink.shaded.jackson2.com.fasterxml.jackson.databind.ObjectMapper;
org.apache.flink.shaded.jackson2.com.fasterxml.jackson.dataformat.yaml.YAMLFactory;import
com.ververica.cdc.common.configuration.Configuration;import
FileNotFoundException(String.format(Cannot
mapper.readValue(configPath.toFile(),
Configuration.fromMap(configMap);}
IllegalStateException(String.format(Failed
YAMLFactory());这行代码主要是用了Jackson库中的两个核心类,ObjectMapper和YAMLFactoryObjectMapper
库中用于序列化将对象转换为字节流或其他格式和反序列化将字节流或其他格式转换为对象的核心类。
它提供了各种方法来处理
mapper.readValue(configPath.toFile(),
{});这行的意思就是传入yaml配置文件,容纳后将其转换成一个Map类型,kv都是String因为这个类的主要用途是解析global-conf的,也就是conf目录下的flink-cdc.yaml,这个文件仅只有kv类型的,所以要转换成mapflink-cdc.yaml
EVOLVE这里再简单看一下mapper的readValue方法Jackson
ObjectMapper的readValue方法主要用途就是将配置文件转换成java实体,主要可以三个重载
这个一般不常用最后这行就是将一个map转换成Configuration对象
Configuration.fromMap(configMap);这里的Configuration就是将HashMap做了一个封装,方便操作
com.ververica.cdc.cli.utils;import
com.ververica.cdc.common.configuration.Configuration;
com.ververica.cdc.composer.flink.FlinkPipelineComposer;import
flinkHome.resolve(FLINK_CONF_DIR).resolve(FLINK_CONF_FILENAME);return
ConfigurationUtils.loadMapFormattedConfig(flinkConfPath);}public
FlinkPipelineComposer.ofMiniCluster();}return
FlinkPipelineComposer.ofRemoteCluster(org.apache.flink.configuration.Configuration.fromMap(flinkConfig.toMap()),additionalJars);}
flinkHome.resolve(FLINK_CONF_DIR).resolve(FLINK_CONF_FILENAME);return
ConfigurationUtils.loadMapFormattedConfig(flinkConfPath);}这个方法的主要目的就是通过找到FLINK_HOME/conf/flink-conf.yaml文件,然后将这个文件转换成一个Configuration对象,转换的方法在上一节中介绍过了这里还用到了Path
FlinkPipelineComposer.ofMiniCluster();}return
FlinkPipelineComposer.ofRemoteCluster(org.apache.flink.configuration.Configuration.fromMap(flinkConfig.toMap()),additionalJars);}这个是通过一些参数来初始化Composer,Composer就是将用户的任务翻译成一个Pipeline作业的核心类这里首先是判断了一下是否使用miniCluster,如果是的话就用minicluster
来指定,具体在上文中介绍过.如果不是那么就用remoteCluster,这里就不多介绍了,之后的文章会介绍
上面几个类写的比较多,这里做一个总结,简单的来总结一下这个模块flink-cdc-cli
模块的主要作用1.解析任务配置yaml文件,转换成一个PipelineDef任务实体类2.通过FLINK_HOME获取flink的相关配置信息,然后构建出一个PipelineComposer
对象3.调用composer的comoose方法,传入任务实体类获取PipelineExecution任务执行对象,然后启动任务
解析yaml文件3.加深了对Optional类判断null值的印象,之后对于null值判断有个一个更优雅的写法4.对flink-cdc-cli模块有了个全面的认识,但是具体还有些细节需要需要深入到其他模块再去了解
https://www.cnblogs.com/wangwei0721/p/14052016.html[Jackson
https://www.cnblogs.com/del88/p/13098678.html
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback