-
Notifications
You must be signed in to change notification settings - Fork 2.5k
Otter扩展性
agapple edited this page Sep 26, 2013
·
4 revisions
按照实现不同,可分为两类:
- 数据处理自定义,比如Extract , Transform的数据处理. 目前Select/Load不支持数据自定义处理
- 组件功能性扩展,比如支持oracle日志获取,支持hbase数据输出等.
Extract模块:
- EventProcessor : 自定义数据处理,可以改变一条变更数据的任意内容
- FileResolver : 解决数据和文件的关联关系
目前两者都只支持java语言编写,但都支持运行时动态编译&lib包载入的功能。
- 通过Otter Manager直接发布source文件代码,然后推送到node节点上即时生效,不需要重启任何java进程,有点动态语言的味道
- 可以将class文件放置到extend目录或者打成jar包,放置在node启动classpath中,也可以通过Otter Manager指定类名的方式进行加载,这样允许业务完全自定义。(但有个缺点,如果使用了一些外部包加入到node classpath中,比如远程接口调用,目前EventProcessor的调用是串行处理,针对串行进行远程调用执行,效率会比较差. )
EventProcessor接口示例:
/** * 业务自定义处理过程 * * @author jianghang 2012-6-25 下午02:26:36 * @version 4.1.0 */ public interface EventProcessor {/** * 自定义处理单条EventData对象 * * @return {@link EventData} 返回值=null,需要忽略该条数据 */ public EventData process(EventData eventData);
}
依赖配置:
<dependency> <groupId>com.alibaba.otter</groupId> <artifactId>shared.etl</artifactId> <version>x.y.z</version> </dependency> <dependency> <groupId>com.alibaba.otter</groupId> <artifactId>node.extend</artifactId> <version>x.y.z</version> </dependency>a. 创建mvn标准工程
mvn archetype:create -DgroupId=com.alibaba.otter -DartifactId=node.codeb. 修改pom.xml,添加依赖
c. mvn eclipse:eclipse导入工程
d. 代码开发完成后,使用的有两种选择:1. manager上选择source,直接粘帖源码 . 2. 将该代码打成jar包,放到node工程的lib目录下,在manager上选择clazz后,写上对应的类名即可
a. 下载otter源码包, https://github.com/alibaba/otter
b. 导入工程.
mvn clean eclipse:eclipse install -Dmaven.test.skipc. 代码开发完成后,使用的有两种选择:1. manager上选择source,直接粘帖源码 . 2. 整个otter编译打包,发布后,在manager上选择clazz后,写上对应的类名即可
- EventProcessor扩展:TestEventProcessor
- FileResolver扩展:TestFileResolver
目前这块扩展性机制不够,设计时只预留了接口,但新增一个功能实现,需要通过硬编码的方式去进行,下载otter的源码,增加功能支持,修改spring配置,同时修改web页面,方便使用。
基于manager的灵活扩展性的实现,暂没有想到很好的办法,如果你有好的思路和实现方式,也可以告知我们,谢谢。
比如举增加hbase load实现为例,需要扩展的内容:
- 增加hbase数据源的抽象
- 增加hbase表的抽象,比如column,columnFamily
- 增加hbase transform的实现
- 增加hbase loader的实现