本文共 854 字,大约阅读时间需要 2 分钟。
监控目录,一旦目录内增加数据,即传递到hdfs上。
#a1表示代理名称a1.sources=s1a1.sinks=k1a1.channels=c1#配置source1 监控目录是否有文件数据生成a1.sources.s1.type=spooldira1.sources.s1.spoolDir=/opt/datas/flume/TestDira1.sources.s1.channels=c1a1.sources.s1.fileHeader = falsea1.sources.s1.interceptors = i1a1.sources.s1.interceptors.i1.type = timestamp#配置sink1 将检测到的数据sink到hdfs上a1.sinks.k1.type=hdfsa1.sinks.k1.hdfs.path=hdfs://bigdata.ibeifeng.com:8020/flumea1.sinks.k1.hdfs.fileType=DataStreama1.sinks.k1.hdfs.writeFormat=TEXT#600s后hdfs上文件才没有tmp,否则有,有tmp则不能看a1.sinks.k1.hdfs.rollInterval=60a1.sinks.k1.channel=c1a1.sinks.k1.hdfs.filePrefix=%Y-%m-%d#通道是以内存方式存储#配置channel1a1.channels.c1.type=memorya1.channels.c1.capacity=10000a1.channels.c1.transactionCapacity=100
bin/flume-ng agent --name a1 --conf conf --conf-file conf/dir-sink-hdfs.properties
转载地址:http://vvygi.baihongyu.com/