博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
单词计数例子
阅读量:6364 次
发布时间:2019-06-23

本文共 3955 字,大约阅读时间需要 13 分钟。

学习storm,开始编写小例子

import java.io.File;

import java.io.IOException;
import java.util.Collection;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
 
import org.apache.commons.io.FileUtils;
 
import backtype.storm.Config;
import backtype.storm.LocalCluster;
import backtype.storm.spout.SpoutOutputCollector;
import backtype.storm.task.OutputCollector;
import backtype.storm.task.TopologyContext;
import backtype.storm.topology.OutputFieldsDeclarer;
import backtype.storm.topology.TopologyBuilder;
import backtype.storm.topology.base.BaseRichBolt;
import backtype.storm.topology.base.BaseRichSpout;
import backtype.storm.tuple.Fields;
import backtype.storm.tuple.Tuple;
import backtype.storm.tuple.Values;
 
 
public class WordCountTopology {
 public static class  DataSourceSpout extends BaseRichSpout{
  private Map conf;
  private TopologyContext context;
  private SpoutOutputCollector collector;
  /**
   * 此方法只调用一次
   */
  public void open(Map conf, TopologyContext context,
    SpoutOutputCollector collector) {
   this.conf = conf;
   this.collector = collector;
   this.context = context;
  }
  /**
   * 死循环调用,心跳
   */
  int i=0;
  public void nextTuple() {
   //读取指定文件目录
   Collection<File> listFiles = FileUtils.listFiles(new File("d:\\test"), new String[]{"txt"}, true);
   for(File file:listFiles){
    try {
     
     //获取每个文件的所有数据
     List<String> readLines = FileUtils.readLines(file);
     //文件被读取过以后进行重命名
     FileUtils.moveFile(file, new File(file.getAbsolutePath()+System.currentTimeMillis()));
// file.renameTo(new File(file.getAbsolutePath()+System.currentTimeMillis()));
     for (String line : readLines) {
      //把每一行数据发射出去
      this.collector.emit(new Values(line));
     }
     
    } catch (IOException e) {
     // TODO Auto-generated catch block
     e.printStackTrace();
    }
   
   }
   
   
  }
  /**
   * 声明输出内容
   */
  public void declareOutputFields(OutputFieldsDeclarer declare) {
   declare.declare(new Fields("line"));
  }
 
 }
 public static class Splitbolt extends BaseRichBolt{
  private Map stormConf;
  private TopologyContext context;
  private OutputCollector collector;
  public void prepare(Map stormConf, TopologyContext context,
    OutputCollector collector) {
   // TODO Auto-generated method stub
   this.stormConf = stormConf;
   this.context = context;
   this.collector = collector;
   
   
  }
 
  public void execute(Tuple input) {
 
   //获取每一行数据
   String line = input.getStringByField("line");
   
   //把数据切分成一个个单词
   String[] wordsStrings = line.split("\t");
   //把每个单词都发射出去
   for (String word : wordsStrings) {
    this.collector.emit(new Values(word));
   }
  }
 
  public void declareOutputFields(OutputFieldsDeclarer declarer) {
   declarer.declare(new Fields("words"));
  }
 
 
 }
 /**
  * 计算每个单词出现次数
  * @author tangyw
  *
  */
 public static class Countbolt extends BaseRichBolt{
  private Map stormConf;
  private TopologyContext context;
  private OutputCollector collector;
  public void prepare(Map stormConf, TopologyContext context,
    OutputCollector collector) {
   // TODO Auto-generated method stub
   this.stormConf = stormConf;
   this.context = context;
   this.collector = collector;
   
   
  }
  HashMap<String, Integer> hashMap = new HashMap<String, Integer>();
 
  public void execute(Tuple input) {
 
   //获取每一个单词
   String word = input.getStringByField("words");
   //对所有的单词汇总
   Integer valueInteger = hashMap.get(word);
   if (valueInteger==null) {
    valueInteger=0;
   }
   valueInteger++;
   hashMap.put(word, valueInteger);
   //把结果打印出来
   System.out.println("----------------");
   for (Entry<String, Integer> entry : hashMap.entrySet()) {
    System.out.println(entry);
   }
  }
 
  public void declareOutputFields(OutputFieldsDeclarer declarer) {
  }
 
 
 }
 public static void main(String[] args) {
  TopologyBuilder topologyBuilder = new TopologyBuilder();
  topologyBuilder.setSpout("spout_id", new DataSourceSpout());
  topologyBuilder.setBolt("bolt_id", new Splitbolt()).shuffleGrouping("spout_id");
  topologyBuilder.setBolt("bolt_id_count", new Countbolt()).shuffleGrouping("bolt_id");
 
  LocalCluster localCluster = new LocalCluster();
  localCluster.submitTopology("topology", new Config(), topologyBuilder.createTopology());
 
 
 }
}

 

转载于:https://www.cnblogs.com/tangyw/p/4728680.html

你可能感兴趣的文章
《OpenGL ES应用开发实践指南:Android卷》—— 2.7 小结
查看>>
《Windows Server 2012活动目录管理实践》——第 2 章 部署第一台域控制器2.1 案例任务...
查看>>
Java Date Time 教程-时间测量
查看>>
Selector.wakeup实现注记
查看>>
《Java EE 7精粹》—— 第1章 Java EE 1.1 简介
查看>>
《Exchange Server 2013 SP1管理实践》——导读
查看>>
syslog:类Unix系统常用的log服务
查看>>
使用Annotation设计持久层
查看>>
深入实践Spring Boot2.4.1 Neo4j依赖配置
查看>>
Zen Cart 如何添加地址栏上的小图标
查看>>
SecureCrt 连接Redhat linux
查看>>
[NHibernate]持久化类(Persistent Classes)
查看>>
安装oracle数据库提示“程序异常终止”解决方案
查看>>
如何在Hive中使用Json格式数据
查看>>
iOS开发网络篇—简单介绍ASI框架的使用
查看>>
linux如何恢复被删除的热文件
查看>>
Eclipse(MyEclipse) 自动补全
查看>>
Struts2中dispatcher与redirect的区别
查看>>
zabbix agentd configure
查看>>
[From OpenBSD Man Page]CARP
查看>>