5分钟从零构建第一个 Flink 运用(2)_12图资源库

您好，欢迎来到12图资源库！分享精神，快乐你我！我们只是素材的搬运工！！

设为首页 | 收藏本站 | 网站地图 | TAG标签|站长交流|留言

|

|

|

|

|

|

|

|

|

|

|

|

|

当前位置：首页 > 开发 > WEB开发 >

5分钟从零构建第一个 Flink 运用(2)

时间：2018-11-08 21:03 来源：网络整理作者：网络浏览：次收藏挑错推荐打印

这创立了一个字符串类型的 DataStream。DataStream 是 Flink 中做流处置的中心 API，下面定义了十分多常见的操作(如，过滤、转换、聚合、窗口、关联等)。在本示例中，我们感兴味的是每个单词在特定时间窗口中出现的次数，比如说5秒窗口。为此，我们首先要将字符串数据解析成单词和次数(运用Tuple2表示)，第一个字段是单词，第二个字段是次数，次数初始值都设置成了1。我们完成了一个 flatmap 来做解析的任务，由于一行数据中能够有多个单词。

DataStream<Tuple2<String, Integer>> wordCounts = text

.flatMap(new FlatMapFunction<String, Tuple2<String, Integer>>() {

@Override

public void flatMap(String value, Collector<Tuple2<String, Integer>> out) {

for (String word : value.split("\\s")) {

out.collect(Tuple2.of(word, 1));

}

}

});

接着我们将数据流按照单词字段(即0号索引字段)做分组，这里可以复杂地运用 keyBy(int index) 办法，失掉一个以单词为 key 的Tuple2数据流。然后我们可以在流上指定想要的窗口，并依据窗口中的数据计算结果。在我们的例子中，我们想要每5秒聚合一次单词数，每个窗口都是从零末尾统计的。

DataStream<Tuple2<String, Integer>> windowCounts = wordCounts

.keyBy(0)

.timeWindow(Time.seconds(5))

.sum(1);

第二个调用的 .timeWindow() 指定我们想要5秒的翻腾窗口(Tumble)。第三个调用为每个key每个窗口指定了sum聚合函数，在我们的例子中是按照次数字段(即1号索引字段)相加。失掉的结果数据流，将每5秒输入一次这5秒内每个单词出现的次数。

最后一件事就是将数据流打印到控制台，并末尾执行：

windowCounts.print().setParallelism(1);

env.execute("Socket Window WordCount");

最后的 env.execute 调用是启动实践Flink作业所必需的。一切算子操作(例如创立源、聚合、打印)只是构建了外部算子操作的图形。只要在execute()被调用时才会在提交到集群上或本地计算机上执行。

下面是残缺的代码，部分代码经过简化(代码在 GitHub 上也能拜访到)：

package myflink;

import org.apache.flink.api.common.functions.FlatMapFunction;

import org.apache.flink.api.java.tuple.Tuple2;

import org.apache.flink.streaming.api.datastream.DataStream;

import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

import org.apache.flink.streaming.api.windowing.time.Time;

import org.apache.flink.util.Collector;

public class SocketWindowWordCount {

public static void main(String[] args) throws Exception {

// 创立 execution environment

final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

// 经过衔接 socket 获取输入数据，这里衔接到本地9000端口，假设9000端口已被占用，请换一个端口

DataStream<String> text = env.socketTextStream("localhost", 9000, "\n");

// 解析数据，按 word 分组，开窗，聚合

DataStream<Tuple2<String, Integer>> windowCounts = text

.flatMap(new FlatMapFunction<String, Tuple2<String, Integer>>() {

@Override

(责任编辑：admin)

标签：12图资源库程序环境 flink

从零末尾了解Docker

甲骨文谷歌版权之战，你最常用的软件或许被

微软发布 Visual Studio 开展路途图，少量

科技行业薪酬最高的15种职位看看你在哪一

StackOverflow 调查：富有国度盛行 Python

WebAssembly 再添一员猛将：将支持运用 Go

Java案虽已尘埃落定，但软件界的连锁反响才

倾听顺序员的心声真的很重要

Git 12岁了，为你送上12个Git 的运用技巧！

扎克伯格13年前写的Facebook网站代码，你见

颜值、才华和教育很重要，顺序员择偶不在乎

优秀的开发习气，我有几点小建议

猜你也喜欢看这些 ······: [WEB开发] 微软 GitHub 发布 Android Beta; [WEB开发] Kotlin 1.4 和未来值得等候的中; [WEB开发] 2019年这些美国公司为软件工程师; [WEB开发] 290家公司都在用的义务调度系统; [WEB开发] Paxos算法为什么说是Raft,Zab协; [WEB开发] JetBrains推出编程字体Mono：更; [WEB开发] SQL优化技巧总结，及案例剖析; [WEB开发] 很可怕！NSA、GitHub 被恶搞：Wi; [WEB开发] 少儿编程，编不动了？; [WEB开发] 清华博士一作，165页论文破解困; [WEB开发] GraphQL vs REST API 架构，谁更; [WEB开发] 内存用量1/20，速度加快80倍，QQ

其他类型的网站教程 ······: [SEO教程] 斗鱼tv阿怡直播代打视频再爆铁证; [HTML教程] Get Informed About Hvac By Usi; [PHP教程] Ostatni przekaz dzisiaj panie; [JSON教程] Fakt nazwa skrupulatnego prze&; [JS教程] “6;wie&0;e notki po pierw; [JSON教程] Garden The Organic and natural; [FLASH教程] oryginalna viagra cena; [SEO教程] Helpful Advice For That Soccer; [JS教程] Protecting Your State Of Healt; [dede教程] Co ustosunkowana pope&#322; [FLASH教程] Adore Hockey But Will need Tip; [网页设计] Bezstronni rysunek na ciele pr

关键词标签查找 ······: 站长之家网站优化网站源码网页特效下载矢量图片素材 dedecms 全国地图热点字体矢量素材地方门户网站地图生成器蚂蚁分类系统齐博3.5 安卓网站源码红旗安乐业房产源码齐博分类1.51 栏目嵌套顶部公告特效导航竖列菜单 128x128png图标 dede插件汽车源码站长工具箱

友情链接：(申请) 站长之家

我们一直在努力，您的认可是我们的动力: 02月24日优化PNG图标搜索功能; 05月28日更新3个实用工具www.12too.com/tool; 06月23日更新整站样式; ...

关于我们 | 版权声明 | 广告服务 | 联系我们 | 常见问题 | 网站地图 | 网友投稿 | 在线留言

分享精神，快乐你我！努力付出了，就会有回报！！

Copyright © 2013-2019 12TOO.COM. 12图资源库版权所有

鲁ICP备20005449