标签：转载 - 程序萌部落

网站域名到底加不加 WWW

Z.TIAN

2019年8月3日

大约1.7k字

阅读需10分钟

本文系【转载】，感谢作者的总结！
原作地址：知乎日报
原文作者：Rio
转载文本请注明出处和原作出处，下文不保证百分百正确性和完整性，请酌情参考

阅读全文

Spark图计算及GraphX简单入门

Z.TIAN

2018年4月28日

大约3.6k字

阅读需16分钟

GraphX介绍

GraphX应用背景

Spark GraphX是一个分布式图处理框架，它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口，极大的方便了对分布式图处理的需求。

阅读全文

NameNode HA：如何防止集群脑裂现象

Z.TIAN

2018年3月11日

大约1.9k字

阅读需11分钟

转自：http://www.cnblogs.com/shenh062326/p/3870219.html
作者：南国故人

社区hadoop2.2.0 release版本开始支持NameNode的HA，本文将详细描述NameNode HA内部的设计与实现。

阅读全文

Hadoop常用命令

Z.TIAN

2017年4月25日

大约3.2k字

阅读需17分钟

启动Hadoop
    进入HADOOP_HOME目录。
    执行sh bin/start-all.sh
关闭Hadoop
    进入HADOOP_HOME目录。
    执行sh bin/stop-all.sh

阅读全文

Kafka的应用场景

Z.TIAN

2017年3月11日

大约1.1k字

阅读需7分钟

Kafka的应用场景

1 消息队列

比起大多数的消息系统来说，Kafka有更好的吞吐量，内置的分区，冗余及容错性，这让Kafka成为了一个很好的大规模消息处理应用的解决方案。消息系统一般吞吐量相对较低，但是需要更小的端到端延时，并尝尝依赖于Kafka提供的强大的持久性保障。在这个领域，Kafka足以媲美传统消息系统，如ActiveMR或RabbitMQ。

阅读全文

Flume、Kafka、Storm如何结合使用

Z.TIAN

2017年3月2日

大约877字

阅读需7分钟

原理

如何仔细阅读过关于Flume、Kafka、Storm的介绍，就会知道，在他们各自之间对外交互发送消息的原理。
在后面的例子中，主要对Flume的sink进行重构，调用kafka的消费生产者(producer)发送消息;在Storm的spout中继承IRichSpout接口，调用kafka的消息消费者(Consumer)来接收消息，然后经过几个自定义的Bolt，将自定义的内容进行输出。

阅读全文

kafka的使用

Z.TIAN

2017年2月22日

大约4.7k字

阅读需21分钟

kafka的使用

Kafka是一个消息系统，原本开发自LinkedIn，用作LinkedIn的活动流（Activity Stream）和运营数据处理管道（Pipeline）的基础活动流数据是几乎所有站点在对其网站使用情况做报表时都要用到的数据中最常规的部分。活动数据包括页面访问量（PageView）、被查看内容方面的信息以及搜索情况等内容。这种数据通常的处理方式是先把各种活动以日志的形式写入某种文件，然后周期性地对这些文件进行统计分析。运营数据指的是服务器的性能数据（CPU、IO使用率、请求时间、服务日志等等数据)。运营数据的统计方法种类繁多。

阅读全文

kettle相关知识

Z.TIAN

2017年2月16日

大约1.4k字

阅读需9分钟

GraphX介绍

GraphX应用背景

Kafka的应用场景

原理

kafka的使用

相关链接