DistributedCompute-Notes
Distributed System Series(分布式系统· 实践笔记)
现实世界中的数据系统往往颇为复杂。大型应用程序经常需要以多种方式访问和处理数据,没有一个数据库可以同时满足所有这些不同的需求。因此应用程序通常组合使用多种组件:数据存储,索引,缓存,分析系统,等等,并实现在这些组件中移动数据的机制。许多现有数据系统中都采用这种数据处理方式:你发送请求指令,一段时间后
像这样的在线(online)系统,无论是浏览器请求页面还是调用远程
-
服务(在线系统
) :服务等待客户的请求或指令到达。每收到一个,服务会试图尽快处理它,并发回一个响应。响应时间通常是服务性能的主要衡量指标,可用性通常非常重要(如果客户端无法访问服务,用户可能会收到错误消息) 。 -
批处理系统(离线系统
) :一个批处理系统有大量的输入数据,跑一个作业(job)来处理它,并生成一些输出数据,这往往需要一段时间(从几分钟到几天) ,所以通常不会有用户等待作业完成。相反,批量作业通常会定期运行(例如,每天一次) 。批处理作业的主要性能衡量标准通常是吞吐量(处理特定大小的输入所需的时间) 。 -
流处理系统(准实时系统
) :流处理介于在线和离线(批处理)之间,所以有时候被称为准实时(near-real-time)或准在线(nearline)处理。像批处理系统一样,流处理消费输入并产生输出(并不需要响应请求) 。但是,流式作业在事件发生后不久就会对事件进行操作,而批处理作业则需等待固定的一组输入数据。这种差异使流处理系统比起批处理系统具有更低的延迟。
Nav | 关联导航
- 如果你想了解微服务
/ 云原生等分布式系统的应用实践,可以参阅;如果你想了解数据库相关,可以参阅 Database-Notes;如果你想了解虚拟化与云计算相关,可以参阅 Cloud-Notes;如果你想了解Linux 与操作系统相关,可以参阅 Linux-Notes。
About
Copyright & More | 延伸阅读
笔者所有文章遵循 知识共享 署名