admin管理员组

文章数量:1516870

论文阅读----Ten Lessons From Three Generations Shaped Google’s TPU V4i

1, 论文常见缩写

1) Domain Specific Architecture (DSA)

2) A custom chip-to-chip interconnect fabric (ICI)

3) P99 latency:

P99延迟: 一段时间内,所有请求中最快的 99%请求的平均延时,能直观的衡量服务器性能指标.

同理 P95就是快的95%的请求延时.

4) SLA/SLO/SLI

SLA = Service Level Agreement = 服务质量 / 水平协议

SLO = Service-level-objective = 服务质量 / 水平目标

SLI = Service Level Indicator = 服务质量 / 水平指标

5) ISA(Instruction set architecture)

6) MLPerf benchmarks 0.5-0.7 :

  • MLPerf Training benchmarks 0.5-0.7 :
  • MLPerf Inference benchmarks 0.5-0.7

7) High BandWIdth Memory(HBM)

8) Itanium’s VLIW architecture: Very Long Instruction Word:超长指令集架构

  • 安腾 (英语: Itanium ),是 (通常称之为 IA-64 )的64位处理器,该处理器的市场定位是在于 与 系统。该架构由惠普创始,后来则是惠普与英特尔共同开发。

  • 安腾的微架构是彻底的不同于其他英特尔处理器采用的

本文标签: 服务质量系统中的十年