朝は快晴で日差しは強いが気温は 13 度程度と低く、ヨーロッパのような天気だった。
読んだ
Chips and Cheese "The Nerfed FPU in PS5’s Zen 2 Cores"
PlayStation5 用に FP pipe を削った特殊な Zen 2 コアの解析。PS5 そのものの CPU はテストできないが、暗号通貨用の BC-250 というのが同じ構成らしく、それを使っている。PS5 用コアのほうが long latency instructions の retirement が遅い理由が分からない。演算器と register file の間の port 数は減っているが、ここで問題になるのは register file と L1 の間だよね?
Dispacher と演算器の間には普通 scheduling queue があるが、Zen 以降では scheduling queue の手前に non-scheduling queue というのを加えて、dispatch が止まりにくくしているとのこと。Scheduling queue 自体を大きくしないのは、ここを大きくすると演算器へ分配するところの回路が遅くなるからかな。あと、non-scheduling というが、アドレス計算などは進められるらしい。 LPDDR5 って latency が長いのか。- call it a wash: 良くも悪くもない、引き分け
PC watch "Intel、288 コアの「Xeon 6」と、性能 4 倍の AI アクセラレータ「Gaudi 3」"
Xeon 6 とは、E core only の Sierra Forest のこと。- RoCE: RDMA over Converged Ethernet
- OSFP: Octal Small Format Pluggable。SFP モジュールの進化系。
PC watch "Microsoft や Amazon に続き、Google も生成 AI 向け独自 CPU 投入"
Neoverse V2 ベースのコアらしい。先日の解説だと ARM ISA が本質的に高効率というわけではないという話だったが、こういうデータセンタでの採用が相次ぐところを見ると、x86 を周波数低めで使うよりさらに効率を良くする何かがあるのかしら。
「これまで Google Cloud 向けには、AI 学習専用の TPU (Tensor Processing Unit) として Arm 製のプロセッサが提供されてきた」は間違いでは? TPU は独自開発、独自 ISA でしょ。PC watch "AMD、AI の前処理も推論も 1チップで行なえる第 2 世代「Versal」"
スライドをベタベタ貼ってるだけで、解説や分析が少ない。APU は Application Processing Unit、RPU は Real-time Processing Unit らしい。AMD なのに、ARM の Cortex を搭載している。センサ情報などの preprocessing 用に FPGA も搭載。PC watch M1 からの乗り換えに、全部盛りの M3 MacBook Air を購入してみた
このモデルから指紋防止コーティング(陽極酸化皮膜処理)が導入されたと聞いていたけど、金属部分だけで、キートップはそうじゃないのかよ……