読んだ
Chips and Cheese "Intel’s Ambitious Meteor Lake iGPU"
以前の Intel iGPU は CPU の ring bus に繋がっていて L3 cache を共有していたが、Meteor Lake では CPU core 群の外側の Scalable Fabric というところに繋がっていて、L3 とは独立したという。
AMD や NVIDIA GPU と違って、Intel GPU では register file の割当は 128 registers/thread で固定で、各スレッドが実際にどれだけ使うかは関係ないという。ローカル変数を減らして thread occupancy を上げるという CUDA でおなじみの工夫の意味がないわけね。 AMD GPU は kernel 内では vector width は 32 or 64 で固定(wavefront size のこと?)だが、Intel GPU は命令ごとに vector width を 1 - 32 で変えられるという。でも、スケジューリングが vector engine pair による 64 単位なら意味がないのでは?Chips and Cheese "Hot Chips 34 – Intel’s Meteor Lake Chiplets, Compared to AMD’s"
2022 年の時点で Meteor Lake の iGPU が CPU の L3 cache を共有しないと気づいているのはさすが。Foveros を使う Inte は PCB 上でチップレットを繋いでいる AMD よりも消費電力で有利と分析している。なお、Latency でも有利なはずだが、宣伝していないところを見ると、あまり性能が出ていないのではとしている。AMD も Phoenix Point でモバイル向けも chiplet になるとしているが、実際には [Ryzen 7045 (Dragon Range) はチップレットだが 7040 (Phoenix), 7035 (Rembrandt-R), 7030 (Barcelo-R) はモノリシック]であり、あまり採用が進んでいない。PC watch "Windows 10 はサポート切れ間近! 買い替えでお財布が厳しいなら“中古 PC”もアリ。今は結構保証もしっかりしてるって知ってた?"
バッテリの劣化についても言及してほしかった。PC watch "Raspberry Pi 5 より 2 倍速い、Intel N100 搭載コンピューティングモジュール「LattePanda Mu」"
あとは待機電力次第では Raspberry Pi の出番がますますなくなるな。でも N100 搭載なのに、どうして PCIe レーンがこんなに少ないんだろう。