Himσησ
says to
YSITD
我不懂為什麼需要考慮多組讀寫 像是CUDA的scheduler會想竟盡辦法隱藏存取記憶體的時間,你要做的就是去做對齊之類的