你了解组注意力机制(GQA)和RMSNorm在现代大模型架构中的应用吗?