Tag
南加州大学最新研究,ChatGPT 参数规模很可能只有 7B(70 亿)。南加大团队三位作者破解出了未公布的 gpt-3.5-turbo 嵌入向量维度(embedding size)为 4096 或 4608。而几乎所有已知的开源大模型如 Llama 和 Mistral,嵌入向量维度 4096 的时候都是约 7B 参数规模。其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。
查看更多 2024-05-18
Demand feedback
售前技术支持