你的LLM应用,难道不该跳出缓冲记忆的框架?