如何高效实践LLM和多模态模型推理?