腾讯混元Hy3 Preview实测,这次真的不只是能发,而是能用了吗?

2026-05-22 12:577阅读0评论运维
  • 内容介绍
  • 文章标签
  • 相关推荐

这次我们实测围绕四个方向展开,分别是网页生成、 游戏编写、交互建模和 SVG 动画。为了从普通用户的视角进行测试,我们使用的提示词全都是偏自然语言的描述,比如 做一个交互式音乐可视化网站 、 做一个 Roguelike 地牢探索游戏 这种,主要还是为了看看Hy3-Preview在没有明确指引的情境下表现如何。有时候会被自己的知识量拖累。第一道题就是最好的例子知道的太多,反而没注意到题目里最重要的两个字。 其实这不只是 Hy3 的问题,几乎是所有大模型在常识推理上的共同现象。真正考验模型的,从来不是它知不知道升华和凝结,而是它在一堆知识涌上来的时候,能不能先停下来,把题目读完。

腾讯混元 Hy3 preview 上手实测:这次终于不只是“能发”,而是真的能用了

牛逼。 这次我们实测围绕四个方向展开,分别是网页生成、 游戏编写、交互建模和 SVG 动画。为了从普通用户的视角进行测试,我们使用的提示词全都是偏自然语言的描述,比如 做一个交互式音乐可视化网站 、 做一个 Roguelike 地牢探索游戏 这种,主要还是为了看看 Hy3-Preview 在没有明确指引的情境下表现如何。不过抛开逻辑题之外这次 Hy3-Preview 的确比之前多了点活人感 。比如我跟他说 我今天被领导批评了 心…

混元大模型:背景与发展

腾讯混元是什么

腾讯混元是腾讯人工智能战略布局的重要组成部分, 雪糕刺客。 旨在构建一个强大的通用人工智能平台。

混元重建的意义

平心而论... 此前, 腾讯推出了多个大模型产品,但因为技术发展和用户需求变化,对模型的迭代升级提出了更高的要求。本次混元重建是腾讯对现有大模型架构进行深度优化和改进的关键一步。

核心技术:295B参数MoE架构与长上下文支持

指标 数值
参数量 2950亿
模型架构 Mixture of Experts
上下文长度 256K

实测方向与方法

网页生成

我们尝试让 Hy3 Preview 生成不同风格的网页布局和内容, 可以。 比方说新闻页面、电商商品详情页等。

游戏编写

简单的游戏代码,比方说 Roguelike 地牢探索游戏的基本框架。

交互建模

利用 Hy3 Preview 构建简单的交互式界面原型, 实现按钮点击、文本输入等基本交互功能。

SVG动画

让 Hy3 Preview 根据文字描述生成简单的 SVG动画效果。

实测后来啊与分析

网页生成:表现亮眼

这就说得通了。 "这次"我们在网页生成方面看到显著提升。“能够直接输出HTML代码”,而且生成的代码质量也远超以往的模型。

,特别是对于需要复杂布局和内容结构的页面Hy3 preview的表现尤为突出。 游戏编写:潜力巨大

"虽然"生成的代码还不够完善需要进一步优化, 人间清醒。 “但”已经能够实现基本的逻辑流程和界面结构。

,特别是对于一些简单的游戏类型,Hy3 preview展现出了不错的潜力。 交互建模:快速原型设计

踩个点。 "在"交互建模方面“Hy3 preview”能够快速生成可操作的原型界面。

功能效果
按钮点击正确响应并触发相应事件
文本输入支持输入并显示文本内容

SVG动画:初步探索

//示例SVG代码: 

性能表现

指标数值
首token延迟降低54%
复杂任务施行成功率99.99% +

未来展望

目前来看 , Hy3 preview 是 Tencent混元重建后的第一张能够展现实际价值的成绩单 。 虽然仍存在一些局限性 , 但其在实用性方面的突破令人期待 。 未来 , 我们期待看到 Hy3 preview 在更多场景下的应用 , 以及其在持续改进方面的不断进步 。

这次我们实测围绕四个方向展开,分别是网页生成、 游戏编写、交互建模和 SVG 动画。为了从普通用户的视角进行测试,我们使用的提示词全都是偏自然语言的描述,比如 做一个交互式音乐可视化网站 、 做一个 Roguelike 地牢探索游戏 这种,主要还是为了看看Hy3-Preview在没有明确指引的情境下表现如何。有时候会被自己的知识量拖累。第一道题就是最好的例子知道的太多,反而没注意到题目里最重要的两个字。 其实这不只是 Hy3 的问题,几乎是所有大模型在常识推理上的共同现象。真正考验模型的,从来不是它知不知道升华和凝结,而是它在一堆知识涌上来的时候,能不能先停下来,把题目读完。

腾讯混元 Hy3 preview 上手实测:这次终于不只是“能发”,而是真的能用了

牛逼。 这次我们实测围绕四个方向展开,分别是网页生成、 游戏编写、交互建模和 SVG 动画。为了从普通用户的视角进行测试,我们使用的提示词全都是偏自然语言的描述,比如 做一个交互式音乐可视化网站 、 做一个 Roguelike 地牢探索游戏 这种,主要还是为了看看 Hy3-Preview 在没有明确指引的情境下表现如何。不过抛开逻辑题之外这次 Hy3-Preview 的确比之前多了点活人感 。比如我跟他说 我今天被领导批评了 心…

混元大模型:背景与发展

腾讯混元是什么

腾讯混元是腾讯人工智能战略布局的重要组成部分, 雪糕刺客。 旨在构建一个强大的通用人工智能平台。

混元重建的意义

平心而论... 此前, 腾讯推出了多个大模型产品,但因为技术发展和用户需求变化,对模型的迭代升级提出了更高的要求。本次混元重建是腾讯对现有大模型架构进行深度优化和改进的关键一步。

核心技术:295B参数MoE架构与长上下文支持

指标 数值
参数量 2950亿
模型架构 Mixture of Experts
上下文长度 256K

实测方向与方法

网页生成

我们尝试让 Hy3 Preview 生成不同风格的网页布局和内容, 可以。 比方说新闻页面、电商商品详情页等。

游戏编写

简单的游戏代码,比方说 Roguelike 地牢探索游戏的基本框架。

交互建模

利用 Hy3 Preview 构建简单的交互式界面原型, 实现按钮点击、文本输入等基本交互功能。

SVG动画

让 Hy3 Preview 根据文字描述生成简单的 SVG动画效果。

实测后来啊与分析

网页生成:表现亮眼

这就说得通了。 "这次"我们在网页生成方面看到显著提升。“能够直接输出HTML代码”,而且生成的代码质量也远超以往的模型。

,特别是对于需要复杂布局和内容结构的页面Hy3 preview的表现尤为突出。 游戏编写:潜力巨大

"虽然"生成的代码还不够完善需要进一步优化, 人间清醒。 “但”已经能够实现基本的逻辑流程和界面结构。

,特别是对于一些简单的游戏类型,Hy3 preview展现出了不错的潜力。 交互建模:快速原型设计

踩个点。 "在"交互建模方面“Hy3 preview”能够快速生成可操作的原型界面。

功能效果
按钮点击正确响应并触发相应事件
文本输入支持输入并显示文本内容

SVG动画:初步探索

//示例SVG代码: 

性能表现

指标数值
首token延迟降低54%
复杂任务施行成功率99.99% +

未来展望

目前来看 , Hy3 preview 是 Tencent混元重建后的第一张能够展现实际价值的成绩单 。 虽然仍存在一些局限性 , 但其在实用性方面的突破令人期待 。 未来 , 我们期待看到 Hy3 preview 在更多场景下的应用 , 以及其在持续改进方面的不断进步 。