发帖
客户端
扫码下载

[AI] 腾讯混元推出并开源原生多模态图像生成模型“混元图像3.0”

[复制链接]
7 |0
未来视野 发表于 昨天 13:47 | 显示全部楼层 |阅读模式
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
腾讯混元今日正式推出并开源了原生多模态图像生成模型“混元图像3.0(HunyuanImage 3.0)”,该模型参数规模达到80B,成为首个开源的工业级原生多模态生图模型。腾讯方面表示,混元图像3.0的效果可对标业界头部闭源模型,具备强大的图像生成能力。

除了基本的图像生成功能外,混元图像3.0模型还具备利用知识进行推理的能力,可以解析千字级别的复杂语义,并生成包含长文本的文字图像。这一升级使得模型在应对复杂场景和需求时表现出色。

此次发布的混元图像3.0是继今年5月发布的2.0版本后的又一次重要升级。2.0版本已经实现了毫秒级响应和超写实画质,支持实时生图功能,用户可以边打字边看到生成的图像。

腾讯混元系列此前已经陆续开源了3D生成模型(2.0/2.5版本)、定制化图像生成插件InstantCharacter以及多模态视频生成工具HunyuanCustom,形成了完整的AIGC(人工智能生成内容)技术矩阵。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表