“商汤秒画”打造AI画图“模型超市”—

本页位置：广东新闻网 > 正文

“商汤秒画”打造AI画图“模型超市”

http://www.gd.chinanews.com 2023年04月13日 18:01 来源：中新网广东

　　在商汤技术日上，商汤“日日新SenseNova”大模型体系正式问世，基于该体系的AI内容创作社区平台“商汤秒画SenseMirage”也一并亮相。

　　商汤科技董事长兼CEO徐立现场演示了“商汤秒画SenseMirage”基于商汤自研AIGC模型的作画能力；也介绍了秒画平台基于商汤大装置的GPU算力支撑，可帮助用户免除本地化部署流程，既能使用商汤自研作画模型高效地生成高质量内容，也可以将本地模型及其他第三方开源模型一键导入，生成更多样的内容。

SenseMirage界面

　　秒画还提供特异性推理优化服务，开源模型导入后会自动采用秒画底层的模型编译技术进行加速，实测在本地RTX3070显卡需要10秒生成的图片通过秒画加速技术只需要2秒就可以生成。

　　此外，秒画还支持用户上传本地图像，结合商汤自研作画模型或者开源模型来训练定制化LoRA模型，来高效地生成个性化内容。(LoRA, 用于通过小数据继续训练，将大模型的能力适应到某个垂类领域，但会影响大模型的泛化能力)

　　“商汤秒画SenseMirage”平台，为各类创作者带来便利，同时也能充分借助社区力量，集结内容创意，通过内容共创，推动AI文生图技术与应用的生态构建。

SenseMirage界面

　　商汤自研的AIGC文生图大模型拥有超10亿参数，支持二次元、三次元等多种生成风格。用户无需复杂的编程知识，只需给定提示词，即可生成相应图像，最高可实现6K高清图。

　　无论是写实照片、脑洞大开的艺术画作，还是未来科幻场景，模型生成的图像都能根据用户需求，带来真实的光影效果以及丰富的细节内容。凭借超快的推理性能，商汤自研作画模型的文生图能力，每2秒就能生成1张512*512分辨率的图片。

　　相比于Stable Diffusion，商汤作画大模型基于19年开始研发的通用大模型设计体系，采用更先进的大模型结构设计与大batch训练优化算法，模型参数量大小为前者数倍。

　　核心技术包含了自研的 hierarchical inference experts, mixture of token experts, image quality-aware distributed training, texture-guided cross-attention learning等算法，使其具备更优的文本理解泛化性、图像生成风格广度以及图像高质量生成细节。