一站式帮你注册AI智能机器人chatgpt,永久使用,需要的加微信:diandsp

首页创业正文

2023十大科技趋-达摩院.pdf

灵灵2个月前74浏览量

多模态预训练大模型

基于多模态的预训练大模型将实现图文音统一知识表示,成为人工智能基础设施。

人工智能正在从文本、语音、视觉等单模态智能,向着多种模态融合的通用人工智能方向发展。多模态统一建模,目的是增强模型的跨模态语义对齐能力,打通各个模态之间的关系,使得模型逐步标准化。目前,技术上的突出进展来自于 CLIP(匹配图像和文本)和 BEiT-3(通用多模态基础模型)。基于多领域知识,构建统一的、跨场景、多任务的多模态基础模型已成为人工智能的重点发展方向。未来大模型作为基础设施,将实现图像、文本、音频统一知识表示,并朝着能推理、能回答问题、能总结、做创作的认知智能方向演进。

下载完整版报告,请扫描右边二维码!


整合资源

最新评论

d5123.com mzimag.com cbxks.com fsjtsj.com wmlsf.com gbwzy.com pqgyy.com shtehj.com milseo.com