DeepSeek DeepSeek是成立于2023年7月的杭州深度求索人工智能基础技术研究有限公司推出的AI项目,以Transformer架构、MoE等先进技术为核心,推出了DeepSeek-V2、DeepSeek-V3、DeepSeek-R1等性能卓越的模型,具有训练成本低、性价比高、开源可商用等特点,在自然语言处理、图文识别等方面表现出色,应用场景广泛,近期上线的APP已登顶苹果商店下载榜,在全球AI领域引发了广泛关注和强烈反响。
通义 通义大模型的技术架构基于通用语言模型(如StructBERT)和生成式模型(如PALM)的基础上发展而来。其核心是通用统一大模型(M6-OFA),这是一个拥有十万亿参数的巨型模型,能够同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等超过10项的单模态和跨模态任务。