DeepSeek

3周前发布 34 0 0

DeepSeek是成立于2023年7月的杭州深度求索人工智能基础技术研究有限公司推出的AI项目,以Transformer架构、MoE等先进技术为核心,推出了DeepSeek-V2、DeepSeek-V3、DeepSeek-R1等性能卓越的模型,具有训练成本低、性价比高、开源可商用等特点,在自然语言处理、图文识别等方面表现出色,应用场景广泛...

收录时间:
2025-01-29
DeepSeekDeepSeek
DeepSeek
DeepSeek 是一家在人工智能领域备受瞩目的创新型科技公司,以下是关于它的详细介绍:

公司概况

  • 成立时间:杭州深度求索人工智能基础技术研究有限公司成立于 2023 年 7 月 17 日。
  • 公司地位:是网上热议的 “杭州六小龙” 之一,在硅谷很早就被称作 “来自东方的神秘力量”。

核心技术与产品

  • DeepSeek-V3
    • 发布时间:2024 年 12 月 26 日发布首个版本并同步开源。
    • 技术特点:为自研 MoE 模型,生成速度相比 V2.5 模型提升 3 倍,达到每秒吞吐量 60token。
    • 模型参数:6710 亿参数 MoE 架构模型,激活 37B,在 14.8T token 上进行了预训练。
    • 性能表现:在多语言编程测试排行榜中超越 Anthropic 的 Claude 3.5 Sonnet 大模型,仅次于 OpenAI o1 大模型;在中美数学竞赛上大幅超过所有开源闭源模型;在中文能力上与 Qwen2.5-72B 相近,但在事实知识 C – SimpleQA 上更领先。
    • 应用场景:涵盖聊天和编码场景、多语言自动翻译、图像生成和 AI 绘画等。
    • 产品价格:API 定价为每百万输入 tokens 0.5 元(缓存命中)/2 元(缓存未命中),每百万输出 tokens 8 元,并享有 45 天优惠价格体验期。
  • Janus – Pro 和 JanusFlow:2025 年 1 月 27 日,DeepSeek 发布了参数大小从 10 亿到 70 亿不等的 Janus – Pro 和 JanusFlow 一系列开源多模态模型,重点在于文生图能力方面。

产品功能

  • 联网搜索:用户开启后能快速获取准确下载链接,整合网络信息并提供时效性新闻回答,可紧跟时事动态解答社会热点问题。
  • 深度思考:在解答数学和逻辑问题时可展示解题过程和不同解法,能帮助用户深度理解问题,适合学生和研究者。
  • 图文识别:用户可拍照或上传图片进行文字识别,在识别清晰度方面表现优异,能准确提取复杂文本信息。

应用场景

  • 企业服务:为企业提供智能客服、数据分析、自动化办公等 AI 工具,提高企业运营效率。
  • 教育领域:开发智能教育助手,支持个性化学习推荐、作业批改和知识问答,助力教育智能化。
  • 医疗健康:辅助医疗诊断、药物研发和患者管理,为医疗行业提供技术支持。
  • 金融领域:应用于智能风控、自动化交易、客户画像分析等,提升金融业务的效率和准确性。
  • 安防领域:可用于人脸识别、行为分析、视频监控等,保障社会安全。

市场表现

  • 下载排名:2025 年 1 月 27 日,DeepSeek 登顶苹果中国地区和美国地区应用商店免费 APP 下载排行榜,在美区下载榜上超越了 ChatGPT。
  • 市场影响:其最新突破冲击了美国科技行业,导致 1 月 27 日美国股市科技板块大幅下跌,英伟达股价暴跌约 17%,博通公司股价下跌 17% 等。

合作伙伴与生态建设

  • 与多家知名企业和机构建立合作关系,携手推动 AI 技术的落地应用。
  • 积极投身开源社区,发布了多个 AI 工具和数据集,如在 GitHub 上发布 DeepSeek – V3,推动行业技术进步。

相关导航