豆包大模型(Doubao) 是字节跳动自主研发的通用人工智能大模型,依托火山引擎技术生态,已成为国内使用量最大、多模态能力领先的大模型之一。
-
发布与迭代
- 2024 年 5 月:火山引擎原动力大会正式发布豆包大模型家族,原名 “云雀”,为国内首批通过算法备案的大模型之一。
- 2024 年 9 月:推出豆包视频生成 – PixelDance/Seaweed 模型,进军 AI 视频领域。
- 2025 年 1 月:发布豆包大模型 1.5Pro 版本,强化视觉理解、实时语音等能力,支持多模态复杂任务。
-
技术突破
- MoE 架构:采用稀疏混合专家模型,等效 7 倍稠密模型性能,训练成本显著降低。
- 全栈优化:自研服务器集群与网络协议,支持低成本芯片,推理效率提升 33 倍(日均处理 Tokens 达 4 万亿)。
-
多模态家族矩阵
- 通用模型:Pro 版(32k 上下文)与 Lite 版,性能对标 GPT-4o,价格仅为 1/8。
- 细分领域模型:覆盖文生图、语音识别 / 合成、视频生成、音乐创作等 9 类场景,支持多镜头语言、复杂指令交互。
-
性能表现
- 客观评测:智源研究院 FlagEval 榜单中,综合成绩 75.96 分位列第二,数学能力、知识运用排名第一。
- 高考测试:2024 年高考数学新课标 II 卷客观题正确率 74.66%,优于 GPT-4o 及国内主流模型。
-
个人用户
- 豆包 App:AIGC 类应用下载量第一,支持 AI 对话、创作工具(如星绘、即梦),月活用户超 2600 万。
- 多模态交互:实时语音模型支持方言、情感表达,视觉模型可分析图表、生成广告素材。
-
企业服务
- 智能终端:与 OPPO、小米、华硕等合作,覆盖 3 亿终端设备,调用量半年增长 100 倍。
- 行业解决方案:金融(招商银行智能客服)、汽车(车企联盟)、教育(高校 AI 助教)等领域落地。
豆包大模型凭借 “极致性价比 + 多模态能力”,成为国内大模型赛道的黑马。其低价策略与技术突破正在重塑行业格局,未来有望通过持续迭代和生态协同,加速 AI 普惠化进程。