豆包(Doubao)是字节跳动基于云雀模型开发的AI助手,自2023年8月首次推出以来,已迅速成长为中国最受欢迎的AI应用之一。[2]豆包基于豆包大模型(原名云雀模型)开发,支持文本、图像、音视频生成、语音通话、数据分析,以及AI驱动的在线搜索功能。[8]
作为字节跳动在AI领域的旗舰产品,豆包定位为"综合性的AI智能体(AI Agent)平台",通过多样化的智能体形式满足用户在不同场景下的需求。豆包不仅是一个简单的聊天机器人,更是一个集成了多种AI能力的平台级产品。[3]
豆包支持多平台使用,包括网页Web平台、iOS和安卓移动端、Windows/macOS电脑客户端,实现了多端实时同步对话内容。[2]依托抖音、剪映等产品的流量入口,豆包实现用户高效转化,其拟人化交互设计与低门槛体验更贴合大众需求——从恋爱攻略到旅游规划,场景化服务覆盖生活全维度。[3]
豆包的核心差异化在于三个方面:第一,字节跳动生态的深度整合,与抖音、剪映、飞书、今日头条等产品形成强大的协同效应;第二,以极致低价策略抢占B端市场,推动大模型"以厘计价"时代到来;第三,拟人化的交互设计和丰富的智能体生态,使非技术用户也能轻松使用。
豆包的发展可以划分为以下几个关键阶段:
萌芽期(2016年—2023年7月)。 2016年,字节跳动公司成立人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。[5]
公测与智能体探索期(2023年8月—2024年5月)。 2023年8月,豆包开始在国内应用市场灰度上线,同一时间,海外同步上线了一款产品Cici。2023年11月份,字节正式成立单独的面向AI的组织架构FLOW,核心目标以AI应用创新的探索为主。[2]在这段时间里,豆包的产品迭代重点着重关注应用内的智能体生态,持续推出不同应用领域的官方智能体,当时共推出了22个智能体,覆盖学习、语音聊天、AI生图、生活助手、编程助手等多个领域。[4]
商业化启动与高速增长期(2024年5月—2024年12月)。 2024年5月15日,字节跳动宣布豆包大模型正式开启对外服务,豆包通用模型pro-32k版在企业市场的推理输入价格仅为0.0008元/千tokens,较行业降幅达99.3%,推动大模型从"以分计价"进入到了"以厘计价"阶段。[6]据QuestMobile数据,截至2024年11月底,豆包月活用户数达到5600万左右,占据了行业近半数的月活用户。[7]
国民级应用巩固期(2025年至今)。 2025年1月,豆包实时语音大模型开放,支持情感交互与方言理解。[3]2025年6月11日,在火山引擎原动力大会上,豆包大模型1.6系列正式发布,实现了多模态思考,并推出了极具竞争力的统一定价模式,将企业常用区间的综合成本直接降低了63%。[6]截至2025年9月底,日均Tokens调用量破30万亿,覆盖约3亿台设备,接入小米、三星、特斯拉、奥迪、联想等品牌。[3]2025年12月,火山引擎正式发布豆包大模型1.8。[3]2026年2月14日,字节跳动发布了豆包大模型2.0,包含Pro、Lite、Mini三款通用Agent模型和Code模型,其中Pro面向深度推理与长链路任务执行场景,全面对标GPT 5.2与Gemini 3 Pro。[9]
豆包的核心交互形态是对话式AI助手。豆包采用对话式交流页面,可以作为聊天机器人使用,同时为满足用户不同需求,支持创造智能体身份,以自然、亲和力强的语调和情绪,与用户交互。[8]豆包将AI搜索的功能作为最关键的基础能力之一,包括整合字节内部抖音搜索和头条搜索的能力,并接入Bing等搜索引擎支持全网搜索,以及拓展学术搜索和支持深度搜索模式。[1]
多模态领域的功能更新和拓展,是豆包过去一年多里功能新增最频繁的一个模块,包括持续拓展语音聊天、文生图、图生图、视频生成、图片理解、音乐生成等功能,不仅拓展的范围很广,并且每一个应用领域豆包保持从通用到精专的下钻打磨。[1]多模态能力成为关键加分项,集成文生图、语音交互、视频生成等功能的"超级APP"形态,让非技术用户也能轻松上手。[3]
2025年7月,豆包"深入研究"功能在豆包App、网页版及电脑版正式开启测试,用户可免费体验。选择"深入研究",输入详细指令或一句话prompt,等待几分钟,即可生成一份报告。使用豆包App生成报告后,还可以打开报告内容,选择右上角"听"按钮,一键转成播客,随时听。[5]
豆包支持AI编程功能。用「AI编程」生成的网页应用,支持在预览界面直接编辑文字、智能换图,以及选中局部元素进行调整,让零编程基础的用户也能搭建应用。[5]
AI云盘支持多格式预览,无论是PDF、Word、PPT还是Excel,都可以在AI云盘中直接预览,无需下载打开,支持多达42种办公文件格式预览。[5]在数据分析功能中,可一键实现数据合并去重、格式转换、数据分析以及图表绘制等操作。豆包支持在自由对话中生成脑图、思维导图、流程图和时序图等。[5]
电脑版语音通话功能中,可以通过首页技能栏、电脑版启动器与豆包悬浮头像一键启动语音通话。豆包不仅能表达丰富情绪、切换多样声线,还能说方言、唱歌以及模拟角色,带来更智能的语音互动体验。[5]在拟人度、有用性、情商、通话稳定性对话流畅度等多个维度的考评中,整体满意度方面,豆包实时语音大模型评分为4.36(5分满分),GPT-4o为3.18。[3]
豆包推出大量官方智能体,如英语学习助手、聊天、AI生成漫画等,上线文生图产品能力,开启多模态探索。豆包用户既能与默认智能体聊天,也能找到特定的智能体解决具体问题,比如口语外教、健身教练,甚至哲学学者,还能参与UGC智能体的创作,打造自己的个性化智能体。[8]豆包上已有超过800万个智能体被创建。[9]
豆包除了不断拓展通用AI功能,在垂直场景的AI应用落地上也非常积极,分别围绕教育(拍题答疑)、办公(数据分析、录音纪要、PPT生成、云盘)、创作(海报生成、分身写真)等多个垂直应用领域,打磨更贴近应用场景的AI产品体验。[1]
2025年,豆包迎来了一系列重要更新,其中最引人注目的是豆包手机助手技术预览版的发布,标志着豆包从应用级AI向系统级AI助手的转变。[2]2025年12月1日,豆包与中兴通讯合作,以工程样机形式推出"豆包AI手机"nubia M153,在中兴商城上架后即告售罄。[8]字节与中兴合作推出豆包手机助手,尝试在系统层完成跨App操作,指向一个方向:在不改造App的前提下,让AI直接操作界面。[4]
豆包于2025年10月完成重要功能升级,正式接入抖音商城。当用户提出消费相关问题时,豆包不再局限于提供文字建议,而是会推荐具体商品并引导跳转购买。[8]在对话框里向豆包发起商品咨询,它会快速给出分类推荐;点击感兴趣的产品名称,直接调起抖音商城内的可选店铺,选定配置后即可完成下单付款。[4]
豆包的技术核心包括语言模型Doubao-Seed系列(如1.6基础版、深度思考版)、视频生成Seedance 1.0 Pro、图像生成Seedream等,覆盖从日常对话到专业生产的全链条需求。[7]
UltraMem是豆包大模型团队提出的一种全新稀疏模型架构,在保证模型效果的前提下,推理速度较传统的MoE架构提升2-6倍,推理成本最高可降低83%。这项创新成果已被ICLR 2025接收。[3]
2025年1月,豆包大模型1.5版本面世,该版本在多模态能力上全面提升。[6]2025年6月11日,豆包大模型1.6系列正式发布,最大亮点是实现了多模态思考,并推出了极具竞争力的统一定价模式。[6]豆包大模型1.6系列包含三个版本:doubao-seed-1.6是全能综合模型,支持256K上下文;doubao-seed-1.6-thinking是深度思考的强化版本;doubao-seed-1.6-flash是极速版本。[6]
2025年10月,发布豆包大模型1.6升级版,原生支持4种思考长度。12月,火山引擎正式发布豆包大模型1.8。[3]2026年2月14日,字节跳动发布了豆包大模型2.0,包含Pro、Lite、Mini三款通用Agent模型和Code模型,其中豆包2.0 Pro面向深度推理与长链路任务执行场景,全面对标GPT 5.2与Gemini 3 Pro。[9]
豆包大模型的每日Token调用量:去年5月发布时为1200亿,2025年5月达到1.6万亿,9月达到30万亿每天,实现了253倍的增长。[7]截至2025年12月,豆包大模型日均调用量已突破50万亿Tokens,比10月数据增长66.7%,相比去年同期增长超十倍。[3]
火山引擎与全球前10手机厂商中的9家达成合作,为其提供语音助手、创作工具等服务;和八成主流车企合作,覆盖智能座舱、自动驾驶标注、智能营销等场景;为招行、浦发等70%的系统重要性银行及数十家券商,提供智能展业、投顾等服务;超半数985高校用豆包大模型推动教学服务、科研辅助的智能化。[1]在企业市场,根据IDC的报告,火山引擎在中国公有云的大模型服务调用量上居第一,市场份额达到49.2%。[7]
豆包的用户增长经历了几个显著的阶段性跃升:
2023年8月,开始小范围邀请测试,月活不足10万。2023年11月,月活突破1000万。2024年5月,月活达2600万。[3]截至2024年11月底,豆包月活用户数达到5600万左右。[7]
进入2025年后,增长再次加速。2025年Q1豆包月活为9980万,Q2爬升至1.3亿,Q3进一步增长至1.59亿,一举超过DeepSeek的1.46亿。2025年最后一个季度,豆包在亿级用户基数之上,实现了高达42.5%的环比增长,月活升至2.26亿再创新高。[9]
QuestMobile数据显示,截至2025年三季度,豆包更是突破DAU亿级门槛。[4]豆包还是首个日活过亿的AI原生应用。[8]豆包以2亿的MAU稳居榜首。[1]
2025年的最后一个月,豆包、DeepSeek、元宝、蚂蚁阿福、千问分居AI应用榜单前五,并且豆包以压倒性的优势领先其他AI应用,其活跃用户达到2.26亿,而后四家的总和为2.28亿。[6]
在a16z发布的2025年全球生成式AI消费级应用排行榜中,前50大AI原生移动应用里,豆包排名第10。[6]豆包成为累计历史下载量2.7亿的国民级产品。[5]
豆包基础功能完全免费,大众用户无需额外支出即可享受AI服务,这对于推广AI技术普及具有重要意义。[2]豆包C端的免费策略本质上是以流量和用户规模反哺B端模型服务的商业模式,通过海量用户使用产生的数据飞轮效应,持续优化模型能力。
2024年5月15日,字节跳动宣布豆包主力模型企业市场定价为0.0008元/千Tokens,比行业便宜99.3%。[8]这一策略直接引爆了国内大模型的价格战。
豆包1.6采用了颠覆性的统一定价模式,首创按"输入长度"区间定价策略。在企业使用最频繁的0-32K输入区间内,价格锁定在输入0.8元/百万tokens、输出8元/百万tokens。综合成本仅为2.6元,相比豆包1.5深度思考模型和DeepSeek R1的7元综合成本,直接降低63%。[3]
火山引擎创新性地取消了高级功能的"附加费",直接做统一定价。也就是说,客户不再为高阶AI能力额外买单,人人都用得起"全功能版"的大模型服务。[7]
火山引擎总裁谭待向记者透露,大模型产品在火山引擎所有业务中收入增速最快,远超其他产品,且毛利位居前列。[1]根据IDC在3月下旬发布的数据,火山引擎占据中国公有云大模型服务调用量市场份额的46.4%,远高于排名其后的百度智能云、阿里云。[1]
对字节电商而言,豆包带来的不仅是新的变现入口,也是一种此前缺失的流量形态。[4]豆包引入的是用户带着明确需求主动发起AI对话,在购物决策最明确的节点直接下单的第三种电商逻辑。左手是日活破亿的豆包,右手是抖音电商、抖音本地生活服务庞大的商家资源——把这两端打通,让AI成为电商与生活服务的调度中心。[4]
原生AI助手类应用竞争格局呈现明显的梯次分布。豆包以2亿的MAU稳居榜首;阿里千问MAU以31.7%复合增长率,形成爆发式增长。[1]豆包的月活跃用户规模在三季度末达到1.72亿,超过DeepSeek的1.45亿。腾讯元宝、即梦AI、Kimi构成第二阵营,月活用户分别为3286万、1012万和967万。[6]
2025年年初,DeepSeek凭借极高的市场热度占据领先地位,Q1月活高达1.87亿,而同期豆包仅为9980万。但进入Q2后豆包开始发力,至Q3反超DeepSeek。[9]DeepSeek的优势在于技术口碑和开源策略带来的开发者认可度,而豆包的优势在于字节跳动的流量生态和强大的商业化运营能力。
字节系豆包携流量抢占"视频娱乐智能体入口",多模态生成娱乐内容;腾讯元宝则背靠微信熟人网络探索"社交智能体入口",依赖腾讯云向"办公智能体""个人知识智能体"延伸。[8]两者在生态定位上存在显著差异,腾讯元宝体量较小但增速稳定。
2026年春节期间,千问月活从1月的3105万飙升至2月的2.03亿,环比增速高达552.83%,创造了AI产品单月增速纪录。[6]阿里的千问APP全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,不仅能"对话",而且能为用户"办事"。[8]千问是豆包面临的最强有力的挑战者。
| 维度 | 豆包 | DeepSeek | 腾讯元宝 | 阿里千问 |
|---|---|---|---|---|
| MAU(2025Q4) | 2.26亿 | 1.35亿 | ~4000万 | ~3000万(春节后飙升) |
| 核心优势 | 字节生态+多模态 | 技术口碑+开源 | 微信社交生态 | 阿里商业生态 |
| 商业化方向 | 内容娱乐+电商 | 开发者/企业 | 社交+办公 | 购物+生活服务 |
| B端定位 | 大模型API服务 | 开源/API | 腾讯云集成 | 阿里云集成 |
豆包友好的用户体验设计、零使用门槛以及丰富的生活化功能,使其能够覆盖从青少年到中老年等各个年龄阶层的用户群体。[2]
学生群体依赖拍题答疑、英语陪练、论文写作辅助等功能提升学习效率;内容创作者通过文生图、视频生成、音乐创作实现创意落地;开发者与企业使用MarsCode智能编程工具及API服务优化工作流;日常用户则用于生活咨询、旅行规划、文档总结等场景。[7]
目前豆包的整体使用用户以职场白领群体为主,年轻用户相对较少。未来对于社交、游戏等新奇事物比较感兴趣的年轻一代群体,将是重要用户群体。下沉市场和女性用户的占比也在逐步提升。[10]
豆包通过春晚赞助和AI生成头像、祝福视频、拜年文案,让AI成为节日氛围的参与者。蔡明的小品中直接为老年人提供了最生动的使用场景,除夕当晚豆包App完成19亿次互动,这无疑是全民使用AI的标志性时刻。[6]
以豆包为典型代表,国内的AI产品正在通过「功能一站式」和「形态全陪伴」,试图从「单点效率工具」上升为「端到端超级工具」。[5]
抖音App测试接入豆包App的AI能力,并在抖音App内为豆包开放了两个超级入口,一个位于短视频界面,与点赞、评论、转发等功能处于同一竖列;另外一个入口则位于抖音消息列表内。[5]字节跳动利用其在抖音、今日头条等高流量产品中的入口位置,为豆包实现了高效的用户导流。
去年豆包大模型在行业中率先降价,把Token的定价降低了一个数量级,并带动大模型行业出现了降价潮。[4]今年豆包大模型再次降价,是为了争夺Agent规模化应用给云服务带来的新机会。[4]
网友们在豆包创作智能体的热情,更是其他平台很难比拟的。不少网友热衷给豆包做二创,为她打造新"豆设",搞出了"豆沙""豆脚"这样的抽象IP,还有用户制作了挂满豆包徽章的"痛包"。这种集体玩梗,通常只会出现在现象级IP上。[8]
字节跳动锁定央视春晚,旗下火山引擎成为2026年春晚独家AI云合作伙伴,旗下智能助手豆包也将配合上线多种互动玩法。[9]豆包官宣登上春晚舞台,试图以全民级曝光完成持续破圈。[4]
字节生态的强大协同效应。 豆包深度整合了抖音、剪映、飞书、今日头条等字节系产品,实现了内容生态、流量入口与AI能力的三位一体。开发者在火山引擎上开发的智能体,可通过豆包生态快速触达海量用户,借助抖音、今日头条等流量入口实现精准分发。[9]
极致性价比的定价策略。 豆包大模型的价格极具竞争力,定价为0.0008元/千Tokens,比同行便宜99.3%。[2]这种策略有效推动了大模型的规模化应用。
用户规模的领先优势。 豆包是国内唯一一个DAU突破亿级的AI原生应用,拥有2亿以上的月活用户规模,形成了强大的数据飞轮效应。
广泛的B端设备覆盖。 截至2025年9月底,覆盖约3亿台设备,接入小米、三星、特斯拉、奥迪、联想等品牌。[3]
模型能力仍存差距。 在一些评测中,豆包相比其他AI大模型产品,其智能化水平还有待提升。[10]尽管模型能力在快速迭代,但在复杂推理和专业领域仍有提升空间。
隐私与安全争议。 豆包AI手机nubia M153由于部分功能操作复杂,且隐私保护问题令人担忧,引发关注。[8]此前也曾出现用户被AI搜出微信号的隐私事件。[5]
商业化路径尚不清晰。 C端免费策略虽带来了用户规模,但变现模式仍以B端API调用为主,C端变现(如电商、广告)仍在早期探索阶段。
AI手机/AI硬件市场爆发。 字节跳动联合中兴推出"豆包AI手机",且正与vivo、联想、传音等厂商推进合作。IDC预计2026年中国新一代AI手机出货量将达1.47亿台,同比增长31.6%。[3]
Agent时代来临。 Agent规模化应用给云服务带来新机会。[4]字节跳动正在为即将到来的Agentic AI时代打下技术与场景的双重基础。[7]
电商与本地生活整合。 豆包接入抖音商城和本地生活服务,有望成为新型的AI消费入口,开辟全新的商业化路径。
竞争对手加速追赶。 2026年春节期间千问月活从3105万飙升至2.03亿[6],阿里凭借强大的商业生态和补贴策略形成了对豆包的直接威胁。
App封锁风险。 2025年12月,豆包大模型通过AI手机助手实现跨应用操作功能,引发微信、支付宝、淘宝、拼多多及《王者荣耀》等主流应用实施功能限制。[3]系统级AI助手的发展面临生态阻力。
价格战可持续性。 价格战对大厂与小厂的影响完全不同,大厂能利用规模效应和资源优势来平衡降价带来的影响。[6]但长期持续的低价策略也可能压缩利润空间。
海外市场受限。 自2025年1月19日起,字节跳动及其子公司开发的应用程序将不再可供美国用户在App Store上下载或更新。[5]地缘政治因素对豆包的全球化扩张构成限制。
2026年被业内视为"通用AI入口元年",AI对C端入口的争夺,本质上是"模型、流量、生态、数据"的综合比拼。[8]建议豆包进一步强化与抖音电商、本地生活的深度融合,从"对话工具"升级为用户日常生活的"任务中枢",真正实现从"决策辅助"到"执行闭环"的跨越。
豆包2.0 Pro在IMO、CMO数学竞赛和ICPC编程竞赛中取得成绩,全面对标GPT 5.2与Gemini 3 Pro。[9]但在复杂推理、长链路任务等场景仍需持续追赶国际领先水平。建议在保持迭代速度的同时,重点突破指令遵循稳定性和专业领域深度能力。
AI手机是豆包从"应用级入口"向"系统级入口"升级的关键战略,但当前面临主流App封锁的生态阻力。建议采取更开放的合作策略,与手机厂商和App开发者共建互利生态,而非单方面侵入其他应用的操作空间。
当前豆包C端以免费为主,变现主要依赖B端API调用。建议在保持基础功能免费的前提下,逐步探索高级付费功能(如深度研究的高阶版本、专业场景智能体、AI云盘增值服务等),以及AI电商佣金、精准推荐广告等多元化收入来源。
随着用户规模突破2亿以及AI手机助手涉及更深层的系统权限,隐私保护和数据合规的重要性日益凸显。建议建立更透明的数据使用机制,主动参与行业标准制定,将合规能力打造为信任壁垒。
豆包作为字节跳动在AI时代的战略级产品,在短短两年多的时间里实现了从零到2亿月活的爆发式增长,成为中国最大的AI原生应用。其成功的核心驱动力在于字节跳动强大的流量生态协同能力、极致性价比的定价策略、以及高频迭代的产品能力。
从产品演进路径来看,豆包经历了"对话工具→智能体平台→多模态超级应用→AI消费入口→系统级AI助手"的多次战略升级,展现出字节跳动在AI产品化方面的强大执行力。
展望未来,豆包面临的核心挑战在于:如何在保持用户规模优势的同时,构建可持续的商业模式;如何在AI手机和系统级入口的竞争中突破生态壁垒;以及如何在千问等强劲对手的追赶下保持领先地位。未来得AI入口者将得天下[8]——这场关于AI超级入口的争夺战,才刚刚拉开帷幕。
报告日期:2026年3月19日
数据截止:基于最新公开可获取信息
Learn more: