前些天字节跳动火山引擎举办Force原动力大会。
发布了豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型。
尤其是豆包1.6系列,非常重要。
为什么?
很多人说,今年是 AI Agent 落地元年。
Agent 产品第一步要做任务拆解规划。
这块非常依赖大模型的深度思考能力、工具调用能力,还有多模态支持能力。
火山引擎总裁谭待的说:
深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素
个人非常认同!
另外,因模型备案、数据安全、地缘政治等诸多原因。
国内 AI Agent 产品发展,必须依赖国内模型的强大。
Deepseek R1 非常棒!
但是,有点可惜,它不支持多模态,这样应用场景会很受限。
所以,拥有媲美 Deepseek R1 推理能力,又支持多模态的豆包 1.6 系列大模型发布。
无疑是国产 AI 产品的希望之光。
本文就一起了解、测试下豆包 1.6 系列模型。
看它能不能担起这个重任。
模型介绍Doubao-Seed-1.6含thinking、普通和flash三个版本。
分别侧重思考能力、均衡能力与推理速度。
模型特点• 支持256K超长上下文,单次输出可达16K tokens。
• 多模态输入(文本/图片/视频)
• 输出格式支持JSON Object、JSON Schema等结构化内容
• 支持Function Calling、批量推理
比较有趣的是,模型支持三种思考模式:开启深度思考(enable),关闭深度思考(disable)、自动判断(auto)。
就像我们的大脑,有时靠直觉和经验(系统1),有时要慢下来推理(系统2),这一切都是自动发生的。
豆包 1.6 系列模型也实现了类似机制。
如何体验豆包 1.6大模型竞争激烈。
为让大家先试用起来,火山引擎提供 50万 tokens 免费额度。
字节产品或工具访问1. 火山方舟直接体验
https://console.volcengine.com/ark/region:ark+cn-beijing/
直接就能用。
注意:进入页面里才能上传图片、视频
2. Trae CN
国内版的Trae可以选 豆包 1.6 模型
https://www.trae.com.cn/
打开火山方舟,点击在线推理->创建推理接入点
https://console.volcengine.com/ark/region:ark+cn-beijing/endpoint
输入接入点名称(如doubao1.6),选择想要接入的 Doubao-Seed-1.6 模型,点确认接入。
记得复制模型ID
另外,接入模型需要API key,如果之前没创建过。
https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey
复制 API Key,还有上面模型 ID,下面教大家配置到 AI 聊天客户端。
Cherry Studio 配置豆包 1.6目前口碑最好的开源免费的 AI 客户端之一,下载地址:
https://www.cherry-ai.com/
打开设置->模型服务->火山引擎,勾选开启。
输入API 密钥,API地址填https://ark.cn-beijing.volces.com/api/v3/
点击“添加”,输入模型 ID 保存(类似 ep-20250124183319-xxxx 或 doubao-seed-1-6-xxx)
就可以正常使用对话。
可能模型太新,Cherry Studio还没不支持图片上传对话。(我催一催)
n8n 接入(进阶)为方便自动化批量测试Prompt,也能用 http request 方式配置到 n8n 中。
配置有点复杂,改天单独出个教程。
好处:通过工作流判断是否有图,走不同生成任务,还支持子工作流,并行执行测试任务。
配置好后,一键点击执行,静等谷歌表格的生成结果。
下面我会用自己写的一系列 Prompt 。
来测试豆包 1.6 的各种网页和内容生成能力。
生成苹果Liquid Glass风格网页前几天刚写的提示词,用于生成类似苹果最新设计风格的网页。
提示词如下
https://xiangyangqiaomu.feishu.cn/wiki/TPDhwuYgViiU73kLiQfcd0zqnjg
豆包 1.6 先思考了10s,然后才开始写代码。
“思考过程”看起来很清晰。
生成效果如下
引文卡片马卡龙色渐变完成度 ok。
卡片上抬和扫光动效实现也没问题。
查看网页
https://www.32kw.com/view/ed116f9
生成英语学习网站把任何内容变成英语学习网站。
闪卡背单词 -> 中英双语阅读 -> 阅读测试 -> 打卡海报
生成效果
效果很符合预期,一次生成,所有模块都可以正常运行。
体验网址
https://www.32kw.com/view/f21c573
这是以前发过的付费提示词。
关注本公众号,回复“英语”免费获取访问密码。
https://xiangyangqiaomu.feishu.cn/wiki/E36twRT7qiD9LvkjJw9c8Lwanbd?fromScene=spaceOverview
数据可视化AI 整理的一张国外大模型定价表。
试试交给豆包 1.6 ,能不能制成一个美观的网页,方便查看和查找。
这个任务完成有点超预期。
不仅生成了漂亮网页,加上了柱状图。
还实现了下拉菜单筛选查看。
提示词也很简单,就是上传图片。
要求根据附件图片中的数据生成一个精美的网页。
查看网页
https://www.32kw.com/view/d9c5ce8
生成不同风格的金句卡片知识卡片生成提示词
https://xiangyangqiaomu.feishu.cn/wiki/H26ywe3tXij5iQkICyycDVXDnEb?fromScene=spaceOverview
从29中风格中随机选几种生成卡片。
生成效果如下:
还算OK,但感觉不如Claude 4 Sonnet 稳定,美观度还有提升空间。
查看全部金句
https://www.32kw.com/view/bd8f9ed
网页截图复刻本想搜个企业官网复刻。
没想到谷歌到大名鼎鼎的设计网站 Dribble 的一个页面。
刚好挑战下豆包的设计还原能力和前端美感。
https://dribbble.com/tags/%E4%BC%81%E4%B8%9A%E5%AE%98%E7%BD%91
生成效果如下:
画面和风格理解不错,比如用了Dribble标志性的粉色和黑色。
模块也基本都有,另外还自己发挥生成了一个更完整全面的footer。
提示词也很简单。
“参考附件截图,帮我复刻一个类似的网站”
查看网页
https://www.32kw.com/view/cd396b8
生成3D教育网站给定任何主题或内容,生成 3D 教学网站。
北京四合院结构拆解能一次运行成功,但生成效果简陋,也有一些样式上的小瑕疵。
豆包还需要加油,尤其在 3D 网页生成方面,可能要更多、更好的数据训练。
体验地址:
https://www.32kw.com/view/39a25b2
对比看,还是 Claude 更牛逼。
https://www.32kw.com/view/997927c
3D 可视化提示词:
https://xiangyangqiaomu.feishu.cn/wiki/N6DTwhykIiGhfakYbvocvBCpnXc?fromScene=spaceOverview
PPT网页生成给出任何主题或内容,让AI生成PPT网页。
看豆包 1.6 的推理过程,还算比较靠谱。
但实际任务生成质量比较一般,配色和美感都有提升空间。
提示词
https://xiangyangqiaomu.feishu.cn/wiki/Gn6HwZsGqiWVtekoDHkcaTd1njc?fromScene=spaceOverview
标题生成最后,来到对自媒体人最实用的传统项目。
给豆包一篇文章或一段文字,生成微信公众号爆款潜力标题。
提示词如下:
https://xiangyangqiaomu.feishu.cn/wiki/EKX2wfBsAiVPIjky5HPcWKqKnDd?fromScene=spaceOverview
让给《纳瓦尔宝典》这本书生成爆款标题:
⭐️ (9.0 分) 《纳瓦尔宝典》里的 3 个财富真相,越早知道越好
⭐️ (8.5 分) 纳瓦尔的 “幸福公式”,为什么让 10 万创业者瞬间清醒?
⭐️ (8.3 分) 《纳瓦尔宝典》:赚大钱的秘诀,居然和努力无关?
看起来似乎还不错。
后记豆包 1.6 的发布,让我们看到了国产 AI 在深度思考、多模态、工具调用等关键能力上的追赶和突破。
不再只是“能用”,而是真正开始“好用”。
在实际体验中,我们既看到了它在网页生成、数据可视化、内容创作等场景的亮点,也发现了和国际顶尖模型相比还有提升空间。
但正因为如此,才更让人期待国产 AI 的后劲。
AI 的发展,离不开每一位开发者、产品人、普通用户的尝试和反馈。
你用得越多,模型就进步得越快。
也许你今天还觉得它只是个工具,但很快你会发现,它能成为你工作、学习、创造力的“加速器”。
如果觉得有收获,欢迎转发给朋友和同事。