共计 1908 个字符,预计需要花费 5 分钟才能阅读完成。
5 分钟搞定 AI 儿童绘本视频?豆包 + 即梦实战工作流,直接抄作业!
最近后台被问爆了:“星哥,怎么用 AI 做儿童睡前故事视频?”、“自己不会画、不会剪,能跑通吗?”
别慌。今天直接把压箱底的 **「零门槛 AI 绘本视频流水线」** 掏出来。不用复杂软件,不拼美术功底,靠 豆包(写本) + 即梦 AI(出片) + 剪映 /TTS(配音剪辑),5 分钟就能跑通一条完整闭环。
新手跟着做就能出片。建议先 ⭐ 收藏,实操时随时对照。

开工前,备好三件“神器”
| 工具 | 核心作用 | 备注 |
|---|---|---|
| 豆包 | 故事创作 / 分镜拆解 / 提示词优化 | 免费额度充足,逻辑强 |
| 即梦 AI | 角色一致性控制 / 图生视频 | 内置「故事创作」模式,防崩脸 |
| TTSMAKER / 剪映 | AI 配音 / 字幕对齐 / BGM 合成 | 剪映自带 TTS 已足够,TTSMAKER 音色更多 |
Step 1:豆包 一键生成绘本故事
没有现成故事?直接扔提示词。星哥总结的万能公式:[受众年龄] + [核心主题] + [语言风格] + [字数 / 结构限制]
📝 直接复制这段提示词:
“我是一名 8 岁孩子的家长,想创作一个关于‘勇气’的儿童睡前故事。请确保语言符合这个年龄段的儿童认知,情节温馨有趣,带有小反转,全文控制在 300 字以内。输出时请分段,每段对应一个画面场景。”
💡 进阶技巧: 如果你已有现成绘本,只需输入:“请阅读以下故事,熟悉后回复‘已掌握’。【故事】:(粘贴全文)” 即可无缝衔接下一步,无需重复生成。
小松鼠的勇敢魔法
森林里的小朵朵,是一只胆子小小的松鼠。她最怕黑,从来不敢独自走过夜晚的小树林,哪怕月光轻轻洒在地上,她也会紧紧躲在妈妈身后。这天傍晚,一阵晚风刮过,兔弟弟的小风筝被吹到了黑漆漆的树林树枝上。大家望着幽暗的树林,谁都不敢上前,兔弟弟急得快要哭了。小朵朵看着难过的小伙伴,心里轻轻冒出一个小念头:我想帮帮他。她攥紧小爪子,深吸一口气,慢慢走进了夜色里。可奇妙的事情发生啦!原本黑漆漆的树林,并没有那么可怕。萤火虫围着她飞舞,小草轻轻摇晃打招呼,温柔的晚风一直在陪着她。小朵朵顺利取下风筝,跑回小伙伴身边。原来勇气从不是不怕黑,而是心里害怕,也愿意勇敢迈出第一步。今晚,小朵朵拥有了最珍贵的魔法。

Step 2:AI 自动拆解分镜脚本
故事有了,怎么变成视频?继续让 豆包 当“分镜导演”。
📝 提示词:
“请以上述故事为剧本,设计一个 1 分钟左右的短视频分镜脚本。要求以表格形式输出,包含:序号、景别、运镜方式、画面描述、对应文案、时长(秒)。同时,请为故事主角生成一段详细的形象描述提示词(用于后续 AI 绘画保持角色一致)。”
拿到表格后,追加第二步指令(关键!):
“请将表格中每个‘画面描述’补充具体细节(主体动作、环境光影、色彩倾向),统一添加前缀:
3D 卡通风格,皮克斯质感,柔和光照,儿童绘本插画,输出为可直接用于 AI 绘图的提示词。”
Step 3:即梦 AI 搞定角色一致性与视频生成
很多人在这一步翻车:AI 画的角色脸总变。即梦的 **「故事创作」模式 ** 专门解决这个痛点。
🔧 实操路径:
打开即梦 AI → 选择顶部 「视频生成」。
景别:中景。运镜方式:固定镜头
画面描述:3D 卡通风格,皮克斯质感,柔和光照,儿童绘本插画,整体暖橘色低饱和色调,傍晚森林柔光氛围,暖黄微光漫射整片森林,光影柔和无硬阴影。小巧圆润的小松鼠朵朵紧紧依偎在松鼠妈妈怀里,身体微微蜷缩、小爪子抓着妈妈的绒毛,脑袋轻轻低垂,偷偷望向幽暗的夜色树林,眼神胆怯懵懂,周围青草绿植呈嫩绿色,树干暖棕色调,画面温馨治愈。对应文案:森林里的小松鼠朵朵,是一只胆子小小的松鼠,她最害怕黑夜。时长:10 秒

Step 4:配音合成 + 剪映一键成片
画面动起来,声音不能拉胯。
https://ttsmaker.cn/
🎧 工作流:
- • 配音: 打开 TTSMAKER 或剪映「文本朗读」,按分镜顺序粘贴文案。儿童故事首选
温柔女声或童声旁白,语速调至0.9x更贴合睡前氛围。 - • 剪辑: 将视频片段拖入剪映时间轴 → 导入配音音频 → 使用 「自动识别字幕」 一键匹配 → 添加轻柔 BGM(推荐八音盒 / 钢琴轻音乐,音量调至 10%~15% 不抢人声)。
- • 导出: 检查卡点与转场,微调 1~2 处生硬衔接,导出 1080P 成片。
星哥实操避坑指南
| 常见痛点 | 解决方案 |
|---|---|
| 角色频繁崩脸 | 在即梦开启「角色参考图」,并固定同一组 Seed 值生成 |
| 视频动作扭曲 | 提示词避免“剧烈奔跑 / 复杂打斗”,改用“缓慢走近 / 轻轻抚摸 / 抬头仰望” |
| 画面构图混乱 | 多使用镜头语言控制:特写 / 中景 / 俯拍 / 微距,少用抽象形容词 |
| 配音机械感重 | 在剪映中手动调整停顿,或在句末添加 (轻笑)、(呼吸声) 等环境音 |
写在最后
AI 不是取代创作,而是把技术门槛彻底打碎。以前做一条绘本视频要抠图、手绘、剪辑熬几天,现在 5 分钟跑通流程,剩下的精力,全都可以留给创意打磨与亲子陪伴。






