作者:玄清
版本号:v2.0.0 (2024.03)
这是一个使用AI技术自动生成儿童图画书的工具。它能够根据给定的主题生成故事文本,并为每个场景自动生成配套的插图。
- GitHub: Picture_book_production
- 自动生成儿童故事文本
- 为每个故事场景生成精美插图
- 支持多语言(中文/英文)
- 生成Markdown格式的故事文件
- 自动处理图文排版
- 支持自定义故事主题
- 智能场景分析和图像生成
- 角色一致性增强
- 儿童教育工作者快速生成教学材料
- 家长为孩子创作个性化故事
- 出版社批量生成故事初稿
- 教育机构制作多语言儿童读物
- 创意写作教学辅助工具
graph TD
A[准备故事主题] --> B[OpenAI生成故事]
B --> C[场景分析]
C --> D[Fal.ai生成插图]
D --> E[Markdown排版]
E --> F[最终图画书]
- 故事生成:OpenAI API
- 图像生成:Fal.ai Flux
- 开发语言:Python
- 文档格式:Markdown
- 克隆项目到本地:
git clone https://github.com/whotto/Picture_book_production.git
cd Picture_book_production
- 安装依赖:
pip install -r requirements.txt
-
配置环境变量:
- 复制
.env.example
为.env
- 填入您的 API 密钥和其他配置
- 复制
-
准备故事主题文件(例如:test.md):
# 故事主题
- 一只勇敢的小兔子
- 森林里的魔法学校
- 小猫咪的环球旅行
- 运行程序:
python story_generator.py test.md
python story_generator.py_V2 test.md
可以在 .env
文件中调整以下参数:
OPENAI_API_KEY
: OpenAI API密钥FAL_KEY
: Fal.ai API密钥IMAGE_SIZE
: 图像尺寸(默认:landscape_16_9)INFERENCE_STEPS
: 图像生成的推理步数(默认:30)GUIDANCE_SCALE
: 图像生成的引导比例(默认:7.5)SCHEDULER
: 图像生成的调度器(默认:DDIM)OUTPUT_LANG
: 输出语言(支持:zh/en)
- 角色一致性增强
- 引入角色特征库管理系统
- 自动维护角色特征数据库
- 跨场景角色形象一致性检查
- 提示词模板系统
- 为每个角色创建详细的特征描述模板
- 记录并追踪角色的关键特征
- 确保特征描述的准确性和可复现性
- 自动检查新场景中的角色描述
- 确保角色形象在整个故事中保持一致
- 合理处理角色形象的变化(如换装)
- 为每个角色建立基础提示词模板
- 固定角色的关键特征描述
- 只允许改变与情节相关的动作和表情
- 建立角色一致性评估标准
- 定期检查生成图片的角色一致性
- 收集和分析不一致案例,持续优化
为了获得最佳的角色一致性效果,建议:
- 在故事开始前详细定义角色特征
- 使用统一的角色描述模板
- 定期检查生成的图像是否符合角色特征
- 及时调整和优化提示词模板
生成的内容将保存在以下目录:
- 故事文件:
generated_stories/
- 插图文件:
generated_images/
每个故事都包含:
- Markdown格式的故事文本
- 3张高质量的场景插图
- 中英双语内容(可选)
- 支持更多AI模型和图像生成引擎
- 添加Web界面,方便非技术用户使用
- 增加更多故事模板和主题
- 支持更多语言和文化背景
- 添加故事质量评估系统
- 集成语音生成功能
- 开发在线协作功能
- 博客:天天悦读
- Email:[email protected]
- GitHub:GitHub 仓库
MIT License
感谢以下工具和服务的支持:
- OpenAI API
- Fal.ai Flux
- Python社区
- Markdown