Chat with Wiki - 图片底下生成字幕的工具

Answer

以下为一些可以生成图片底下字幕的工具及相关方法：

Trae 多模态复刻产品：
- 创意来自@南瓜博士，具体原文可看其复现的文章：https://mp.weixin.qq.com/s/CEJ6ite843M4hPuyT5jB6Q 。
- 核心策略是使用截图让 Trae 理解后生成功能描述，修改后再让 Trae 完成开发和优化。
- 开始时需在本地新建一个文件夹，再用 Trae 打开该文件夹。
- 将图片发给 Trae，并带上相应提示词。
- 开发完成后在本地文件夹打开 index.html ，可能需要继续优化，如添加每行字幕之间的分割线、切割图片底部等。
- 公众号回复“字幕图片”，获取源代码。保存成.html 文件，在浏览器打开就能用。
某软件（未提及具体名称）：
- 在显示区域，拖动背景图的一个角将图片放大到适合尺寸，如覆盖视频窗口，并将数字人拖动到合适位置。
- 点击文本 - 智能字幕 - 识别字幕，点击开始识别，软件会自动将文字智能分段并形成字幕。
- 数字人视频完成后，点击右上角的“导出”按钮，导出视频以作备用。若要换脸，需使用另一个工具。

Content generated by AI large model, please carefully verify (powered by aily)

References

该创意来自@南瓜博士具体原文可以看南瓜博士复现的文章：https://mp.weixin.qq.com/s/CEJ6ite843M4hPuyT5jB6Q在她的文章里有详细的需求描述和开发过程，大家照着做就能复现了。那今天黄叔想教会大家的，其实是另外一个技巧：[heading2]用Trae多模态复刻产品[content]核心策略是，使用截图让Trae理解后生成功能描述，修改后再让Trae完成开发和优化！开始的第一步，还是在本地新建一个文件夹，再用Trae打开该文件夹，我们在上一节已经都做过演示，这里就不再展开了，如果你忘记了，可以点击会回看：[第一步：在你的电脑上新建一个文件夹](https://waytoagi.feishu.cn/wiki/UspJwJk95iKoegkoUdWcmX7rnib#share-H75HdPiFbow8l3xdiYEcuYGnnnb)[第二步：使用Trae打开这个文件夹](https://waytoagi.feishu.cn/wiki/UspJwJk95iKoegkoUdWcmX7rnib#share-QYVodXqiTokZoKxsrMFciW1rnPf)继续，按照这个流程，我们一开始需要将上面的图片，发给Trae，并带上下面的提示词：大体是这样的：然后发送给Trae。没想到Trae直接就开始复刻了：等待一会后，开发完成，到本地文件夹打开index.html后，是这样的：这次就完成了！下载后是这样的：可以说基本是完成了，不过仔细看，底部字幕是每行之间没有分割线，另外也没有切割图片底部，我们可以继续优化：这回好了：

用 Trae 开发一个小小小工具

点击右上角应用。然后在文件夹找到它，双击浏览器打开，测试。效果不太对，生成的图片如下，重叠的部分盖住了之前的图片～～把结果贴给AI，把错误现象和期望的表现描述一下。让AI再迭代。AI第一次改把程序改得更糟糕了，可能是忘了最开始的要求是啥。于是把最初的图片也贴给它做对比。这下成功了。还有个小问题，再改。三轮对话终于搞定。接下来做保存功能。再调整细节：后面这几步，对程序员来说是宁可直接撸代码的。但测功能嘛总得测全了，看技术小白是不是也能搞定。实验下来很顺畅。是的，就这么简单。公众号回复“字幕图片”，获取源代码。保存成.html文件，在浏览器打开就能用。我是在技术和教育圈来回串的贪玩的好奇星人。欢迎点赞点收藏关注加星。也期待多多评论区交流。我曾写过的与AI编程有关的文章

实战：每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法！

在显示区域，拖动背景图的一个角，将图片放大到适合的尺寸，比如覆盖视频窗口。并将数字人拖动到合适的位置:3.3增加字幕点击文本-智能字幕-识别字幕，点击开始识别：软件会自动将文字智能分段并形成字幕：至此，数字人视频就完成了。点击右上角的“导出”按钮，导出视频以作备用。如果你希望数字换成自己希望的面孔，比如这个：就需要用另一个工具来进行换脸了。