Chat with Wiki - 推荐一个能读取视频并总结出视频内容的ai

Answer

以下为您推荐能读取视频并总结视频内容的 AI 工具及方法：

GPT 系列：
- 对于 B 站等有字幕的视频，若视频栏下有字幕按钮，可通过安装油猴脚本Bilibili CC 字幕工具获取字幕，将字幕复制发送给 GPT 进行总结。
- 有开发者利用 OpenAI 升级的 API 对足球比赛视频进行全 AI 解说，具体步骤包括提取视频帧（如使用 OpenCV 初始化视频文件读取，遍历视频逐帧处理并编码为 base64 格式）、构建描述提示（创建结构化提示，定义 GPT 请求参数）、发送 GPT 请求。
视频内容分析模型：可在https://huggingface.co/spaces/nateraw/lavila上传视频后生成视频内容的文本描述。

您可以根据实际需求选择使用。

Content generated by AI large model, please carefully verify (powered by aily)

References

除了聊天内容之外，我们还能让AI总结整理各种文章（文章不超过2w字，否则就超出token了）例如，我复制了我的一篇文章给它总结：打开后直接全选复制全文，然后粘贴发送给GPTs，它就开始总结了，很方便，GPT4它能识别出哪些部分属于重点内容。[heading3]2、B站视频[content]你可能会疑惑，GPT不是无法处理视频内容吗，这是怎么做到的？答案是视频字幕。我用这个视频举例：https://www.bilibili.com/video/BV1VL411U7MU/?spm_id_from=333.337.search-card.all.click&vd_source=e05ea46c768d112737bc19e721da8967打开这个视频，如果你能在视频栏下面有一个字幕按钮，说明这个视频作者已经上传了字幕或者后台适配了AI字幕。那我们把这些字幕弄下来，再发给AI执行内容总结任务，是不是就达到了总结视频的效果？是的，目前大部分用AI总结视频的工具/插件/应用都是这么干的。那接下来的卡点就是，怎么把字幕文字内容给提取出来，用语音转文字？不，效率太低了。像这种有字幕的视频，我们可以装一个油猴脚本：[Bilibili CC字幕工具](https://greasyfork.org/zh-CN/scripts/378513-bilibili-cc%E5%AD%97%E5%B9%95%E5%B7%A5%E5%85%B7)安装之后，刷新浏览器，点击字幕，你会看到多出一个“下载”按钮点击下载按钮，会弹出下面这个窗口，你可以选择多种字幕格式，带时间的或者不带时间的：接下来，还是老办法，将字文字内容全选复制发送给GPTs即可。当然，总结完视频内容之后你继续向AI提问更多细节内容或者与它探讨视频内容。

AIGC Weekly #03

视频内容分析模型，上传视频后可以生成视频内容的文本描述。来源：[https://huggingface.co/spaces/nateraw/lavila](https://huggingface.co/spaces/nateraw/lavila)适用于Google表格的无代码机器学习插件。来源：[https://twitter.com/CyrusShepard/status/1601303833518317569](https://twitter.com/CyrusShepard/status/1601303833518317569)对Chat GPT二次封装的产品，可以访问互联网数据以及支持直接生成图片。来源：[https://writesonic.com/chat](https://writesonic.com/chat)Luma Imagine 3D-一种用文本创建3D的新方法。来源：[https://captures.lumalabs.ai/imagine](https://captures.lumalabs.ai/imagine)一个浏览器插件，可以用AI读取你的邮件内容并帮你生成回复。来源：[https://twitter.com/saviomartin7/status/1602544503335837698](https://twitter.com/saviomartin7/status/1602544503335837698)Luma Imagine 3D-通过文本创建3D模型。来源：[https://captures.lumalabs.ai/imagine](https://captures.lumalabs.ai/imagine)RF Diffusion模型，帮助设计蛋白质结构的扩散模型。来源：[https://stephanheijl.com/rfdiffusion.html](https://stephanheijl.com/rfdiffusion.html)PubMed GPT：生物医学文本的特定领域大型语言模型。来源：[https://www.mosaicml.com/blog/introducing-pubmed-gpt](https://www.mosaicml.com/blog/introducing-pubmed-gpt)

OpenAI 首届开发者大会11月7日

/1721781704845914459|文本|标签|备注|附件||-|-|-|-||体育解说||足球比赛的AI全解说。当很多人还沉浸在OpenAI DevDay带来的兴奋总结发布会亮点时，有开发者已经利用此次升级的API做了个足球比赛视频的全Al解说。解说词可不是人写的，而是AI自己看视频总结出来的。 1、提取视频帧： •使用OpenCV初始化视频文件的读取。 •遍历视频，逐帧处理，并将每一帧编码为base64格式以供处理。 2、构建描述提示： •创建一个结构化的提示，角色为“用户”，包含视频描述的请求，并包括一部分编码的base64视频帧（例如，每十帧取一帧）。 •定义GPT请求的参数，如模型（“gpt-4-vision-preview”），提示信息，API密钥和最大令牌限制。 3、发送GPT请求： •使用定义的参||分享并发现OpenAI提供的最佳G