Navigate to WaytoAGI Wiki →
Home/All Questions
老照片修复工具推荐
以下是一些老照片修复工具推荐: 视频放大工具: https://www.topazlabs.com/topazvideoai 百度网盘分享的 Topaz 全家桶:链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 ,提取码:16d1 ,复制这段内容打开「百度网盘 APP 即可获取」 Kraken.io:主要用于图像压缩,也提供免费的图像放大功能,能保证图像细节清晰度。 Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术能将图像放大并赋予艺术效果,支持多种滤镜和风格。 RealESRGAN:https://replicate.com/nightmareai/realesrgan ,这是基于 RealESRGAN 的图像超分辨率增强模型,有人脸修复和可调节放大倍数选项,但使用几次要收费。 Photoshop Generative AI 功能:主要工具包括 Remove tool、Clone brush、Generative fill 以及 Neural filters,链接:https://x.com/xiaohuggg/status/1692751080973828468?s=46&t=F6BXooLyAyfvHbvr7Vw2g SD 图生图,重绘幅度小一点 图片放大工具: 本地工具放大:https://www.upscayl.org/download 开源工作流: 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn ,腾讯开源的模型,能恢复老照片,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 此外,将照片放入后期处理中,使用 GFPGAN 算法可将人脸变清晰,具体可参考文章—— 。
2025-03-05
如何在电脑硬件配置普通的情况下,用AI搭建知识库
在电脑硬件配置普通的情况下,用 AI 搭建知识库可以参考以下几种方法: 使用阿里云百炼: 1. 上传文件:在百炼控制台的中的非结构化数据页签中点击导入数据,根据引导上传相关文档。 2. 建立索引:进入,根据引导创建一个新的知识库,并选择刚才上传的文件,其他参数保持默认即可。 3. 选择向量存储类型时,如果您希望集中存储、灵活管理多个应用的向量数据,可选择 ADBPG。 4. 引用知识:完成知识库的创建后,可以返回进入到刚才创建的应用设置界面,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。 使用 GPT: 要搭建基于 GPT API 的定制化知识库,涉及到给 GPT 输入(投喂)定制化的知识。但 GPT3.5,也就是当前免费版的 ChatGPT 一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字。为了使用 GPT 的语言能力来处理大量的领域知识,OpenAI 提供了 embedding API 解决方案。参考 OpenAI embedding documents。embeddings 是一个浮点数字的向量(列表)。两个向量之间的距离衡量它们的关联性。小距离表示高关联度,大距离表示低关联度。 使用 Dify: 1. 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式,并对数据进行清洗、分段等预处理,确保数据质量。 2. 创建数据集:在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集,为数据集编写良好的描述。 3. 配置索引方式:Dify 提供了三种索引方式供选择,包括高质量模式、经济模式和 Q&A 分段模式,根据实际需求选择合适的索引方式。 4. 集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用,在应用设置中,可以配置数据集的使用方式。 5. 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代,定期更新知识库,增加新的内容以保持知识库的时效性。
2025-03-05
ai消除字幕
以下是为您找到的关于 AI 消除字幕的相关信息: VSR 字幕去除工具:利用 AI 去除视频和图片中的字幕,支持智能填充处理,确保视觉质量。链接:
2025-03-05
自制数字人用什么工具
以下是一些自制数字人的工具和方法: 剪映: 打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。 可根据提供的内容生成对应音视频,并添加到当前视频中。 能为数字人增加背景图片,如通过“媒体”菜单导入图片。 支持增加字幕,点击文本智能字幕识别字幕,软件会自动将文字智能分段并形成字幕。 Heygen:可用于制作数字人。 按照上述步骤操作,即可完成数字人视频的制作。点击右上角的“导出”按钮,可导出视频以作备用。如果希望数字人换成自己希望的面孔,可能需要用其他工具来进行换脸。
2025-03-05
ai数字人
AI 数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:强调自驱动,人为干预更少,技术实现更复杂。其大致流程包含三个核心算法: ASR(语音识别):能将用户音频数据转化为文字,便于数字人理解和生成回应,以实现像人与人一样的对话交互。 AI Agent(人工智能体):充当数字人的大脑,可直接接入大语言模型,拥有记忆模块等使其更真实。 TTS(文字转语音):将数字人依靠大语言模型生成的文字输出转换为语音,保持语音交互一致性。 此外,在摊位活动中,有关于 AI 数字员工的主题,为企业和个人提供数字劳动力,解决重复性、创意性工作难题,体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。还有 AIGC 数字艺术挂画、数字生命赋予每个人的新生、AI 智能体应用、AI 心理疏导、AIGC(图生图)趣味定制、AI 数字人定制等相关内容。
2025-03-05
如何用waytoAGI
以下是关于如何使用 WaytoAGI 的详细介绍: 1. 加入飞书群:您可以在 WaytoAGI 飞书知识库首页找到加入飞书群的链接(最新二维码请在获取),然后点击加入,直接@机器人即可。 2. 在网站首页提问:您可以在 WaytoAGI.com 的网站首页,直接输入您的问题,即可得到回答。 3. 点开链接查看:不用注册,不用花钱,直接点就能看。 4. 按需求选择内容:比如您想学 AI 绘画,就去看“AI 绘画”部分;想找 AI 工具,就去“工具推荐”部分。内容分得清清楚楚,想学啥都能找到。 5. 从特定板块开始:以 Agent 板块为例,您可以从下往上看,一个一个点进去查看相关视频。比如链接:。 如果您看了还有不懂的,或者想跟别人交流,可以加入社群,大家一起讨论。WaytoAGI 是一个帮助您快速入门 AI、学会用 AI 搞事情的“武器库”,无论您是小白还是想靠 AI 赚钱,都能从中受益。
2025-03-05
deepseek相关的文档
以下是与 DeepSeek 相关的文档和信息: 在 2025 年 2 月 6 日的“【今晚 8 点】聊聊你怎么使用 DeepSeek!”中,提到了以下内容: DP 模型的功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 使用场景:包括阅读、育儿、写作、随意交流等方面。 案例展示:通过与孩子共读时制作可视化互动游戏,以及左脚踩右脚式的模型交互来展示 DP 模型的应用。 音系学研究:对音系学感兴趣,通过对比不同模型的回答来深入理解,如 bug 和 DIFF SIG,探讨语言概念在音系学下的心理印象等。 大模型取队名:与大模型进行多轮对话来取队名,通过不断约束和披露喜好,最终得到满意的队名及相关内容。 此外,2 月 6 日的宝玉日报中提到: Dario Amodei 认为 DeepSeek 进入前沿 AI 竞赛,但美国应保持领先优势。 强调“没有民族主义敌意”,依旧欢迎华裔科学家加入 Anthropic。 批评 DeepSeek 安全性差,称其“测试过的模型里最糟糕”。相关文稿:
2025-03-05
Prompt 有哪些范式
以下是关于 Prompt 范式的相关内容: 基础篇: 起手式因人而异,可根据不同作图需求尝试不同场景下的“范式”,如面向人像、风景、物品生成等。 人像生成的反向提示词包括不要出色色、不要出错手错脚错身体、不要低质量图、不要水印等,也鼓励自行梳理。 其他注意事项:越重要的 tag 越往前放;同类型 tag 放在一起;控制 tag 总数在 75 个以内;无关紧要的 tag 不要留。 原理与应用: 简单来说,Prompt 是和大模型交互的语言模板,用于输出对大模型响应的指令,提升回答准确性。 从专业角度,Prompt 给大模型提供模板,包括要求、输入和输出限制,让大模型在限制下得出概率最大的答案。 法律人视角: Prompt 指给人工智能系统提供的信息或问题,引导其产生特定回答或执行特定任务。 建议框架及格式:CRISPE,包括 Capacity and Role(能力与角色)、Insight(洞察)、Statement(陈述)、Personality(个性)、Experiment(举例)。并分别举例说明了每个部分的具体内容。
2025-03-05
UI交互设计大模型
以下是关于 UI 交互设计大模型的相关内容: ComfyUI ollama 本地大模型部署: 1. 先下载 ollama 安装。安装好后不会有任何界面弹出,可以在电脑桌面右下角或者隐藏图标里面找到。 2. 之后再去下载对应的模型,选择模型,复制对应的命令。 3. 打开命令行界面,输入对应的模型获取命令,等待下载完成。 4. 下载的模型会保存到 D:\\ollama\\blobs 。 5. Docker 安装时会下载一些文件,安装后改下目录,不要放在 C 盘。 6. Open webui 安装,输入相关命令。安装成功后,回到 docker 点击,会自动打开网页。第一次使用,需要注册一个账号,选择一个下载好的模型就可以开始使用。 7. 若出现端口占用的错误,运行下面两条命令可以解决。 8. 相关链接: ComfyUI ollama:https://github.com/stavsap/comfyuiollama?tab=readmeovfile Ollama:https://ollama.com/ Docker:https://www.docker.com/ Open webui:https://openwebui.com/ 通过 Open WebUI 使用大模型: 在默认情况下,与大模型的交互在终端中进行,但这种方式较古老。大模型有交互客户端 Open WebUI。Open WebUI 是 github 上的开源项目,参考其官方文档 https://docs.openwebui.com/gettingstarted/ 进行下载和安装。 1. 安装之前先安装 Docker,Win 或 Mac 系统参考文档:,注意下载适配电脑系统的版本。Linux 系统请自行上网找教程。 2. 官方文档中有两种安装 Open WebUI 的方式:ollama 和 open webui 一起安装、仅仅安装 open webui。若已安装 ollama,只需要安装 open webui 即可,复制相关命令。安装下载完成后即可使用。 大模型时代的产品特点: 大模型的交互方式是 NUI(自然用户界面),通过自然语言文本、语音、输入输出图片等直接交互,与现在熟悉的 GUI(图形用户界面)差异很大。现在习惯在 GUI 界面通过点击按钮与机器交互,需要一定学习成本。而 NUI 更符合人的直觉,用户几乎无需特别学习,通过对话操作,但大模型产品对普通用户使用门槛较高,用户留存率和粘性不如主流 App。若未来大模型产品都是 NUI 的,可能对整个信息产业带来深远影响。
2025-03-05
请给我提供胎教级的怎么做COZE
以下是关于如何使用 Coze 的详细介绍: 一、Coze 概述 字节的官方解释:Coze 是新一代一站式 AI Bot 开发平台。无论是否有编程基础,都能在该平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单问答到处理复杂逻辑对话。并且,可将搭建的 Bot 发布到各类社交平台和通讯软件上与用户互动。 个人认为:Coze 是字节针对 AI Agent 领域的初代产品,在 Coze 中称 AI Agent 为 Bot。 字节针对 Coze 部署了两个站点: 1. 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用字节自研的云雀大模型,国内网络可正常访问。 2. 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(可参考文档白嫖 ChatGPT4) 访问需突破网络限制的工具,参考文档:https://www.coze.com/docs/zh_cn/welcome.html 二、Coze 使用教程 AI Agent 的开发流程: Bot 的开发和调试页面布局主要分为以下几个区块: 1. 提示词和人设的区块 2. Bot 的技能组件 3. 插件 4. 工作流 5. Bot 的记忆组件 6. 知识库 7. 变量 8. 数据库 9. 长记忆 10. 文件盒子 11. 一些先进的配置 12. 触发器:例如定时发送早报 13. 开场白:用户和 Bot 初次对话时,Bot 的招呼话语 14. 自动建议:每当和 Bot 一轮对话完成后,Bot 给出的问题建议 15. 声音:和 Bot 对话时,Bot 读对话内容的音色 三、Coze 实操 徒手捏 Bot 1. 标准流程搭建产品问答机器人(重要!) 搭建流程 工作流 Start 节点:每个工作流默认都有的节点,是工作流的开始。定义了一个输入变量:question,question 会在启动工作流的时候由 Bot 从外部获取信息传递过来。 知识库节点:输入为 Query(用户的查询),输出为一个数组,承载着从知识库中查询出来的匹配片段。在 Start 节点后面接入知识库节点,目的是将用户的问题跟知识库进行匹配。注意知识库中的几个概念:Search strategy(查询策略)包括 Hybrid search(混合查询)、Semantic search(语义查询)、Full Text search(全文索引)。 变量节点:有设置变量给 Bot 和从 Bot 中获取变量两个能力。 大模型节点:输入可以自己定义数量,本质是给大模型的参数。Prompt 是大模型的提示词,用来设定大模型的角色和工作内容,可使用{{}}来使用输入变量,输出为大模型的回答。 数据库节点:输入由用户定义多个参数,输出如果数据库是查询作用,则包含查询出来的内容,SQL 通过 SQL 语句告诉数据库要执行的动作。 End 节点:工作流中的默认节点,作用是最终结果的输出,输出方式主要有两种,直接返回变量,由 Bot 根据变量生成回答,或根据变量使用特定格式直接生成回答。 测试工作流:编辑完成的工作流无法直接提交,需要测试。点击右上角的 test run,设定测试参数,查看测试结果,完成后可发布。 希望以上内容对您有所帮助!
2025-03-05