Navigate to WaytoAGI Wiki →
Home/All Questions
根据代码生成需求文档的prompt
以下是关于根据代码生成需求文档的 prompt 相关内容: 背景: 手动写 prompt 很麻烦,只想在出现缺陷时修修改改,所以让 GPT 来起草提示词。 结论: 1. 起草效果不错,按照结构化 prompt 结构输出,具有朴实有用的 Skills,符合先后以及事务本身处理顺序的 Workflows,至少有 3 个支持 Workflows 思维链陈述的 Examples。 2. 节省时间以及脑力,Skills、Workflows、Examples 初稿不用再思考。 3. API 接口中“gpt40613”效果可用且优秀,chatGPT 网页版不理解这个提示词,生成稳定,下方是连续测试 4 次的提示词及其效果。 优化方向:暂无 生成需求文档的步骤: 1. 生成设计方案:将需求抽象简化,分别用不同的 Prompt 生成多份设计方案进行对比。通过调整 Prompt 找到最优方案,避免限制 AI 的发挥空间。 2. 生成代码:确定方案后,完善细节,将完整设计交给 AI 生成代码。如果生成结果有问题,通过调整 Prompt 或更换模型反复优化。 关于 prompt 的基础知识: 1. prompt 是一段指令,用于指挥 AI 生成您所需要的内容,每个单独的提示词叫 tag(关键词)。 2. 支持的语言为英语(不用担心英语不好的问题,),另外 emoji 也可以用。 3. 语法规则: 用英文半角符号逗号,来分隔 tag。注意逗号前后有空格或者换行都不影响效果。 改变 tag 权重: :数值从 0.1~100,默认状态是 1,低于 1 就是减弱,大于 1 就是加强。 括号,权重就重 1.1 倍,每加一层括号就反向减弱 1.1 倍。 进行 tag 的步数控制(高级玩法):就是 SD 先按您输入的这个 tag1 开始生成,然后在达到您设定的步数之后,tag1 停止产生作用,此时 tag2 再参与到对内容生成的影响。,数字大于 1 理解为第 X 步前为 tag1,第 X 步后变成 tag2,数字小于 1 理解为总步数的百分之 X 前为 tag1,之后变成 tag2。
2025-03-14
数字人
数字人是运用数字技术创造出来的人,目前业界没有准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业和直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-03-14
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息以达不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是数字人视频的制作方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频备用。若希望数字人换成自己希望的面孔,则需用另一个工具进行换脸。
2025-03-14
我是景区小卖部的老板,我想通过学习AI提高自己的经营管理水平
对于您作为景区小卖部老板希望通过学习 AI 来提高经营管理水平的需求,目前暂时没有相关的具体内容。但一般来说,您可以考虑以下几个方面: 1. 利用数据分析工具:通过收集和分析小卖部的销售数据、顾客流量数据等,了解顾客的消费习惯和需求,以便更精准地进货和调整商品布局。 2. 借助智能库存管理系统:实现对库存的实时监控和预测,避免缺货或积压现象。 3. 运用智能营销手段:例如基于顾客的消费行为和偏好,推送个性化的促销信息。 您可以持续关注 AI 领域的新发展和应用,结合自身实际情况,探索适合小卖部经营管理的有效方法。
2025-03-14
整理word格式的ai
很抱歉,您提供的内容中没有关于“整理 word 格式的 AI”的有效信息,无法为您提供准确的回答。您能否再详细描述一下您的需求,比如是要将 AI 相关的内容整理成 word 格式,还是对已有的 word 格式的 AI 文档进行某种处理?
2025-03-14
AI的知识太多了,我都有点知识焦虑了我应该怎么做
以下是为您提供的关于应对 AI 知识焦虑的建议: 1. 构建有机知识体系:有机知识体系具有模块化、层级性和结构化的特征,有助于在复杂情境中灵活应用知识。教育实践应遵循大脑建构模式,合理拆分知识,形成组块,组织学习材料。 2. 明确学习重点和目标:避免盲目追求过多的知识,根据自身需求和实际应用确定重点学习的方向。 3. 深入理解而非广泛涉猎:对于关键的 AI 知识领域,进行深入的学习和研究,而非浅尝辄止地了解大量表面知识。 4. 注重知识整合:将碎片化的知识进行整合,形成系统的知识结构,降低知识焦虑。 5. 提高知识应用能力:通过实际应用所学的 AI 知识,加深理解和记忆,同时也能增强对知识的掌握和信心。
2025-03-14
有修改PDF的AI吗
以下是一些可以修改 PDF 或翻译 PDF 的 AI 工具和方法: 修改 PDF 为可视化网页: 可以使用 AI 把 PDF 一键变成能玩的可视化网页。具体步骤如下: 1. 如果想插入视频,找到公网的视频地址(本地视频先上传到公网,如 Youtube 或 B 站),在视频页面寻找“分享”按钮,点击“嵌入”或“嵌入代码”选项。 2. 把复制下来的 HTML 代码粘贴到媒体资源处。 3. 将改完的 Prompt 粘贴到 Claude 自己的官网、trea 海外版、cursor 等里面。 4. 如果是其他渠道,没有代码预览功能,可把生成的代码直接复制到 https://www.yourware.so/ 网站,点击 deploy code 稍等一会,就有预览。点击 copy link 可分享给朋友链接一起看。 翻译 PDF: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(进阶功能基本需付费)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(有免费次数限制,进阶功能需付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-14
把一段录音转化成文字
以下是将录音转化成文字的几种方法: 1. 办公场景: 可以使用通义听悟、飞书妙记、钉钉闪记来实现录音转文字。以钉钉闪记为例,操作步骤如下: 第一步打开钉钉闪记。 结束录音后点击“智能识别”。 点击智能摘要,就可以获得本次会议的纪要。 如果需要更多内容,复制所有文案或下载文本文件到GPT、GLM、通义千问等大语言模型对话框中,再将会议内容发送。 该场景对应的关键词库包括会议主题、参与人员、讨论议题、关键观点、决策、时间、地点、修改要求、文本格式、语言风格、列表、段落。 提问模板: 第一步:用飞书会议等软件整理好会议记录,并分段式发给 ChatGPT 生成总结:请根据以下会议资料,整理会议的关键信息,包括:会议主题、参与人员、讨论议题、关键观点和决策。会议资料:1、时间:XXX 年 XXX 月 XXX 日;2、地点:XXXX;3、参与人员:XXX、XXX;4、会议主题:XXXX;5、讨论内容:Speaker1:XXX;Speaker2:XXX;Speaker3:XXX。 第二步:检查生成的总结:请根据我提供的会议补充信息和修改要求,对 XXX 部分进行修改。 第三步:优化文本格式和风格:1、请将生成的总结,以 XXX 形式呈现(例如:以列表的形式、以段落的形式、使用正式/非正式的语言风格);2、请给上述会议总结,提供修改意见,并根据这个修改意见做最后的调整。 2. 外语学习场景(雅思口语急速备考): 如果时间充裕,建议把每个 topic 的问题喂给 GPT,让它一道道问您,您回答(可以用苹果自带的录音转文字)。转成文本后差不多能知道自己发音的问题。 然后让 GPT 对您的内容执行 correct 或者 another native answer 两个指令。前者可以基于您的内容做修正,后者是自己完全没思路让它给您弄一个。 之后要归纳,把语料按照教育、工作、购物、科技、消费分成几大类,然后再弄吃、环保、交通、历史几个专题,可以挑最不熟悉、现场水不出来的准备。 3. 教师场景: 7 月 31 日录音可以用通义听悟整理录音笔记,网址为:https://tingwu.aliyun.com ,有智能速览、关键词、保存导出等功能。
2025-03-14
AI可以做数据库的数据分析
AI 可以用于数据库的数据分析,以下是相关内容: ChatGPT 助力数据分析的流程: 逻辑流程图如下: 1. SQL 分析:用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验是 SELECT 类型的 SQL,其他操作如 UPDATE/DELETE 绝不能通过!校验通过后执行 SQL 返回结果数据。再将数据传给 GPT(附带上下文),让 AI 学习并分析数据,最后输出分析结论和建议,和结果数据一起返回给前端页面渲染图表、展示分析结论。目前已实现两张表关联查询。 2. 个性化分析:用户上传文件,如有需要可以简单描述这是什么数据、字段意义或作用辅助分析。前端解析用户上传的文件,再传给 GPT 分析数据,后续步骤与上面一致。 相关问题与技巧: 1. SQL 分析: 反复校验是否为 SELECT SQL 语句,不仅因为 AI 不完全可控,还因为不能相信用户输入,防止恶意操作。非查询类 SQL 坚决不通过,提示不支持此类请求。 到 AI 分析步骤拼接上下文,是为了让 GPT 更好理解数据和字段的意义,使分析更准确。 针对表结构长类型字段,不允许直接查询,防止 token 消耗过多。最好告诉 GPT 只允许查询哪几个字段,或者用哪几个 SQL 函数,尽量让 GPT 生成可控。 2. 个性化分析: 用户上传的数据解析后需判断数据格式是否符合要求,超长可限制截取前面若干项,防止 token 消耗过多。 在前端解析用户上传的数据,分析完可直接用于渲染数据图表,无需后端再返回。 支持用户补充输入,可简单描述数据、字段意义或作用,用于辅助 AI 分析。对于易理解语义化的字段名,可不描述,GPT 也能识别。遇到多维度数据,为保证准确性,可输入“以 xxx为维度分析”或“这是 xxx 数据”。 AI 术语库中的相关术语: |术语 ID|原文|译文|领域|易混淆|缩写|不需要提醒| |||||||| |ROW1|DataDriven Spectral Analysis|数据驱动的光谱分析|AI||| |ROW1|DataMining|数据挖掘|AI|1|| |ROW1|Database|数据库|AI||| |ROW1|DE Algorithm|差分进化算法|AI|1|| |ROW1|Deeplift|DeepLift 模型|AI||| |ROW1|Dendrogram|树状图|AI||| |ROW1|Density Functional Theory|密度泛函理论|AI||| |ROW1|DensityBased Spatial Clustering Of Applications With Noise|DBSCAN 密度聚类|AI||| |ROW1|Descriptor|描述符|AI||| |ROW1|DFT Calculations|DFT 计算|AI||| |ROW1|Dice Similarity|戴斯相似度|AI||| |ROW1|Differential Evolution|差分进化|AI|||
2025-03-14