Navigate to WaytoAGI Wiki →
Home/All Questions
trae的使用指南
以下是 Trae 的使用指南: 一、Trae 简介 Trae 是字节跳动推出的智能编程助手,提供基于 Agent 的 AI 自动编程能力,使用自然语言对话就能实现代码编写。 二、Trae 的功能 1. 提供传统的 IDE 功能,包括代码编写、项目管理、插件管理、源代码管理等。 2. 智能问答:在编写代码时,可随时与 AI 助手对话,获得代码解释、注释和错误修复等帮助。 3. 实时代码建议:AI 助手能理解当前代码并在编辑器中实时提供建议,提升编程效率。 4. 代码片段生成:通过自然语言描述需求,生成相应代码片段,甚至能编写项目级或跨文件的代码。 5. 从 0 到 1 开发项目:告诉 AI 助手想开发的程序,它将提供相关代码或自动创建所需文件。 三、下载 Trae 官网下载地址:https://www.trae.ai/download ,支持 Mac 系统、Windows 系统,未来支持 Linux 系统。 四、使用方法 1. 安装:下载完成后按照界面提示一步步安装。 2. 登录:安装完成后点击右侧登录按钮,程序会自动打开网页提示登录,无账号需先注册。登录完可能会出现“App Unavailable”,此时需要开启科学上网。 3. 网页登录成功后可关闭科学上网,再点击中间大按钮,自动进入 Trae 客户端。 五、模式选择 1. Chat 模式:根据描述进行代码生成、解释、分析问题或解决问题。 2. Builder 模式:可让 Trae 帮助从 0 开发一个完整的项目,对代码文件的任何更改都会自动保存。 六、使用案例 1. 生成一个贪吃蛇游戏 打开 Builder 模式,输入“使用 web 技术栈生成一个贪吃蛇游戏”,排队完成后,Trae 开始思考和代码编写,期间需手动接入进行文件审查,点击“全部接受”。 代码生成完成后,Trae 自动运行命令启动页面,点击运行,在 Webview 中可看到实现的游戏效果,试玩基本无 Bug。 Trae 会进行工作总结,说明已实现的功能,如游戏包含的特性、主要功能和游戏界面等。 2. 生成一个任务清单应用 在输入框中输入:使用 Web 技术开发一个任务清单应用。 3. 根据 UI 设计图自动生成项目代码 从站酷上找一张设计图,输入提示:使用 html 技术实现如图大屏页面。 七、总结 从实际体验来看,Trae 表现可圈可点。 1. 高效代码生成能力:能在几分钟内生成完整框架,代码结构清晰且功能齐全,甚至能自动处理依赖项和运行命令。 2. 多技术栈支持:对 Web 技术掌握远超预期,生成的代码可直接运行且无明显语法错误。 3. 动态调整潜力:能根据用户反馈快速调整样式,自适应布局的实现展现了 AI 的迭代能力。
2025-04-09
PPT生成模型
以下是为您整理的关于 PPT 生成模型的相关信息: 已备案的 PPT 生成模型有: iSlidePPT 合成算法:由成都艾斯莱德网络科技有限公司提供,应用于 PPT 生成场景,根据用户输入的 PPT 主题生成符合需求的 PPT 文件,备案编号为网信算备 510107114657401240015 号,备案日期为 2024 年 2 月 18 日。 关于 AI 生成文字的原理: 神经网络大模型根据输入的文字预测下一个字,不是一次性输出整段,而是通过反复调用模型一个字一个字地续写,直到输出结束符号。其输出不是一个确定的字,而是所有字的概率,可选择概率高的字作为输出结果,也可随机挑选。这种方式可拓展到图像、声音等领域,只要定义好“下一个”的信号即可。 关于 SD 入门讲解 PPT: 主模型后缀一般为.ckpt 或者.safetensors,体积较大,在 2G 7G 之间,管理模型需进入 WebUI 目录下的 models/Stablediffusion 目录。在使用 WebUI 时左上角切换主模型。safetensors 支持各种 AI 模型,具有足够安全、防止 DOS 攻击、加载迅速、支持懒加载、通用性强等优势,现在大部分开源模型会提供这种格式。
2025-04-09
图片生成视频
以下是关于图片生成视频的相关内容: 使用 Runway 生成视频: 1. 图片准备好后,拖到 Runway 里生成 4 秒视频(Runway 收费,可在闲鱼或淘宝买号找免费的)。 2. 进入 Runway 官网首页,点击“start with image”。 3. 直接将图片拖进来。 4. 动画幅度尽量用 3,5 有时会乱跑。 5. 无需等进度条转完,可直接继续往里放图片,能同步执行。 6. 直接点删除,重新上传下面的图即可(最多可放数量可自行测试)。 7. 重复步骤生成所有视频。 使用 Camera Motion 生成视频: 1. 点击“AddImage”上传图片。 2. 在“Prompt”中输入提示词。 3. 选择想要的运镜方向,输入运镜值(https://waytoagi.feishu.cn/docx/Ci9yd5xu2o46rXxNofdcnqH9nXbdoxcniTMBNtWHj6MSpXvB2DTyUh)。 4. 运动幅度和画面主体运动幅度有关,与运镜大小无关,可设置成任意值。 5. 选择好种子(seed)、是否高清(HD Quality)、是否去除水印(Remove Watermark)。 6. 点击“create”生成视频。 使用 Pika 生成视频: 1. 打开 Discord,Pika 的生成视频频道在 Discord 上,点击邀请链接加入频道:https://discord.gg/pika 。 2. 生成第一个视频: 选择一个作画的频道。 输入“/”+指令: /create 为文字生成视频指令。 /animate 为图片生成视频指令。 /encrypt_image 为图片+文字生成视频指令。 选择/create,文字生成视频,输入想要的内容描述。 选择/animate,图片生成视频,输入想要的图片,不能添加其他文字要求描述;或在 message 处输入想要的图片,并在 prompt 处添加描述。 3. Pika 的常用指令参数: gs xx:引导比例,较高的值使其与文本更相关(推荐范围为 8 24)。 neg xxx:负面提示(指定在视频中不希望出现的内容)。 ar xx:xx:宽高比(例如 16:9、9:16、1:1、4:5)。 seed xxx:生成过程中增加一致性的种子数。 motion xx:所需运动强度(仅支持 0/1/2)。 fps xx:视频的帧率。
2025-04-09
通义千问的视频理解模型怎么使用
通义千问的 Qwen2.5VL 视频理解模型具有以下特点和使用方式: 版本:推出 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作,如给指定朋友送祝福、电脑修图、手机订票等。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai
2025-04-09
2025年AI研究报告
以下是为您提供的 2025 年 AI 研究报告相关信息: Gartner:《生成式 AI 时代下科技产品的重要发展机遇》(2024/10/16) 强调了生成式 AI 技术对对话式 AI 和科技产品创新的显著影响。 预计到 2025 年,生成式 AI 将嵌入 80%的对话式 AI 产品中,推动市场营收大幅增长。 建议技术供应商积极把握机遇,通过理解市场动态、技术成熟度和市场接受度来调整策略。 生成式 AI 的四大关键能力—对话式 AI、AI 代理、合成数据和个性化—能够提升产品价值和客户体验。 提出了将生成式 AI 功能添加到产品中的四个关键步骤,并强调了独立软件供应商在企业应用中嵌入生成式 AI 能力的趋势。 如需下载研究报告,。 甲子光年:2025 DeepSeek 开启 AI 算法变革元年(2025/02/05) DeepSeek 的出现标志着算力效率拐点显现,其通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知。 2025 年发布的大模型呈现低参数量特征,为本地化部署到 AI 终端运行提供了可能。 报告强调 2025 年是算法变革的元年,DeepSeek 的推理模型开启了算法变革,其训练过程聚焦于强化学习,提升了模型的推理能力。 非 Transformer 架构的算法模型成为新的发展方向,如 LFM 架构模型性能超越同等规模的 Transformer 模型。 如需下载研究报告,。 安永:数据+AI 开启经验规模化复制时代(2023/12/19) 人工智能正在经历新的发展浪潮。 某头部公司正在转向 AI Agents 支持平台,结合第 4 代人工智能模型与专业语料库以实现业务创新。 AI Agents 有望为商业领域注入新活力,展示人工智能的潜力和商业价值。 随着平台的发展,新的 AI Agents 涌现,提供专业化、高端化、个性化、规模化、持续化的服务。 人工智能的革新涵盖了生成内容(AIGC)和生成服务(AIGS)的领域。 保险行业面临挑战,AI 的突破为其带来新的应对方向。 知识星球下载: 弘则研究:2023 生成式 AI 驱动向量数据库加速发展(2023/12/18) 向量数据库潜在市场空间是传统结构化关系型数据库的数倍达到千亿美元。 据信通院统计数据,全球数据库市场规模在 2020 年为 671 亿美元,到 2025 年有望达到 798 亿美元,CAGR 3.5%估算关系型数据库全球龙头 Oracle 收入规模小几百亿美元。 仅考虑现有非结构化数据的向量化处理,估算需要的存储空间增量为之前的数倍。 未来随着生成式 AI 应用增量数据的爆发对于向量数据库的需求会更大。 报告下载地址:
2025-04-09
提示词学习
提示词的学习是一个系统性的过程,以下为您详细介绍: 一、提示词的知识体系 将提示词学习分为五个维度,从高到低依次是:思维框架、方法论、语句、工具和场景。但对于初学者,舒适的学习顺序应是反过来的。 二、学习顺序 1. 场景:直接切入提示词的场景去学,对比在不同场景下使用提示词的效果。 2. 工具:使用现成的提示词工具,如 Meta Prompt、Al 角色定制等,以及别人写好的成型提示词。 3. 有效语句:学习大量经典论文中明确提出的提示词语句,如早期的 think it step by step。 4. 方法论:把有效语句及其背后的原理整合成稳定可控的方法,自动编写稳定的提示词。 三、具体案例 1. 宝玉日报中提到提示词学习的认知进化路径,从“不会表达”到“过度结构化”再到“高阶简洁”,初学者重“信息提供”,高手重“精准取舍”。 2. 对于 Stable Diffusion 的提示词学习: 学习基本概念,包括了解其工作原理、模型架构,以及提示词如何影响生成结果,掌握提示词组成部分。 研究官方文档和教程,通读官方文档,学习开发团队和专家的分享。 学习常见术语和范例,熟悉相关领域术语,研究优秀的图像标题和描述。 掌握关键技巧,如组合词条精确描述、控制生成权重的符号使用、处理抽象概念等。 进行实践和反馈,尝试生成不同风格和主题的图像,对比分析总结经验。 创建提示词库,按主题、风格等维度建立,记录成功案例。 持续跟进前沿,关注最新更新和社区分享,掌握新技术、新范式、新趋势。 希望以上内容对您学习提示词有所帮助。
2025-04-09
BAAI/bge呢
BGE(BAAI 通用嵌入)是由北京人工智能研究院开发的模型,代表了一些可用的最强大的开源嵌入模型。它擅长捕获跨多种语言和领域的语义关系。 在 Rankify 中,BGE 集成具有以下特点: 支持多种 BGE 模型大小。 具备跨语言检索能力。 为生产环境优化了推理。 在人岗匹配的相似性计算中,如邬嘉文的 AI 求职助手中,使用了 BGEM3 模型,通过 Python 代码实现,具体步骤包括读取相关文件、使用模型计算相似性,并将信息汇总保存。代码如下: ``` import pandas as pd from FlagEmbedding import BGEM3FlagModel 1. 读取 cv.txt 文件 with openas file: cv_content=file.read 2. 读取 JobDetails2.xlsx 文件所有字段 job_details=pd.read_excel 3. 使用 BGEM3 模型计算相似性 model=BGEM3FlagModel cv_embedding=model.encode 计算 cv 与每个 job_description 的相似性 similarities= for job_description in job_details: job_embedding=model.encode similarity=cv_embedding@job_embedding.T similarities.append 4. 将所有信息汇总保存为 123.xlsx job_details=similarities job_details.to_excel ```
2025-04-09
嵌入式模型有哪些
以下是一些常见的嵌入式模型: 1. OpenAI 提供了第二代嵌入模型 textembeddingada002,它具有更好、更便宜、更易于使用的特点。使用 cl100k_base 分词器,最大输入 token 为 8191,输出为 1536。 2. OpenAI 还提供了 16 个第一代模型(以 001 结尾),均使用 GPT3 分词器,最大输入为 2046 个分词。第一代嵌入模型包括针对不同任务调整的五个系列,如相似性嵌入(如 textsimilaritybabbage001、textsimilaritycurie001、textsimilaritydavinci001)、文本搜索嵌入(如 textsearchadaquery001 等)、代码搜索嵌入(如 codesearchadatext001 等)。 3. 此外,还有 Whisper 这种通用的语音识别模型,它是多任务模型,可执行多语言语音识别以及语音翻译和语言识别,目前可通过 OpenAI 的 API(模型名 whisper1)使用 Whisper v2large 模型。
2025-04-09
1.2Prompts 市场营销类
以下是关于市场营销类的 1.2 Prompts(提示词)相关内容: 专业推特新闻小编(作者:Carl):提取文本里的关键信息,整理所有信息并用浅显易懂的方式重新说一遍,让没有技术背景的人也能听懂,同时要写得吸引眼球。使用 Unicode 符号和 Emoji 表情符号来优化排版,提供更好的阅读体验。目标包括提取新闻关键信息并用浅显方式重新表述、为用户提供更好阅读体验让信息更易理解、增强信息可读性提高用户专注度。约束条件为不会偏离原始信息,只基于原有信息收集的消息做合理改编,只使用 Unicode 符号和 Emoji 表情符号进行排版。参考链接: 给 Prompt 打分(作者:李继刚):类似 Prompt 药剂师,通过对用户的 Prompt 进行分析,给出评分和改进建议,帮助用户提升 Prompt 的效果。用户基于当下认知写完 Prompt,不知现在的写法有什么问题,需要帮忙分析。要提供准确的评分和改进建议,避免胡编乱造的信息。参考链接:
2025-04-09
企业场景下最常用的工作流
在企业场景下,工作流是一种灵活的智能体编排方式,将业务过程中的任务按规则和顺序组织执行,降低任务复杂度和不确定性,减少对提示词工程和模型推理能力的依赖,提高大语言模型应用面向复杂任务的性能、稳定性和可解释性。工作流是智能体平台最核心强大的部分,衡量一个 AI 智能体的含金量,除大模型能力外,大部分业务价值体现在工作流设计里。 工作流的典型场景包括: 入门场景: 仅添加一个节点构建简单工作流,如通过插件节点内的插件能力自定义工作流,使用获取新闻插件构建获取新闻列表的工作流,详细配置教程可参见。 使用大语言模型(LLM)节点接收并处理用户问题,详细配置教程可参见。 使用 Code 节点生成随机数,详细配置教程可参见。 进阶场景: 通过多节点组合构建逻辑较复杂的工作流,如先通过插件能力进行关键词搜索、然后通过 Code 节点过滤指定信息、最后通过插件能力获取信息详情,详细配置教程可参见。 通过条件判断识别用户意图,例如通过 LLM 节点处理用户消息,将消息分为不同类型,然后通过 Condition 节点分别处理不同类型的用户消息,详细配置教程可参见。 常见的 AI Workflow 开发平台有: Coze:新一代 AI Bot 开发平台,集成了丰富的插件工具,国际版和国内版均有。 Dify:开源平台,支持自定义和插件。 腾讯元器。 FastGPT:国内知名,支持自定义流程。 影刀&zapier。 Leap。 Betteryeah:立足 RPA 场景,用 AI 将用户需求生成工作流,并通过 RPA 自动化,产品形态与 Coze 相似,是企业级的 AI 应用开发平台,无论团队编程技能如何,都能快速创建由 AI 驱动的 Agents、知识库、工作流和任务。 Flowise:快速实现智能体搭建。 BISHENG:主攻 tob 场景的开源 LLM 搭建平台,与 fastgpt 功能类似,但面向的客户不同,整体功能和部署成本更重。 Agent 构建平台有豆包、文心一言、星火助手、kimi.ai 等。由于 Coze 具有拓展强、好上手、不用出国等优点,本教程的工作流以 Coze 为主。
2025-04-09