Navigate to WaytoAGI Wiki →
Home/All Questions
检索有关AI入门必读书籍
以下是为您推荐的 AI 入门必读书籍: 1. 「」,有助于熟悉 AI 的术语和基础概念。 2. 「」,其中包含为初学者设计的课程。 3. GPT1 到 Deepseek R1 所有公开论文 The 2025 AI Engineer Reading List:涉及人工智能工程的 10 个领域,包括 LLMs、基准、提示、RAG、代理、CodeGen、视觉、语音、扩散、微调。如果您想从零开始,可以从此处开始。 4. 入门经典必读:作者为 ,原文地址:https://a16z.com/2023/05/25/aicanon/ 。文中分享了一份用于更深入了解现代 AI 的精选资源列表。
2025-03-17
AI应用分类
AI 的应用场景非常广泛,主要包括以下几类: 1. 医疗保健: 医学影像分析:用于分析医学图像辅助诊断疾病。 药物研发:加速药物研发过程,识别潜在药物候选物和设计新治疗方法。 个性化医疗:分析患者数据提供个性化治疗方案。 机器人辅助手术:控制手术机器人提高手术精度和安全性。 2. 金融服务: 风控和反欺诈:识别和阻止欺诈行为,降低金融机构风险。 信用评估:评估借款人信用风险,帮助做出贷款决策。 投资分析:分析市场数据辅助投资决策。 客户服务:提供 24/7 服务并回答常见问题。 3. 零售和电子商务: 产品推荐:分析客户数据推荐可能感兴趣的产品。 搜索和个性化:改善搜索结果提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题并解决问题。 4. 制造业: 预测性维护:预测机器故障避免停机。 质量控制:检测产品缺陷提高质量。 供应链管理:优化供应链提高效率和降低成本。 机器人自动化:控制工业机器人提高生产效率。 5. 交通运输:(未给出具体应用场景) 此外,还有众多具体的 AI 应用产品,例如: 1. 辅助创作与学习:AI 智能写作助手、语言学习助手、诗歌创作助手、书法字体生成器、漫画生成器等。 2. 推荐与规划:AI 图像识别商品推荐、美食推荐平台、旅游行程规划器、时尚穿搭建议平台、智能投资顾问等。 3. 监控与预警:AI 宠物健康监测设备、家居安全监控系统、天气预报预警系统、医疗诊断辅助系统等。 4. 优化与管理:办公自动化工具、物流路径优化工具、家居清洁机器人调度系统、金融风险评估工具等。 5. 销售与交易:AI 艺术作品生成器、书法作品销售平台、摄影作品销售平台、汽车销售平台、房地产交易平台等。 具体如: AI 摄影参数调整助手:利用图像识别、数据分析技术,在一些摄影 APP 中根据场景自动调整摄影参数。 AI 音乐情感分析平台:通过机器学习、音频处理技术,有相关音乐情感分析软件可判断音乐的情感倾向。 AI 家居智能照明系统:结合物联网技术、机器学习,像小米智能照明系统可根据用户习惯和环境变化自动调整灯光。 AI 金融风险预警平台:运用数据分析、机器学习,金融风险预警软件能提前预警金融风险。 AI 旅游路线优化平台:借助数据分析、自然语言处理,马蜂窝可根据用户需求优化旅游路线。
2025-03-17
写自媒体文章,哪个AI软件好
以下是一些适合用于写自媒体文章的 AI 软件: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 利用 AI 不到 30 分钟打造爆款公众号文章的步骤如下: 1. 收集相关资料:明确文章主题后,借助 AI 工具高效完成。例如使用 Perplexity.AI 的强大搜索功能获取信息,输入具体的 Prompt 定位相关资讯,还可使用具备联网搜索功能的工具如微软的 Bing 搜索引擎。 2. 整理资料:收集完资料后,使用月之暗面开发的 Kimi 这个 AI 会话助手进行整理。需注意 Kimi 阅读能力有限,可分批次提供资料确保其有效读取和理解。
2025-03-17
midjourney
以下是关于 Midjourney 的相关信息: 隐私政策: 本隐私政策适用于 Midjourney,Inc.、Midjourney.com 网站和 Midjourney 图像生成平台的服务。Midjourney 是一家通信技术孵化器,提供图像生成服务以增强人类创造力并促进社会联系。 个人数据指与个人相关、可用于直接或间接识别个人身份的任何信息。本政策适用于 Midjourney 收集、使用和披露的个人数据,包括通过服务、训练机器学习算法过程、网站以及第三方来源收集的数据,但不适用于 Midjourney 员工和候选人等的个人数据。 可能会不时更新政策,适用法律要求时会通知变更。若不接受变更应停止互动。 定义方面,“您”指访问或使用服务的个人或代表该个人的公司等。使用数据指自动收集的数据。 收集的数据类型包括个人数据。 图像提示: 要将图像添加到提示中,可按“/imagine”开始输入,出现提示框后,将图片文件拖入或右键单击并粘贴图片的 URL。 使用 Midjourney Bot 在私信中上传图像可防止其他服务器用户看到,除非用户具有隐身模式,否则图像提示在 Midjourney 网站上可见。 给出了多个例子,如阿波罗雕像、复古花图、恩斯特·海克尔的水母等,以及不同模型版本和纵横比提示。 社区准则: Midjourney 是默认开放的社区,内容必须为 P。 要友善并尊重彼此和员工,禁止不尊重、攻击性或辱骂性的图像或文本提示,不容忍任何形式的暴力或骚扰。 禁止成人内容或血腥内容,未经许可不得公开转发他人创作,分享时要小心。 违反规则可能导致服务被禁止,规则适用于所有内容。
2025-03-17
本地部署大模型
以下是关于本地部署大模型的相关内容: SDXL 大模型的本地部署: 1. SDXL 的大模型分为两个部分: 第一部分,base+refiner 是必须下载的,base 是基础模型,用于文生图操作;refiner 是精炼模型,用于细化生成的模型以获得更丰富的细节。 第二部分,还有一个配套的 VAE 模型,用于调节图片的画面效果和色彩。 2. 下载模型:这三个模型可通过关注公众号【白马与少年】,回复【SDXL】获取云盘下载链接。 3. 版本升级:在秋叶启动器中将 webUI 的版本升级到 1.5 以上。 4. 放置模型:将 base 和 refiner 放在“……\\sdwebuiakiv4.2\\models\\Stablediffusion”路径下;vae 放在“……\\sdwebuiakiv4.2\\models\\VAE”路径下。 5. 启动使用:启动 webUI 后即可在模型中看到 SDXL 的模型,正常使用时先在文生图中使用 base 模型,填写提示词和常规参数进行生成。 从 LLM 大语言模型、知识库到微信机器人的全本地部署教程: 1. 下载并安装 Ollama: 点击进入 https://ollama.com/download ,根据电脑系统下载。 双击打开,点击“Install”。 安装完成后,将下方地址复制进浏览器中验证安装:http://127.0.0.1:11434/ 。 2. 下载 qwen2:0.5b 模型(0.5b 方便测试,设备充足可下载更大模型): Windows 电脑:点击 win+R,输入 cmd 点击回车。 Mac 电脑:按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”选择“终端”应用程序。 复制命令行,粘贴回车,等待自动下载完成。 ComfyUI ollama 本地大模型部署: 1. 先下载 ollama 安装,安装完成后可在电脑桌面右下角或隐藏图标里找到。 2. 下载对应的模型,选择模型并复制对应的命令。 3. 打开命令行界面,输入对应的模型获取命令,等待下载完成。 下载的模型会保存到 D:\\ollama\\blobs 。 4. docker 安装:安装会下载一些文件,安装后更改目录,不要放在 C 盘。 5. Open webui 安装:输入相关命令,安装成功后回到 docker,点击会自动打开网页,第一次使用需注册账号,选择下载好的模型即可开始使用。 6. 错误解决:端口占用问题,运行下面两条命令可以解决。 7. 相关链接: comfyuiollama:https://github.com/stavsap/comfyuiollama?tab=readmeovfile Ollama:https://ollama.com/ docker:https://www.docker.com/ Open webui:https://openwebui.com/
2025-03-17
用deepseek写论文的指令
以下是一些用 DeepSeek 写论文的指令和相关方法: 1. 模糊指令优化: 对于宽泛需求,可添加维度约束,例如原句“写小说”可修正为“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构”。 对于主观表述,可量化标准,比如原句“写得专业些”可修正为“符合 IEEE 论文格式,包含 5 项以上行业数据引用”。 2. 迭代优化法: 首轮生成:获取基础内容。 特征强化:请加强第三段的技术细节描述。 风格调整:改用学术会议报告语气,添加结论部分。 最终校验:检查时间逻辑一致性,列出可能的事实性错误。 3. 文风转换矩阵: 作家风格移植:“用鲁迅杂文风格写职场 PUA 现象”。 文体杂交:“将产品说明书改写成《史记》列传格式”。 学术口语化:“把这篇论文摘要翻译成菜市场大妈能听懂的话”。 4. 领域穿透技术:行业黑话破解,例如“解释 Web3 领域的‘胖协议瘦应用’理论”。 5. 商业决策支持。 6. 场景化实战策略: 创意内容生成。 技术方案论证。 7. 效能增强技巧: 对话记忆管理: 上下文锚定:“记住当前讨论的芯片型号是麒麟 9010”。 信息回溯:“请复述之前确认的三个设计原则”。 焦点重置:“回到最初讨论的供应链问题”。 输出质量控制: 对于过度抽象,“请具体说明第三步操作中的温度控制参数”。 对于信息过载,“用电梯演讲格式重新组织结论”。 对于风格偏移,“回归商务报告语气,删除比喻修辞”。 8. 特殊场景解决方案: 长文本创作: 分段接力法:“先完成故事大纲→逐章扩展→最后进行伏笔校验”“确保新章节与前文的三处细节呼应”。 敏感内容处理: 概念脱敏法:“用经济学原理类比说明网络审查机制”。 场景移植法:“假设在火星殖民地讨论该议题”。
2025-03-17
免费图生视频
以下为一些免费的图生视频工具及相关信息: Pika labs:目前推出了 Beta 版本,支持免费、不限次数地文生视频、图生视频,生成的视频会带上官方水印。使用方法如下: 在 Discord 试用 Beta 版本:http://discord.gg/pika 。 选择 generatex 开头的频道或者建立 pika labs 私信。 “/create”输入 prompt 即可完成文生视频,输入 prompt 后,点击“增加 1”可添加 image 进行文+图生视频。如果想仅输入图片,不输入 Prompt 来生成视频,可以使用/animate 命令。此外,?可以帮助用户快速进行多次生成,?则可以方便的可控参数能基本满足需求。 9 月,pika 更新了新能力加密信息。使用命令/encrypt_text,可以将最多 20 个字符的文本“加密”到给定的视频输出中。而/encrypt_image,则可以实现输入 logo image,生成图像动画中含有 logo 的效果。值得一提的是,最好将 logo 文件处理为黑底白图,否则 pika labs 可能无法识别。使用/encrypt_image 命令时,除了输入一张 logo image,还可以选择性增加一张垫图,垫图会对视频整体风格、内容产生影响。 在 Prompttutorial 频道,有很多值得一看的教学视频,而在 showcase 频道和官方 twitter 中可以看到许多优秀案例。官方 Twitter:https://twitter.com/pika_labs 。 Haiper(有免费额度):https://haiper.ai/ 。文生视频、图生视频、素描生视频、扩展视频,能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值。图生视频只能写提示词、秒数(2s 和 4s)、种子值。视频重绘,轻松修改颜色、纹理和元素以改变原视频的视觉内容。局部重绘是使用点选的方式,选中需要重绘的区域,再输入需要替换的内容提示词,如果是大量背景的重绘,效果一般,视频容易崩。文生视频不同风格展示 。 DynamiCrafter(免费):https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,https://github.com/Doubiiu/DynamiCrafter?tab=readmeovfile 。2 秒图生视频,还可以做短视频拼长视频。 Morph studio(内测):https://app.morphstudio.com/ 。暂未对外开放,可在官网提交内测申请。discord 上可以免费体验,支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置,默认生成 3s 视频。 另外,将图片拖到 runway 里面也可以图生 4s 视频(runway 是收费的,可在闲鱼或者淘宝买号)。进入 runway 官网首页,点击 start with image ,然后直接将图片拖进来,动画幅度尽量用 3,5 有时候会乱跑。啥都不用改,直接点击生成即可。注意:不需要等进度条转完,可以直接继续往里放图片,可以同步执行。直接点删除,然后重新上传下面的图即可(最多可以放几个可自行测试) 。
2025-03-17
根据图片加文字描述生成分镜脚本的提示词
以下是一些根据图片加文字描述生成分镜脚本的提示词示例及相关说明: 1. 对于影片《哪吒·龙影之下》的分镜脚本,其提示词包括分镜编号、分镜内容描述、人物、情绪、对白或配音等方面,如“1|高中操场,学生们活动|学生群|活跃|无”。 2. 在商业级 AI 视频广告的分镜创作中,提示词的结构为:要做多长时间的视频、要出多少个分镜、每个分镜包含哪些内容、对输出格式有什么要求。例如“请把这个故事脚本改写成一个 30 秒时长的广告片分镜脚本,脚本结构包括序号、场景、景别、镜头时长、镜头运动、画面内容、对话旁白和音乐音效。每个分镜拆分细致一些,补充多一些细节,单镜头时长控制在不超过 5 秒,一共拆分 10 个分镜”。 3. 在“城市狂想”的图片制作中,针对分镜内容生成了不同风格的提示词,如“远景,三分法构图,俯视视角,数字绘画,云雾缭绕的山谷,群山连绵起伏,山谷间云雾缭绕,阳光透过云层洒在山间,形成光与影的对比,模拟观众的视线逐渐接近这片土地,新印象派风格特征,使用数字画笔和渐变工具ar 16:9v 6.1”。 希望以上内容能对您有所帮助。
2025-03-17
agi是什么
AGI 即通用人工智能(Artificial General Intelligence),指的是能够像人类一样思考、学习和执行多种任务的人工智能系统。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 此外,OpenAI 通用人工智能(AGI)的计划曾因埃隆·马斯克的诉讼而受到影响。GPT3 及其半步后继者 GPT3.5 在某种程度上是朝着 AGI 迈出的巨大一步,而早期的模型则不是这样。ChatGPT 是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具。
2025-03-17
给我推荐个 ai视频提示词
以下为为您推荐的 AI 视频提示词: 1. 史诗灾难场景 提示词: 2. 赛博朋克未来都市 提示词: 3. 奇幻神话场景 提示词: 4. Adobe Firefly AI 视频功能相关 提示词:Miniature adorable monsters made out of wool and felt,dancing with each other,3d render,octane,soft lighting,dreamy bokeh,cinematic.(用羊毛和毛毡制成的微型可爱怪物,互相跳舞,3D 渲染,辛烷值,柔和的灯光,梦幻般的散景,电影) 提示词:Footage of a camera on a drone flying over a desert with wind blowing over the dunes creating waves in the sand below.(无人机上的摄像机飞越沙漠的镜头,风吹过沙丘,在下面的沙子上产生波浪) 提示词:Detailed extremely macro closeup view of a white dandelion viewed through a large red magnifying glass 提示词:Cinematic closeup and detailed portrait of a reindeer in a snowy forest at sunset.The lighting is cinematic and gorgeous and soft and sunkissed,with golden backlight and dreamy bokeh and lens flares.The color grade is cinematic and magical.(日落时雪林中驯鹿的电影特写和详细肖像。灯光如电影股华丽、柔和、如阳光股,金色背光、梦幻股的散景和镜头光量。色彩等级具有电影股的魔力。) 提示词:Slowmotion fiery volcanic landscape,with lava spewing out of craters.the camera flies through the lava and lava splatters onto the lens.The lighting is cinematic and moody.The color grade is cinematic,dramatic,and highcontrast.(慢动作的炽热火山景观,熔岩从火山口喷涌而出。相机飞过熔岩,熔岩溅到镜头上。灯光具有电影感和喜怒无常。色彩等级具有电影感、戏剧性和高对比度)
2025-03-17