Navigate to WaytoAGI Wiki →
Home/All Questions
AGI之路
“通往 AGI 之路”是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。 它不仅是一个知识库,还是连接学习者、实践者和创新者的社区。旨在为学习者提供系统全面的 AI 学习路径,涵盖从基础概念到实际应用的各个方面,帮助用户有效地获取 AI 知识,提高自身能力。 该平台提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。此外,社区还定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 其品牌 VI(视觉识别)融合了独特的设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性,共同构建了一个充满活力和前瞻性的品牌形象。选择彩虹色作为主要的配色方案,代表多样性、包容性和创新。品牌的标志性图案是一只鹿,它在中文中与“路”谐音,象征着通往 AGI 未来的道路。鹿的形象优雅而智慧,寓意在追求 AGI 过程中的品味与睿智。选择的是简洁现代的非衬线字体,这种字体风格简约而现代,易于阅读,强调了信息传达的清晰度和直接性。 如果您对 AI 学习感兴趣,加入“通往 AGI 之路”社区将是一个不错的选择。在这里,您可以获取最新的 AI 知识,参与实践活动,与志同道合的学习者共同成长。
2025-03-09
ai写作
以下是关于 AI 写作的相关内容: 一、如何用 AI 写出比人更好的文字 作者陈财猫从自身经历出发,分享了以下观点: 1. AI+内容创作是现阶段最好的赛道:基于对大模型发展现状的观察和对“开车”“写作”两类任务的对比,认为该赛道有完美的产品模型匹配和产品市场匹配,且天花板高。 2. AI 写作的实践成果:业务包含营销和小说、短剧创作,开发了智能营销矩阵平台,参与喜马拉雅短故事和短剧写作课程,捣鼓出小财鼠程序版 agent。 3. 定义好文字:好文字能引起人的生理共鸣与情绪,AI 因预训练数据量大能学会引发共鸣,从而写出好文字。 4. 用 AI 写出好文字的方法:选好模型,评估模型的文风和语言能力、是否有过度道德说教与正面描述趋势、in context learning 能力和遵循复杂指令的能力;克服平庸,平衡“控制”与“松绑”;显式归纳想要的文本特征,通过 prompt 中的描述与词语映射到预训练数据中的特定类型文本,往 prompt 里塞例子。 5. 对 AI 创作的看法:AI 创作的内容有灵魂,只要读者有灵魂,文本就有灵魂;有人讨厌 AI 是因其未改变多数人生活,或自身是受害者。作者期望 AI 能力进一步提升,改变每个人的生活。 二、AI 写作变现指南 1. 项目启动: 确定目标客户群体,如大学生、职场人士、自媒体从业者等。 选择合适的 AI 写作工具,以满足不同客户的需求。 2. 准备阶段: 学习并实践 AI 写作技术,通过书籍、在线课程等资源提升写作技能。 构建团队,培养和扩充团队成员,以提高运营效率。 3. 商业模式构建: 确定服务内容,如提供论文、报告、文案等直接写作服务。 制定质量控制标准,确保写作内容满足客户要求。 4. 运营与推广: 在淘宝等电商平台上开设店铺,展示并销售写作服务。 建立写作培训社群,分享写作技巧和 AI 应用经验,提升品牌影响力。 通过社交媒体和线下活动进行品牌和社群建设。 与绘画团队、其他写作工作室等合作,共同开发新项目。 5. 项目优化与发展: 持续关注 AI 技术进展,提升服务质量和效率。 根据市场需求,拓展新的服务和产品。 收集客户反馈,不断优化和改进服务。 三、内容仿写 AI 工具 以下是几款中文的内容仿写 AI 工具: 1. 秘塔写作猫:https://xiezuocat.com/ 写作猫是 AI 写作伴侣,帮你推敲用语、斟酌文法、改写文风,还能实时同步翻译。支持全文改写,一键修改,实时纠错的同时一并给出修改建议,智能分析文章的各类属性,用人工智能为你的文章正负情感、情绪强度和易读性打分。 2. 笔灵 AI 写作:https://ibiling.cn/ 笔灵 AI 写作是得力的智能写作助手,心得体会、公文写作、演讲稿、小说、论文十八般武艺样样精通,算是一本适合打工人和学生党的武林秘籍啦!支持一键改写/续写/扩写,智能锤炼打磨文字,使之更加符合你的需求,让创作更上一层楼。 3. 腾讯 Effidit 写作:https://effidit.qq.com/ 智能创作助手 Effidit(Efficient and Intelligent Editing)是由腾讯 AI Lab 开发的一个创作助手,探索用 AI 技术提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看这里:https://www.waytoagi.com/sites/category/2 (内容由 AI 大模型生成,请仔细甄别。)
2025-03-09
制作数字人有什么免费的工具
以下是一些免费制作数字人的工具及使用方法: 1. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。 上传后效果如图所示,My Avatar处显示上传的照片。 点开大图后,点击Create with AI Studio,进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频。 最后点击Submit,就可以得到一段数字人视频。 2. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 点击上面的网址,点击右上角的Create vedio。 选择人物形象,你可以点击ADD添加你的照片,或者使用DID给出的人物形象。 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 最后,点击Generate vedio就可以生成一段视频。 打开自己生成的视频,可以下载或者直接分享给朋友。 3. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法: 点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。 4. 剪映: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。 选择数字人形象时,软件会播放出该数字人的声音,判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。 剪映会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成时间,然后可点击预览按钮查看效果。 为让视频更美观,可增加背景图片。点击左上角的“媒体”菜单,点击“导入”按钮选择本地图片上传。 选择图片右下角的加号将其添加到视频轨道上(会覆盖数字人),点击轨道最右侧的竖线向右拖拽,直到与视频对齐。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2025-03-09
如何通过与AI的对话获取高质量的信息?有没有相关书籍或者文章推荐,请给出相关链接。
以下是关于如何通过与 AI 的对话获取高质量信息以及相关书籍和文章推荐的内容: 在与 AI 对话获取高质量信息方面: 作为普通用户,语言在大模型中不是关键,核心是向量空间中的游走脉络,输出时的语言翻译是次要的,且训练语料的中英文差异在于 embedding 环节。 通过合适的模型、prompt 和 test 入口表达,用大模型公式调试出好效果以替代垂类模型,但微调垂类模型可能使大模型泛化能力下降,需分场景看待。 写提示词未挖掘出大模型的天花板,还有提升空间。 相关书籍和文章推荐: 从数学、作家、代码、原理角度写大模型的四本书。 介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章。 关于 AI 知识库及学习路径的介绍中提到的经典必读文章,如软件 2.0 时代相关内容。 初学者入门推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。 获取信息的渠道: 可以关注赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,订阅获取最新信息并投稿。 可通过“通往 AGI 之路”知识库获取相关内容,该知识库涵盖了 AI 多方面知识及社区共创项目,如人工智能简史、AI 会话简史等,还有 10 篇精选文章助于理解 AI。 您还可以通过参加社区共创项目,如 AIPU、CONFIUI 生态大会,每月的切磋大会等活动,以及新活动 AIPO,与他人交流获取更多信息。同时,鼓励整理学习笔记并分享交流,以促进对知识的吸收和理解。
2025-03-09
怎么写好prompt
写好 prompt 是一个关键且重要的步骤,它决定了 AI 模型如何理解并生成文本或视频。以下是一些编写 prompt 的建议和方法: 编写 prompt 的建议: 1. 明确任务:清晰地定义任务,如写故事时包含故事背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在 prompt 中明确指出。 5. 使用示例:若有特定期望结果,提供示例帮助 AI 理解需求。 6. 保持简洁:避免过多信息,以免 AI 模型困惑。 7. 使用关键词和标签:有助于 AI 模型理解任务主题和类型。 8. 测试和调整:生成文本后检查结果,根据需要调整 prompt,可能需多次迭代。 优化和润色 prompt 的方法: 1. 明确具体描述:使用更具体、细节的词语和短语,而非笼统词汇。 2. 添加视觉参考:插入相关图片参考,提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:用合适的形容词、语气词等调整整体语气和情感色彩。 4. 优化关键词组合:尝试不同搭配和语序,找到准确表达需求的描述方式。 5. 增加约束条件:添加限制性条件,如分辨率、比例等,避免意外输出。 6. 分步骤构建 prompt:将复杂需求拆解为子 prompt,逐步引导生成。 7. 参考优秀案例:研究有效的范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:多次尝试不同写法,根据输出效果反馈持续完善。 在即梦 AI 视频生成中,prompt 是直接描述或引导视频生成的文本或指令,类似给 AI 的提示,包含主体、运动、风格等信息,借此控制和指导生成内容,作用十分重要,是表达需求的方式,影响视频内容和质量。您可以将其理解为:将输入的文字变成对应的画面和运动形式。图片生视频和文本生视频的 prompt 输入位置也有所不同。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-09
文本撰写
以下是关于文本撰写的相关内容: 论文写作的 AI 产品: 在论文写作领域,AI 技术应用发展迅速,提供多方面辅助,包括文献搜索、内容生成、语言润色、数据分析等。常用的工具和平台有: 1. 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,助于管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化的软件,帮助进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 使用这些工具时,要结合自身写作风格和需求选择合适的辅助工具。 情侣之间甜蜜时光记录小助手 GPT 辅助制作: 需求分析中的构思部分,文案编写使用的方法论与昨天相同。利用 Python 执行以下操作: 1. 拼接图片:在生成的图片下面添加一个背景为纯白色、高度为 512px 的图片。 2. 文本定位: 文本在新创建的空白区域内水平和垂直居中。计算文本行的累积高度以及行间距,确定文本起始垂直位置(y 坐标)。 对于水平居中,计算每行宽度,使文本中心与图像中心对齐。确保每行“代码”之间的行间距为 15px。 文本使用上传的字体,若未上传字体,提醒用户上传中文字体,字体大小设置为 55px。 为用户提供最后生成图片的下载链接。 为 Generate video(beta)编写有效的文本提示: 1. 镜头类型描述:明确摄像机视角及移动方式,例如“一个缓慢放大的特写镜头”。 2. 角色描述:包括角色身份、外貌、穿着、情绪等,例如“一只有着亮白色皮毛的大型北极熊,看起来沉思着”。 3. 动作:描述角色在场景中的行为,例如“北极熊正在轻柔而自信地走向它之前在冰上打开的洞,以便在冰面下觅食”。 4. 位置:说明角色所在地点、天气和地形,例如“该位置贫瘠且白雪皑皑;灰色的云朵在远处缓慢移动”。 5. 美学:描述镜头类型、氛围和景深等,例如“电影,35 毫米胶片,高度详细,浅景深,散景”。
2025-03-09
如何生成指定主题的短视频分镜头的脚本
生成指定主题的短视频分镜头脚本可以参考以下步骤: 1. 确定主题风格和时长,比如丝绸之路的古风主题。 2. 设定故事主线和镜头,例如基于故事剧本及相关资料,按照场景、地点、镜号、画面描述、台词、音效等维度进行填充。 3. 注意画面数量与台词长短的关系,尽可能精简人物对话,提炼重点。主角一句话若有 6 个字,按 3 4 字/秒核算,需 2 秒时长,通常 1 个画面可生成 2 3 秒短视频,台词越长所需画面量越多。 4. 当缺乏画面灵感时,可借助语言大模型,如要求其写好画面描述甚至加上音效需求,多提问多尝试,但最终画面的选取和平衡需进一步思考。 以下为具体示例: 以太空为主题的短视频,如镜头 1:外太空 亚历克斯工作的全景。镜头描述为亚历克斯在太空站外,地球在背景中宁静地照耀,主要角色是亚历克斯,动作是忙碌地修理太空站外部设备,对白是亚历克斯自言自语说“这些维修工作总是那么必要”。 以友情为主题的短视频,如一只白猫和一只灰狼的故事。开端是暴风来袭,白猫狼狈,饥肠辘辘,无处可去,被灰狼盯上。发展是白猫逃跑,灰狼一路猛追,从草坪到巨石,白猫躲进船里。转折是灰狼替白猫挡下掉落的甲板。结局是两人在船舱躲雨,灰狼把鱼给白猫,雨过天晴后走到海边,海边放起烟花。 若已有简单的故事梗概,1 分钟视频大概需要 25 30 个镜头,需写出分镜头脚本,并翻译成英文用于文生图工作,要写清楚画面内容,如景别(远景、全景、中景、近景、特写)和风格(真实影像风格、日本动漫风格、水墨画风格等)。
2025-03-09
通往GAI之路中AI提示词板块李继刚的提示词如何使用
李继刚的提示词使用方法如下: 从最佳实践中的收录内容开始学习,其结构化提示词能让模型给出更优质、完整的答案。 操作时可点开并复制相关提示词,将复制内容丢进大语言模型对话,会有不同效果。 近期提示词有升级,李继刚老师将提示词玩到新高度,cloud 等大语言模型可直接显示编译结果内容。 输入特定提示词可生成卡片,小创业项目可利用并改变提示词形成独到见解或小应用。 李继刚老师会在 13 号讲创作思路。 从工程视角看,一个提示词就能用于写游戏,如现在的 AI 编程(如 CURSOR)能做出开源小游戏,可拿来使用、交流并研究内容、优化改造。
2025-03-09
LLM大模型与运维
以下是关于 LLM 大模型与运维的相关内容: 部署方面: 本地部署包括三大部分:本地部署大语言模型、本地部署 FastGPT+OneAPI、本地部署 HOOK 项目或 COW。 下载并安装 Ollama:根据电脑系统,从 https://ollama.com/download 下载,双击打开点击“Install”,安装完成后将下方地址复制进浏览器中确认:http://127.0.0.1:11434/ 。 下载 qwen2:0.5b 模型:Windows 电脑点击 win+R 输入 cmd 回车,Mac 电脑按下 Command(⌘)+Space 键打开 Spotlight 搜索输入“Terminal”或“终端”,然后复制命令行粘贴回车等待自动下载完成。 训练方面: 模型训练比推理复杂得多,是一个计算量极大的过程。获取参数面临计算复杂性问题。例如训练 Llama2 70B 这样的开源模型,需要约 10TB 的文本,通常来源于互联网的抓取,大约 6000 个 GPU,运行约 12 天,费用约 200 万美元,得到的参数文件约 140GB,压缩比约 100 倍,且是有损压缩。 整体架构方面: 基础层:为大模型提供硬件支撑,数据支持,如 A100、数据服务器等。 数据层:包括静态的知识库和动态的三方数据集。 模型层:有 LLm(如 GPT,一般使用 transformer 算法)或多模态模型(如文生图、图生图等,训练数据为图文或声音等多模态数据集)。 平台层:如大模型的评测体系或 langchain 平台等,提供模型与应用间的组成部分。 表现层:即应用层,是用户实际看到的地方。
2025-03-09
lora模型
LoRA 模型相关信息如下: Fooocus 程序默认用到了 3 个 SDXL 的模型,包括一个 base、一个 Refiner 和一个 LoRA。LoRA 模型默认放在 Fooocus_win64_1110\\Fooocus\\models\\loras 。如果单独安装,需要下载三个模型: SDXL 基础模型:https://huggingface.co/stabilityai/stablediffusionxlbase1.0/resolve/main/sd_xl_base_1.0_0.9vae.safetensors refiner 模型:https://huggingface.co/stabilityai/stablediffusionxlrefiner1.0/resolve/main/sd_xl_refiner_1.0_0.9vae.safetensors LoRA 模型:https://huggingface.co/stabilityai/stablediffusionxlbase1.0/resolve/main/sd_xl_offset_examplelora_1.0.safetensors 若部署了 SD 秋叶包,也可共用模型(大模型和 LoRA),可在 Fooocus_win64_1110\\Fooocus\\modules\\path.py 中修改路径为秋叶包模型对应的路径,配置好后点击 run.bat 文件启动。 Lora 全称 LowRank Adaptation Models,中文翻译为低阶自适应模型,作用在于影响和微调画面,通过它可以再现人物或物品的特征。大模型训练复杂且对电脑配置要求高,LoRA 采用在原模型中插入新的数据处理层的方式,避免修改原有模型参数,训练轻量化,显存达到 6G 即可开启训练。 有利用新版 SDXL 生成的 lora 如针线娃娃,需要使用 SDXL1.0 的模型才可以运行,触发词是 BJ_Sewing_doll。想体验可添加公众号【白马与少年】,回复【SDXL】。
2025-03-09