Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

入门视频

Answer

以下是为您推荐的一些 AI 入门视频:

  1. 《ChatGPT 诞生记:先捞钱,再谈理想|OpenAI 翻身史》
    • 作者/来源:林亦 LYI
    • 总结:ChatGPT 的背后是 OpenAI 这家公司,今天我们聊聊它的理想、成果与争议。
    • 链接:https://www.bilibili.com/video/BV1Te4y1w7D6/
    • 发布日期:2023/02/10
    • 必看星标:??
  2. 《【渐构】万字科普 GPT4 为何会颠覆现有工作流》
    • 作者/来源:YJango
    • 总结:视频是关于 GPT 的底层原理和未来影响。将抛开技术细节,少用专业名词,在整体功能上讲解 ChatGPT 的「工作原理」「制造过程」「涌现的能力」「未来的影响」以及「如何应对」
    • 链接:https://www.bilibili.com/video/BV1MY4y1R7EN/
    • 发布日期:2023/03/15
    • 必看星标:??
  3. 《终于有人把 chatGPT 说清楚了——全网最深入浅出的 chatGPT 原理科普》
    • 作者/来源:新石器公园
    • 总结:本视频深入浅出的讲解了 chatGPT 的基本原理和演化过程,让你真正理解这个世界最大的变化。
    • 链接:https://www.bilibili.com/video/BV1yV4y1k7Tc/
    • 发布日期:2023/05/06
    • 必看星标:??
  4. 《AI 大神 Karpathy 再发 LLM 入门介绍视频,入门必看!》
    • 作者/来源:Karpathy
    • 总结:详细介绍 LLM 训练的全部过程,包括预训练、有监督微调和强化学习。即使没有技术背景也可以看懂。将提供对 ChatGPT 等 LLM 完整训练流程的直观理解,包含许多示例,并可能帮助你思考当前的能力、我们所处的位置以及未来的发展方向。
    • 链接:未提供
    • 发布日期:未提供
    • 必看星标:未提供

希望这些视频能够帮助您入门 AI 领域。

Content generated by AI large model, please carefully verify (powered by aily)

References

1.1 入门:AI 学习路径与课程

|名称|作者/来源|总结|链接|发布日期|必看星标|图片||-|-|-|-|-|-|-||ChatGPT诞生记:先捞钱,再谈理想|OpenAI翻身史|林亦LYi|ChatGPT的背后是OpenAI这家公司,今天我们聊聊它的理想、成果与争议。|[https://www.bilibili.com/video/BV1Te4y1w7D6/](https://www.bilibili.com/video/BV1Te4y1w7D6/)|2023/02/10|??|||【渐构】万字科普GPT4为何会颠覆现有工作流|YJango|视频是关于GPT的底层原理和未来影响。将抛开技术细节,少用专业名词,在整体功能上讲解ChatGPT的「工作原理」「制造过程」「涌现的能力」「未来的影响」以及「如何应对」|[https://www.bilibili.com/video/BV1MY4y1R7EN/](https://www.bilibili.com/video/BV1MY4y1R7EN/)|2023/03/15|??|||终于有人把chatGPT说清楚了——全网最深入浅出的chatGPT原理科普|新石器公园|本视频深入浅出的讲解了chatGPT的基本原理和演化过程,让你真正理解这个世界最大的变化。|[https://www.bilibili.com/video/BV1yV4y1k7Tc/](https://www.bilibili.com/video/BV1yV4y1k7Tc/)|2023/05/06|??||

AI 大神Karpathy再发LLM入门介绍视频,入门必看!

卧槽,来了朋友们,Karpathy三个半小时LLM入门课程,如果想入门了解LLM的话必看这个视频。详细介绍LLM训练的全部过程,包括预训练、有监督微调和强化学习。1.预训练:数据、分词、Transformer神经网络的输入输出和内部结构、推理、GPT-2训练示例、Llama 3.1基础推理示例2.有监督微调:对话数据、"LLM心理学":幻觉、工具使用、知识/工作记忆、自我认知、模型需要token来思考、拼写、参差不齐的智能3.强化学习:熟能生巧、DeepSeek-R1、AlphaGo、RLHF。视频是23年十月那个视频的强化版本,讲的更加详细,即使没有技术背景也可以看懂。将提供对ChatGPT等LLM完整训练流程的直观理解,包含许多示例,并可能帮助你思考当前的能力、我们所处的位置以及未来的发展方向。下面是Gemini的详细总结,而且包含了时间轴,我也翻译了完整的视频,下载地址回复【Karpathy】获取字幕和原始视频,可以自己压制,压制完的太大了。[heading3]大型语言模型(LLM)和ChatGPT简介[content]视频目的(00:00-00:27):本视频旨在为普通受众提供一个关于大型语言模型(LLM),特别是像ChatGPT这样的模型的全面但易于理解的介绍。目标是建立思维模型,帮助理解LLM工具的本质、优势和局限性。文本框的奥秘(00:27-00:41):探讨用户与ChatGPT等LLM交互的核心界面——文本框。提出用户输入内容、模型返回文本的机制问题,以及背后对话的本质。

AI 大神Karpathy再发LLM入门介绍视频,入门必看!

神经网络训练的目标(15:15-17:03):训练神经网络的目标是让模型学习token在序列中彼此跟随的统计关系,即预测给定上下文(token序列)后,下一个最有可能出现的token。Token窗口(15:15-17:03):训练时,模型从数据集中随机抽取固定长度的token窗口(例如8000个token)作为输入。神经网络的输入与输出(17:03-18:21):输入:Token序列(上下文)。输出:预测下一个token的概率分布,词汇表中每个token都有一个概率值。随机初始化与迭代更新(17:38-18:54):神经网络初始参数是随机的,预测也是随机的。训练过程通过迭代更新参数,调整预测结果,使其与训练数据中的统计模式相匹配。损失函数与优化(18:21-20:11):训练过程使用损失函数来衡量模型预测与真实token的差距。优化算法(如梯度下降)用于调整参数,最小化损失函数,提高预测准确率。神经网络内部结构:Transformer(20:11-23:31):现代LLM的核心架构是Transformer,它是一种复杂的数学函数,包含数百万甚至数十亿个参数。参数(权重)(20:43-21:57):参数是神经网络学习知识的载体,训练过程的目标是找到参数的最佳设置。数学表达式(21:57-22:32):Transformer由一系列简单的数学运算(如矩阵乘法、加法、非线性激活函数等)构成。Transformer架构(22:32-23:31):Transformer包含注意力机制和多层感知器等组件,能够有效地处理序列数据并捕捉token之间的复杂关系。

Others are asking
有没有优质的系统的coze入门网课?
以下是一些优质的系统的 Coze 入门网课推荐: 另外,还有“一泽 Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力”,这可能是全网最好的 Coze 教程(之一),即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。其核心看点包括通过实际案例逐步演示用 Coze 工作流构建能够稳定按照模板要求生成结构化内容的 AI Agent、开源 AI Agent 的设计到落地的全过程思路、10+项常用的 Coze 工作流的配置细节、常见问题与解决方法等。适合任何玩过 AI 对话产品的一般用户,以及希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。但需注意,本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。
2025-04-14
七天入门计划
以下是为您提供的七天入门 AI 的计划建议: 第一天: 开始接触李宏毅的生成式人工智能课程。 资源:在 B 站直接搜索《李宏毅 2024 春《生成式人工智能导论》。 第二天至第十四天: 抽空陆续花 2 周时间学完李宏毅的课程。 第五天: 研究并开始使用 Kimi。 参考资料: 。 抱着每天向 kimi 问 100 个问题的心态,调整自己的思考模式,在工作和生活中养成有问题问 AI 的习惯。您还可以参考公众号文章【每天问 Kimi 们 100 个问题,你就 AI 入门了】。 在学习过程中,建议做好笔记,总结所学知识和心得体会,以便更好地掌握和应用。
2025-04-13
给我提供一份清华大学104页的deepseek从入门到精通的手册的链接
以下是为您找到的与清华大学 DeepSeek 相关的一些资料链接: https://pan.quark.cn/s/56e2713e95f4 https://docs.qq.com/doc/DSG9SWFpjVXI3aHZ1 清华大学 104 页的 DeepSeek 从入门到精通的手册:https://waytoagi.feishu.cn/record/FjWorH (2 月 11 日更新附录)
2025-04-11
给我提供一份清华大学104页的deepseek从入门到精通的手册
以下是为您整合的相关信息: 清华大学出品了《DeepSeek:从入门到精通》的指南,该指南详细阐述了 DeepSeek 的功能,如智能对话、文本生成、代码生成、自然语言理解等,并探讨了其使用方法,包括推理模型与通用模型的区别、提示语设计策略等,旨在帮助用户更好地掌握这一 AI 工具的使用,提升工作效率和创新能力。您可以通过以下链接获取:https://waytoagi.feishu.cn/record/QAURr4CNGeJ5GIcvU0nc9X3dndg 。 此外,还有一些相关的更新和资料,如 2 月 11 日更新附录的清华大学 104 页 Deepseek 从入门到精通、1 月 21 日更新热门 AI deepseek 推荐及案例征稿通知、1 月 14 日更新爱好者交流 g 群和微信群、12 月 30 日更新案例 24,25,26 等。 同时还有关于 AI 赋能教学的课程实施流程及案例亮点等内容,如利用 AI 生成开放性问题引发深度思考、通过多维数据分析支持全面客观的判断、通过辩论提升批判性思维和表达能力等。
2025-04-11
入门:Ai绘画
以下是为您提供的 AI 绘画入门相关的资源和教程: 在“通往 AGI 之路介绍.pdf”中,有关于 AI 绘画入门的部分,包括产品工具与案例实战,开箱即用。 以下是一些 B 站的视频教程链接: 「AI 绘画」软件比较与 stable diffusion 的优势: 「AI 绘画」零基础学会 Stable Diffusion: 「AI 绘画」革命性技术突破: 「AI 绘画」从零开始的 AI 绘画入门教程——魔法导论: 「入门 1」5 分钟搞定 Stable Diffusion 环境配置,消灭奇怪的报错: 「入门 2」stable diffusion 安装教程,有手就会不折腾: 「入门 3」你的电脑是否跑得动 stable diffusion?: 「入门 4」stable diffusion 插件如何下载和安装?: 还有 SD 新手从 0 入门的 AI 绘画教程,包括以下章节: 第一节课:AI 绘画原理与基础界面 第二节课:20 分钟搞懂 Prompt 与参数设置,你的 AI 绘画“咒语”学明白了吗? 第三节课:打破次元壁!用 AI“重绘”照片和 CG 第四节课:AI 绘画模型,“画风”自由切换 第五节课:提高 AI 绘画分辨率的方式 第六节课:LoRa|Hypernetwork 概念简析 第七节课:定向修手修脸,手把手教你玩转局部重绘! 第八节课:提示词补全翻译反推,“终极”放大脚本与细节优化插件 第九节课:LoRA 从原理到实践 第十节课:零基础掌握 ControlNet! 您可以通过以上资源进行学习,祝您在 AI 绘画领域学有所成!
2025-04-10
AI入门
以下是为您提供的 AI 入门的相关指导: 一、Python + AI 入门 在深入学习 AI 时,编程可能会让您感到困难,尤其是对于不会代码的朋友。但别担心,这里有一份 20 分钟的简明入门指南,能帮助您更快掌握 Python 和 AI 的相互调用,并在接下来的 20 分钟内完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。 关于 Python: Python 就像哆啦 A 梦,拥有装满各种道具的标准库,遇到问题时可直接使用。若标准库道具不够,还能通过 pip 一类的工具从 GitHub 一类的分享代码平台订购新道具。Python 在 AI 领域被广泛使用,遍地是大哥。 关于 OpenAI API: OpenAI 通过两种方式提供服务,一是通过 ChatGPT 提供开箱即用的服务,直接对话即可;二是通过 OpenAI API 提供更加灵活的服务,通过代码调用完成更多自动化任务。 二、JavaScript 的 AI 堆栈入门 尽管当前版本是一个很好的起点,但仍在逐步完善,路线图包括: 1. 交互式 CLI 用于 createaistack,开发人员可选择自己的项目脚手架和依赖项。 2. 用于高级用例的事务性数据库(例如,在问答中保留问题、用户偏好等)。 3. 更多的向量数据库和部署平台选项。 4. 用于开源模型的轻量级微调步骤。 同时,对在创建过程中发挥重要作用的开源项目表示感谢,如 Tailwind、ai sdk、dotenv、Next.js、langchain.js 等。 三、新手学习 AI 的方法 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能及其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中,有一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,您可根据兴趣选择特定模块深入学习,一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。知识库中有很多大家实践后的作品、文章分享,欢迎您实践后也进行分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。
2025-04-10
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
需要做一个自动化出视频的工作流
以下是一个关于自动化出视频工作流的详细介绍: 优势: 全自动化处理,解放双手。 40 秒快速出片,效率提升。 成本低廉,每条仅需 0.0x 元。 输出质量稳定专业。 DeepseekR1 保证文案质量。 还能改进,例如可以加入配套 BGM,让视频更有感染力;增加更丰富的画面内容和转场效果;使用免费节点替代付费插件,进一步降低成本;优化模板样式,支持更多展示形式;增加自动化程度,支持批量处理。 工作流程: 1. 可以在扣子商店体验,建议自己搭建。 2. 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 3. 选择发布渠道,重点如飞书多维表格,填写上架信息(为了快速审核,选择仅自己可用),确认发布等待审核,审核通过后即可在多维表格中使用。 4. 创建飞书多维表格,添加相关字段,配置选择“自动更新”,输入相关字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 5. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 6. 全自动视频合成使用多视频融合插件,一键导出成品。但需注意节点产生的视频是异步生成,可能无法马上展现,需耐心等待几秒。 如果您还有其他疑问或需要进一步的帮助,请随时联系。
2025-04-14