Navigate to WaytoAGI Wiki →
Home/All Questions
如何看待deepseek
以下是关于 DeepSeek 的相关信息: 华尔街分析师的反应:DeepSeek 展示出媲美领先 AI 产品性能的模型,成本仅为一小部分,在全球主要市场的 App Store 登顶。但 Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑,高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于 GPT。采用 GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。
2025-03-06
Deepseek微调
DeepSeek 微调相关信息如下: DeepSeek 有更聪明的 R1zero 实验版本,它采用完全从零开始的强化学习,无需人类监督训练,学会了用更多思考步骤解决推理任务和反思推理步骤,但存在输出内容可读性差、语言混合、风险不可控等问题,所以常见的是经过冷启动与微调的 R1 版本,以确保生成内容稳定、安全、道德、无害。 在模型蒸馏微调方面,会带着大家复现模型的蒸馏和微调,并讲解相关知识。用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。R1 是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面,使两个模型都更强。 DeepSeek 在 2024 年 4 月推出的 DeepSeekMath 模型中首次采用了 GRPO(Group Relative Policy Optimization)算法,之后的 V3 和 R1 也应用了该算法提升模型的推理能力。
2025-03-06
Transformer是什么?
Transformer 是一种注意力模型,也被称为变形金刚模型。它源于 Google 团队在 2017 年发布的论文《Attention is All Your Needs》。 Transformer 是一种深度学习模型,核心思想是“Attention is all you need”。其主要用于处理序列数据,包括当下热门的自然语言处理(NLP)任务。与传统模型不同,Transformer 完全基于注意力机制,不依赖传统的循环神经网络(RNN)或卷积神经网络(CNN)的计算架构。 基于 Transformer 的模型众多,例如最流行的 BERT,它是“来自 Transformer 的双向编码器表示”的缩写。BERT 经过在庞大文本语料库上的训练,已成为自然语言处理的通用模型,可用于文本摘要、问答、分类、命名实体识别、文本相似度、攻击性信息/脏话检测、理解用户查询等一系列任务。 此外,Transformer 不仅在自然语言处理领域表现出色,还在自然语言处理之外的领域掀起浪潮,如作曲、根据文本描述生成图像以及预测蛋白质结构。像 ChatGPT 这样的模型在闲聊中也能展现出更多的世界知识和某种程度的推理能力,能够更好地理解人类语言的含义和上下文,并生成更自然流畅的语言表达。
2025-03-06
Prompts(提示词)| 社区内prompt框架课程收录
以下是关于 Prompt(提示词)的相关内容: 一、Prompt 之道:清晰表达 1. 如何清晰表达 各种框架能帮助您将脑海中的想法通过特定角度描述出来,比如明确要做的事情、背景、目标、任务、数据和输出等。这些框架虽表述不同,但作用相似,能比空想更高效。 您可以在使用框架时,换不同预设角度描述同一物体。例如,去年有人用 langGPT 的框架模拟善解人意的老师讲解任何学科的概念。 2. 拓展阅读 :社区内 prompt 框架课程收录 :各个场景提示词收录 此外,还有李继刚关于文生文中 prompt 的道、术、用的万字说明,相关链接如下: https://mp.weixin.qq.com/s/R8UbrixkKHXE4dnVt0VMvw 豆包网页端:https://www.doubao.com/chat/?channel=browser_landing_page 豆包桌面客户端:
2025-03-06
用哪个ai平台,可以识别图像户型图,给做一个三居改四居的设计方案
目前,市面上还没有专门的 AI 平台能够直接根据图像户型图为您生成三居改四居的设计方案。但是,一些与室内设计相关的软件和平台可能会对您有所帮助,例如酷家乐、三维家等,它们具有一定的户型设计和修改功能,您可以尝试使用这些平台,并结合自己的需求和创意来完成设计方案。
2025-03-06
查找论文的工具
以下是一些查找论文的工具: 1. Claude + Gamma.app:可以快速寻找符合条件的论文,提取精炼论文中某部分信息,还能找到适合的 PPT 制作工具并教会使用。例如,通过与 Claude 对话,可以解决学术网站条件搜索的问题,如搜索营销领域最权威的期刊、相关期刊中关于 chatgpt 的最新论文等,并进行摘要提取等操作。 2. Elicit:能让用户直接向文章本身提出问题,有助于在不必阅读整篇文章的情况下,了解文章是否涉及提出的问题。 3. 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 4. 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,帮助精简和优化论文内容。 5. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:用于数学建模和优化的软件,帮助进行复杂的数据分析和模型构建。 6. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化论文编写过程。 7. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 在使用这些工具时,要结合自己的写作风格和需求,选择最合适的辅助工具。同时,注意对 AI 生成内容的仔细甄别。
2025-03-06
什么是RAG
RAG(RetrievalAugmented Generation)即检索增强生成,是一种结合检索和生成能力的自然语言处理架构,旨在为大语言模型(LLM)提供额外的、来自外部知识源的信息。 大模型存在一些缺点,如无法记住所有知识(尤其是长尾知识)、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有以下优点: 1. 数据库对数据的存储和更新稳定,不存在模型学不会的风险。 2. 数据库的数据更新敏捷,增删改查可解释,且对原有知识无影响。 3. 数据库内容明确、结构化,加上模型的理解能力,能降低大模型输出出错的可能。 4. 知识库存储用户数据,便于管控用户隐私数据,且可控、稳定、准确。 5. 数据库维护可降低大模型的训练成本,新知识存储在数据库即可,无需频繁更新模型。 RAG 的核心流程是根据用户提问,从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到 prompt(提示词)中,提交给大模型,此时大模型的回答就会充分考虑到“包含答案的内容”。其最常见应用场景是知识问答系统。 一个 RAG 的应用可抽象为 5 个过程: 1. 文档加载:从多种不同来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据以及 Python、Java 之类的代码等。 2. 文本分割:文本分割器把 Documents 切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储:包括将切分好的文档块进行嵌入转换成向量的形式,以及将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. Output(输出):把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。
2025-03-06
国产AGI进程到哪了
2023 年之前,国内 AI 行业自认为和美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。上半年国内坚信靠资金和卡能实现“大炼钢铁”,许多大厂和创业公司都想创造国产 AGI,但下半年发现不容易后纷纷转向“垂直应用”“商业化”,不再提 AGI。目前国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。百度的“文心 4.0”和即将发布的阿里的“通义千问”是国内较好的模型。 2024 年,国内多家厂商竞相推出新型推理模型,AI 与数学结合被视为实现 AGI 的关键。在这一年,AI 音频能力有长足进展,“全真 AI 颜值网红”出现,游戏 AI NPC 有里程碑式进展,AI 男/女朋友聊天基本成熟,实时生成的内容开始在社交媒体和广告中出现,AI Agent 有明确进展,可穿戴全天候 AI 硬件层出不穷,华为昇腾生态开始形成,国内推理芯片开始国产替代。但同时,AI 造成的一些问题也开始进入公众视野,AI 立法、伦理讨论仍大规模落后于技术进展。预计到 2025 2027 年,AI 相关技术还会有更多突破和发展,同时也会带来更多社会问题。
2025-03-06
从图片提取文字,包含艺术字
以下是关于从图片提取包含艺术字的文字的相关信息: 艺术字生成:可以选择模型图片 2.1,并输入提示词,参考案例提示词如“金色立体书法,‘立冬’,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风”等。原文链接:https://mp.weixin.qq.com/s/jTMFYKxsN8dYNZu3VHKBnA MewXAI 平台:这是一款强大专业且新手友好、操作简单的 AI 绘画创作平台。其中的 AI 艺术字功能是其最新玩法,能把光影文字、隐藏文字、艺术字融入艺术作品,美观且实用。访问地址:https://www.mewxai.cn/ LayerStyle 副本中的 LayerUtility TextImage:支持从文字生成图片以及遮罩,可调整字间距、行间距、横排竖排、文字的随机变化(包括大小和位置)等。节点选项包括 size_as、font_file、spacing、leading、horizontal_border、vertical_border、scale、variation_range、variation_seed、layout、width、height、text_color、background_color 等。
2025-03-06
用ai写小说
以下是关于用 AI 写小说的一些方法和建议: 1. Stuart 提出的 coze 工作流: 用 bing 搜索标题相关内容。 用程序将搜索结果结构化(不熟悉程序的可忽略或复制文中代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型来写文章。 输出文章内容。 2. 陈财猫的技巧: “显式归纳与列出你想要的文本特征”,例如明确文风、文笔特点,如“几句话一换行”“以短句和对话为主,结构紧凑”“用词直白犀利”等,在调试中把握增加与删除的度。 “通过 prompt 中的描述与词语映射到预训练数据中的特定类型的文本,从而得到想要的相似样本”,直接点出文本类型,如“充满张力的女性复仇文,可能会出现在晋江文学城或者起点中文网的古代言情分类中”。 此外,还有 AI x 即兴戏剧工作坊中提到的用 midreal.ai 以「即兴喜剧」开头写短篇小说。
2025-03-06