Navigate to WaytoAGI Wiki →
Home/All Questions
有做PDF的AI吗
以下是一些与 PDF 相关的 AI 工具和应用: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 此外,在全球高增速 Top50 中,有“PDF ai”这一产品。并且,现在可以利用 AI 把 PDF 一键变成能玩的可视化网页,具体操作思路来自于歸藏,使用 Claude 3.7 Sonnet 效果较好,在使用 Prompt 时要注意修改作者信息和媒体资源等细节部分。
2025-03-14
AI如何结合业务数据,输出一些汇总表格?
AI 结合业务数据输出汇总表格通常需要以下步骤: 1. 数据收集与整理:首先,需要收集相关的业务数据,并对其进行清洗和预处理,以确保数据的质量和一致性。 2. 选择合适的 AI 技术和工具:根据数据特点和业务需求,选择适合的 AI 算法和工具,如机器学习中的分类、回归算法,或者数据挖掘工具等。 3. 数据建模:运用选定的 AI 技术对数据进行建模,建立能够分析和处理数据的模型。 4. 训练模型:使用预处理后的数据对模型进行训练,不断优化模型的参数,以提高模型的准确性和性能。 5. 数据应用与输出:将训练好的模型应用于新的数据,生成分析结果,并将结果以汇总表格的形式进行输出。 在实际操作中,还需要注意数据的安全性和隐私保护,以及对模型结果的评估和验证,确保输出的汇总表格准确、有用且符合业务需求。
2025-03-14
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
ollama框架有哪些推荐
Ollama 是一个开源的框架,具有以下特点和功能: 1. 旨在简化在本地运行大型语言模型(LLM)的过程,提供了简单的 API 来创建、运行和管理模型,还有预构建模型库,降低使用门槛,适合初学者或非技术人员使用。 2. 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,可用于不同应用场景。 3. 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 4. 提供模型库,用户可从中下载不同模型,这些模型有不同参数和大小,以满足不同需求和硬件条件。模型库可通过 https://ollama.com/library 查找。 5. 支持用户自定义模型,例如修改模型的温度参数来调整创造性和连贯性,或者设置特定的系统消息。 6. 提供 REST API,用于运行和管理模型,以及与其他应用程序的集成选项。 7. 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 安装 Ollama 可通过官方下载地址 https://ollama.com/download 进行。安装完成后,可通过访问相关链接判断是否安装成功,在命令行中运行相应命令即可使用,如运行本地大模型的命令。还可通过 ollama list 确认模型下载情况。 此外,在 termux 软件中进行相关操作时,需执行如 aptget update、安装 curl 命令、安装 ollama 命令等。启动模型时,以 phi3 模型为例,在 termux 软件中执行命令 ollama run phi3 并等待下载完成。当然,Ollama 还有很多其他模型,如有需要可在 ollama 官网自行查看命令与下载。
2025-03-14
MCP
模型上下文协议(MCP)是一种全新的开放协议,用于标准化地为大语言模型(LLMs)提供应用场景和数据背景。它就像 AI 领域的“USBC 接口”,能让不同的 AI 模型与外部工具和数据源轻松连接。 MCP 的好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 与传统 API 相比,通常 AI 系统连接外部工具时,需要单独整合多个不同的 API,每个 API 都有独立的代码、文档、认证方式、错误处理和后续维护,极大地增加了开发复杂度。传统 API 就像每扇门都有一把不同的钥匙,要求开发者为每个服务或数据源单独编写代码和整合方案。 在某些情况下,传统 API 更适合,比如应用场景需要精准且严格受控的交互方式,包括需要细粒度控制、功能严格限制,更偏好紧耦合以提升性能,希望最大化交互的可预测性。 Anthropic 公司最早开发了 MCP,现在它已成为一个开放协议,越来越多的企业和开发者开始采用。 要开始使用 MCP,可按照以下步骤: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 例如,Claude 可以通过简单的 MCP 集成直接连接到 GitHub、创建新存储库并创建 PR。
2025-03-14
论文修改
在论文修改方面,以下是一些相关的信息和工具推荐: 常用的论文写作 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化的软件,帮助进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 DALL·E 3 论文相关: OpenAI 发布的 DALL·E 3 相关论文总共有 19 页,作者共有 15 位,半数为华人,分别来自 OpenAI 和微软。论文提出了一种解决提示跟随问题的新方法:文本描述改进。建议通过为数据集中的图像生成改进的文本描述来解决训练数据集中文本图像对质量较差的问题。论文地址:https://cdn.openai.com/papers/dalle3.pdf 医学课题修改的 AI 工具推荐: 1. Scite.ai:为研究人员等打造的创新平台,提供引用声明搜索等工具,简化学术工作。 2. Scholarcy:可从文档中提取结构化数据,生成文章概要,包含关键概念等板块内容。 3. ChatGPT:强大的自然语言处理模型,能提供医学课题的修改意见。 使用这些工具时,要结合自己的写作风格和需求,选择最合适的辅助工具。同时,对于 AI 生成的内容要仔细甄别。
2025-03-14
哪个agent可以制作图表?
以下是一些可以制作图表的 agent: Cursor:能够全自动写程序、装依赖、debug 等,为用户生成所需的图表,例如生成谷歌和亚马逊最近五年的股价对比图,以及对图片进行特定形状的处理。 E2b 团队:制作了。 共建者缱绻怡然:制作了中的 AI Agent 图谱。
2025-03-14
Gemini  2.0 Flash Experimenta
Google 发布的推理模型 Gemini 2.0 Flash Experimental 具有多模态理解、推理、编码等最佳用途,其亮点功能包括展示模型的思维推理过程,能解决复杂问题,应对代码和数学难题。可在 AI Studio 免费体验,据称其低版本已迅速超越 OpenAI 的 o1 模型,Pro 版本尚未发布。相关链接: 。 Gemini 2.0 Flash 现在不仅能通过聊天生成图像,还能通过聊天对话方式任意编辑图像的局部或者全部而不改变图像其他部分。相关案例整理: https://x.com/linaqruf_/status/1899977818563633466?s=46 https://x.com/robertriachi/status/1899854394751070573?s=46 https://x.com/theomediaai/status/1899871111338230110?s=46 https://x.com/techn0_sap1en/status/1899890369044897938?s=46 https://x.com/ai_for_success/status/1899842790072406214?s=46 https://x.com/linusekenstam/status/1899946807565717819?s=46 Gemini 2.0 Flash Experimental 实测设计一个玩具的从 0 到 1 的搭建过程,虽然中间很多细节对不上,但真的兼顾了上下示意图,并且连贯了起来。此外,还有关于一致性测试、视觉陷阱检测等方面的应用,如多图关联创作(隐藏评分点:光影一致性/透视连续性/元素融合度)、逻辑矛盾识别(观察是否提示环境矛盾)。在不同领域也有各种应用,如设计游戏、生成恐怖悬疑小说、装修毛坯房、制造火箭、教人画画等。操作时,右侧选择「Gemini 2.0 Flash Experimenta」并选中模型名。
2025-03-14
我可以把我的论文文字给ai,让他帮我生成数据图标吗
目前在 AI 领域,是可以将您的论文文字提供给 AI 来生成数据图表的。例如,在一些案例中,人们会要求 AI 对特定的问卷统计数据生成柱状图、饼图等。但在使用过程中可能存在一些问题,比如数据库更新不够及时、深入讲解不足、部分操作无法实现等。同时,像 Midjourney 这样的工具在生成 UI 设计相关的图表时,可能存在不够规范、文字混乱等情况,但也能作为风格参考。您在使用时可以不断提出要求和调整,以获得更符合您需求的数据图表。
2025-03-14
如何登录KIMI
要登录 Kimi,您可以参考以下步骤: 1. 推荐两个实用的浏览器插件:在(不方便下载的,文末附下载链接)。 2. 在浏览器中登录自己的 Kimi 账号,关联网页版。 安装相关插件的特点和注意事项: 1. Kimi Copilot网页总结助手: 特点:极简,点击一键总结,没有其它花里胡哨的功能;Kimi 无法访问的网页也可以进行总结,如推特等;英文文章直接用中文总结要点;支持 Dark Mode。 注意:本插件为第三方爱好者开发,不是 Kimi 或月之暗面官方产品;由于 Arc 等浏览器没有所需的 API,所以本插件在 Arc 等浏览器无法使用。 2. Kimi 阅读助手: 特点:用更简单的方式使用 Kimi。 注意:需要 Chrome 114 及以上版本才能正常使用扩展;暂不支持 Arc 游览器(Arc 缺少相关 API)。 在 Obsidian 中使用 Kimi 的步骤: 1. 用命令面板打开刚才创建的页面,默认快捷键 Ctrl+P 。 2. 在弹出的搜索框中输入插件名称:custom frames 。 3. 在下拉选项中选择 OpenKimi 。 4. 打开刚才设置好的 Kimi 窗口。 以上是关于登录 Kimi 以及相关插件和使用的信息。
2025-03-14