Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何用gpt,对标签进行筛选

Answer

以下是关于您提到的问题的相关信息:

在数据标注方面,以 ChatGPT 的追赶者们为例,如 Claude ,作者未事先培训标注员关于 helpfulness 和 harmfulness 的内容以保证数据多样性。标注员要求是美国硕士以上,通过看写作水平、表达能力等筛选出约 20 名优秀的 MTurk 标注员标注了 80%的数据,同时在 Upwork 上标注更高质量但数量较少的数据集。标注界面中用户二选一,并有不同置信度选项,还涉及 RM 和 PPO 等。

在 Embedding 增强 GPT 能力方面,OpenAI 发布的文档说明可通过两步搜索来实现:

  1. 准备搜索数据(仅一次):
    • 搜集数据:获取公开或私有数据。
    • 切块:将文档切分成短小部分。
    • 嵌入:通过 OpenAI API 对切块数据进行 Embedding 结果。
    • 存储:使用向量数据库保存大型数据集的 Embedding 结果。
  2. 搜索(每次查询一次):给定用户问题,从 OpenAI API 生成查询的 embeddings ,按与查询相关性对文本部分排序,推荐使用余弦相似性距离函数。
  3. 提问(每次查询一次):将问题和最相关部分插入发送给 GPT 的消息中返回答案。

Embedding 共有以下作用:

  • 搜索(结果按与查询字符串的相关性排名)
  • 聚类(文本字符串按相似性分组)
  • 建议(包含相关文本字符串的项目)
  • 异常检测(识别相关性小的离群值)
  • 多样性测量(分析相似性分布)
  • 分类(文本字符串按最相似标签分类)
Content generated by AI large model, please carefully verify (powered by aily)

References

(3)ChatBot是怎么炼成的?

作者并没有事先培训标注员什么是helpfullness和harmfulness,这样保证数据多样性标注员要求很高,是美国的硕士以上。并且把低质量的滤掉了,把优秀的MTurk标注员筛选出来,大概20人,标注了80%的数据。筛选的办法就是看写作水平,表达能力,简单暴力有效。同时在Upwork上标注更加高质量但是数量较少的数据集,因为Upwork是paid-by-hour,MTurk是paid-by-task标注界面如下,用户二选一,并且有不同的置信度选项RM和PPOAnthropic称RM为PM(Preference Model),并且发现PM模型越大,数据越多,是会涨点的,这个跟ChatGPT的结论不一样。ChatGPT里面说RM模型不能太大,不好训练,容易发散,所以选择6B的RM模型PPO阶段的损失函数少了InstructGPT的第三项SFT项,因为作者发现Policy模型和PM模型足够大的话,不加那一项效果也会持续提升$$r_{\text{total}}= r_{\text{PM}}-\lambda_{\text{KL}}D_{\text{KL}}(\text{policy}||\text{policy}_0)$$

认识大模型 Embedding 技术加实战

针对上面的问题,OpenAI发布过这样一篇文档,说明如何使用两步搜索来增强GPT的能力:搜索:搜索内部的知识库,检索相关文本。请求:将检索到的文本内容部分发送给GPT大模型,并向其提出问题。具体的操作步骤如下:1、准备搜索数据(仅一次)1)搜集数据:获取需要的数据,公开数据或者私有的数据2)切块:将文档切分成短小的3)嵌入:通过OpenAI API对切块的数据进行Embedding结果,4)存储:存储Embedding结果,对于大型数据集的Embedding结果,可以使用向量数据库进行保存。2、搜索(每次查询一次)给定用户问题,从OpenAI API生成查询的embeddings使用embeddings,按照与查询相关性对文本部分进行排序❝距离函数推荐使用:余弦相似性3、提问(每次查询一次)将问题和最相关的部分插入到发送给GPT的消息中返回GPT的答案[heading3]Embedding共有哪些作用[content]搜索(其中结果按与查询字符串的相关性进行排名)聚类(其中文本字符串按相似性分组)建议(建议包含相关文本字符串的项目)异常检测(识别出相关性很小的离群值)多样性测量(分析相似性分布)分类(其中文本字符串按其最相似的标签分类)

Others are asking
gpt充值
以下是关于 GPT 充值的相关内容: 苹果系统安装、订阅 GPT4 教程 一、注册准备 1. 若使用的邮箱注册过 Apple ID,建议换全新邮箱,最好使用 iCloud 或谷歌邮箱。 2. 若使用的手机号码以前注册过多个 Apple ID(2 个或 2 个以上),强烈建议使用全新手机号码。 3. 若电脑端注册始终出现提示,可尝试换到手机端,使用 Safari 浏览器注册。 4. 若 IP 地址被风控,使用美国 IP 地址注册。 5. 密码中不要包含名字,年龄需大于 18 岁。 二、使用支付宝购买礼品卡充值订阅 GPT4 1. 支付宝购买礼品卡 来到支付宝首页,在左上角位置选择美国城市(如纽约),在底部位置选择“大牌礼卡低至 9 折”。 选择 App Store。 第一次购买需绑定美区 ID,按指示绑定,绑定后输入要充值的美金金额。 直接用支付宝支付。 根据当天汇率,实际支付的人民币金额会有所不同。 完成付款后点击订单列表。 复制礼品卡号码。 2. 充值到美区 ID 来到 App Store,点击右上角的人形头像,点击兑换充值卡或代码。 点击手动输入兑换码。 粘贴礼品卡号码,点击兑换。 成功充值到美区 ID 账号。 3. 到 ChatGPT 订阅 Plus 打开 ChatGPT,用谷歌邮箱登录后点击最上方的 Get Plus。 点击 Upgrade to Plus。 之后会弹出苹果支付页面,确认订阅后每个月将会在美区 ID 账户里扣款,若想保持订阅,每个月需确保账户有足够金额。 若中途不想继续订阅了,可到订阅列表中取消订阅。 极简未来(Link.AI)平台充值 机器人应用背后使用到的大模型等能力需要付费。平台的计费规则如下: 1. 详细版计费规则可参考:https://docs.linkai.tech/platform/funds/price 。 2. AI 大模型相关的功能交互主要用 Token 作为单位,不同大模型能力,平台一积分能兑换到的 Token 数不同,能力越强的大模型一积分所能兑换到的 Token 数越少,如日常使用的 GPT 3.5 能力的大模型,平均每次对话大概消耗不到 20 积分。 3. 除每天平台签到可免费领取 50 到几百的积分外,充值 19 元可兑换 10000 积分,使用成本不算高。
2025-04-18
chatGPT
ChatGPT 是一种由 OpenAI 开发的基于 GPT(生成式预训练变换器)架构的人工智能模型。 它的工作原理是:从网络、书籍等来源获取大量人类创作的文本样本,然后训练神经网络生成“类似”的文本。特别是能够从“提示”开始,继续生成“类似于训练内容”的文本。 ChatGPT 中的实际神经网络由大量简单元素组成,基本操作是为每个新单词(或单词部分)生成“输入”,然后将其“通过其元素”。 其具体工程相当引人入胜,最终(至少在它可以使用外部工具之前),ChatGPT 仅仅从它积累的“传统智慧统计数据”中提取了一些“连贯的文本线索”。 ChatGPT 基于 OpenAI 最先进的语言模型 gpt3.5turbo。使用 OpenAI 的 API,你可以用它构建自己的应用来做很多事情,比如起草邮件、写 Python 代码、回答关于一组文档的问题、创建会话代理、给软件提供自然语言接口、辅导各种学科、语言翻译、假扮游戏或其他内容的角色等。 目前 ChatGPT 官网有两个版本,分别是 GPT3.5 和 GPT4。GPT3.5 是免费版本,拥有 GPT 账号即可使用,但智能程度不如 GPT4 高,且无法使用 DALL.E3(AI 画图功能)和 GPTs 商店和高级数据分析等插件。想要使用更多功能更智能的 GPT4 需要升级到 PLUS 套餐,收费标准是 20 美金一个月,当然 GPT4 还有团队版和企业版,功能更多、限制更少,但费用也更贵,一般推荐使用 PLUS 套餐。 在注册 ChatGPT 账号之前,建议先注册一个谷歌账号,因为国外很多软件支持谷歌账号一键登录,注册谷歌账号支持国内手机号码和国内邮箱验证,过程简单。
2025-04-12
gpt4o图像生成提示词有哪些
以下是一些 GPT4o 图像生成的提示词示例: 1. 将这张图更改为蓝色氛围,星星图标改为魔法棒图标,同时将里面文案描述的主题改为其他的。 2. 帮我生成一张这样的 UI 设计稿:Peerlist 邀请链接界面分析,界面内容。 3. 一张逼真的照片,描绘了一匹马在宁静的海洋表面从右向左奔驰,准确地描绘了飞溅的水花。 Realistic photograph of a horse galloping from right to left across a vast,calm ocean surface,accurately depicting splashes,reflections,and subtle ripple patterns beneath their hooves.Exaggerate horse movements but everything else should be still,quiet to show contrast with the horse's strength.clean composition,cinematographic.A wide,panoramic composition showcasing a distant horizon.Atmospheric perspective creating depth.zoomed out so the horse appears minuscule compared to vast ocean.horse is right at the horizon where ocean meets sky.use rule of thirds to position horse.size of horse is 1% size of entire image because camera is so far away from subject.camera view is super close to the ground/ocean like a worm's eye view.horse is galloping right where ocean meets the sky 4. 生成一张 2006 年夏天的周六多伦多农夫市场的逼真照片,那天是六月的美好时光,人们在购物和吃三明治。焦点应是一个穿着牛仔工装裤、啜饮草莓香蕉奶昔的年轻亚洲女孩——其余部分可以模糊。照片应让人联想到 2006 年的数码相机拍摄的效果,带有像打印照片一样的日期和时间戳。画幅比例应为 3:2
2025-04-11
GPT提示词
以下是关于 GPT 提示词的相关内容: 夙愿:AI 快速总结群聊消息 提示词:需要编写一套提示词让 GPT 执行总结文字内容的工作,包括单人发言版和多人发言版。 GPT 处理:将提示词和文字原文发送给 GPT,等待其输出完毕后复制粘贴到文本编辑器中,整理并删除无关内容,替换双星号。 头脑风暴常用的 20 个 prompt:列举了 20 个不同类型的提示词,如 Brainwriting Prompt、Reverse Brainstorming Prompt 等。 子瞻:五个 GPTs 破解攻略 GPT 使用的两大痛点:创建满足指定需求的提示词和找到满足指定需求的 GPTs。 学习高质量提示词的好处:学习高手的 Prompt 方法和更好地使用对应的 GPTs。 五大破解攻略的具体方法: 直接法:适用于未设置提示防御和未限定回答领域,示例中只要四个单词,粗暴好用。 设置遗忘:适用于 GPTs 设置了简单的提示防御。 复述法:适用于可获取 OpenAI 官方的设定。
2025-04-10
随着 ChatGPT、Deepseek 等 AI 技术的爆发式发展,人工智能正在加速渗透各行业应用场景,包括茶饮行业。请你对 AI 技术在茶饮行业的影响进行研究分析,并提出 AI 技术可以在连锁奶茶店如何应用的设想。
以下是关于 AI 技术在茶饮行业的影响分析及在连锁奶茶店应用的设想: 影响分析: 1. 提升运营效率:通过自动化流程和智能预测,优化库存管理、员工排班等环节。 2. 改善客户体验:利用智能客服快速响应顾客咨询,提供个性化推荐。 3. 精准营销:基于大数据分析顾客偏好,制定更有针对性的营销策略。 应用设想: 1. 智能点单系统:根据顾客的历史订单和偏好,为其推荐饮品和搭配。 2. 库存管理优化:借助 AI 预测销售趋势,精准控制原材料库存。 3. 员工培训辅助:利用虚拟培训工具,提升员工的服务技能和产品知识。 4. 营销决策支持:通过数据分析,确定最佳的促销活动和推广渠道。 目前的知识库中,相关的具体研究报告主要有: 1. 浙江大学:《DeepSeek 技术溯源及前沿探索朱强》(2025/03/19),介绍了语言模型从基于统计的 Ngram 到 Transformer 的技术演化,以及大模型的发展,如 GPT 系列。 2. 浙江大学:《DeepSeek:回望 AI 三大主义与加强通识教育报告》(2025/03/05),围绕人工智能展开,介绍其发展历程、三大主义、技术进展、应用成果以及教育举措。 3. 清华大学:《气象人工智能技术与应用报告》(2024/12/25),围绕气象人工智能展开,介绍了其发展和应用情况。 如需下载这些研究报告,可。
2025-04-09
gpts相关内容
GPTs 是 OpenAI 推出的一种工具,允许用户量身打造自己的 AI 助理。用户可根据自身需求和偏好创建完全定制的 ChatGPT,如能帮忙梳理电子邮件或提供创意灵感的助手。目前,OpenAI 已推出几种现成的 GPTs 供使用,如“The Negotiator”“Game Time”等,用户也可上传资料来自定义 GPTs。 GPTs 的出现代表着 AI 技术的重要进展,将 AI 应用延伸到普通大众的日常生活。其使用目前仅限于 ChatGPT Plus 的用户,且 OpenAI 推出了 GPT Store 平台,允许用户分享他们的 GPTs,甚至可能实施收益分润制度。 例如,有网友分享了 RPG 版《悲惨世界》的 GPTs 案例,其提示词包括设定游戏背景、角色、剧情发展依据、对话格式与信息、场景图片等要求。 总的来说,GPTs 是一种让使用者能够量身打造自己的 AI 助理的工具,开启了个性化 AI 的新阶段,为开发者和普通用户提供了更多便利。
2025-03-31
excel表格导出的用户的对话记录,来进行自定义标签并打标,有哪些好用的现成方案或者工具
目前在 Excel 表格导出的用户对话记录进行自定义标签并打标方面,以下是一些常见且好用的工具和方案: 1. Microsoft Excel 本身:可以利用其数据筛选、排序和函数功能来辅助标签和打标。 2. Google Sheets:具有类似 Excel 的功能,且在线协作方便。 3. R 语言:通过编程实现复杂的数据分析和标签处理。 4. Python 及相关库,如 Pandas:能够灵活处理数据和进行标签操作。 但具体选择哪种方案或工具,取决于您的具体需求、技术水平和使用习惯。
2025-04-07
标签体系可用的ai
以下是关于标签体系可用的 AI 的相关内容: 在 AI 时代的知识管理体系构建方面: 1. 提示词可帮助规划 PARA 分类模式。PARA 是一种代表项目(Projects)、领域(Areas)、资源(Resources)和档案(Archives)的流行知识管理框架,AI 能通过分析工作模式和内容类型,自动生成提示词,以简化分类过程,加快组织和检索信息。 2. 提示词能帮助设计笔记标签系统。有效的标签系统是知识管理的关键,AI 可通过分析笔记内容和使用习惯,推荐合适的标签和标签结构,提高检索效率。 3. 知识助手 Bot 可帮渐进式积累领域知识。随着在特定领域的深入,知识助手 Bot 能根据学习进度和兴趣点,定期推送相关文章、论文和资源,实现渐进式学习,持续扩展知识边界并确保知识及时更新。 在 AI 术语库方面,包含了众多与 AI 相关的术语,如 Knowledge Engineering(知识工程)、Knowledge Graph(知识图谱)、Knowledge Representation(知识表征)、MultiHead Attention(多头注意力)、MultiHead SelfAttention(多头自注意力)等。
2025-03-30
在ai图像训练打标时,怎么让部分标签权重更大
在 AI 图像训练打标时,让部分标签权重更大的方法如下: 1. 在 Stable Diffusion 中,手动补充的特殊 tag 放在第一位,因为 tags 标签有顺序,最开始的 tag 权重最大,越靠后的 tag 权重越小。 2. 在 BooruDatasetTagManager 中采用方法二: 删除部分特征标签,如 All tags 中不该出现的错误识别的自动标签,Image tags 中作为特定角色的自带特征的标签,并将特征与 LoRA 做绑定。 完成所有优化删除后,点击左上角菜单 File>Save all changes 保存当前的设置。 此外,在 Stable Diffusion 训练数据集制作中还需注意: 1. 调用 Waifu Diffusion v1.4 模型需要安装特定版本(2.10.0)的 Tensorflow 库,在命令行输入相应命令完成版本检查与安装适配。 2. 进入到 SDTrain/finetune/路径下,运行相应代码获得 tag 自动标注,其中主要参数包括: batch_size:每次传入 Waifu Diffusion v1.4 模型进行前向处理的数据数量。 model_dir:加载的本地 Waifu Diffusion v1.4 模型路径。 remove_underscore:开启后将输出 tag 关键词中的下划线替换为空格。 general_threshold:设置常规 tag 关键词的筛选置信度。 character_threshold:设置特定人物特征 tag 关键词的筛选置信度。 caption_extension:设置 tag 关键词标签的扩展名。 max_data_loader_n_workers:设置大于等于 2,加速数据处理。
2025-03-15
使用飞书机器人(如Coze智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)
以下是使用飞书机器人(如 Coze 智能体)自动抓取外部链接(如网页、公众号文章),通过多维表格存储为“稍后读”清单,并自动提取关键信息(标题、摘要、标签)的相关内容: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口输入更符合用户习惯。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用步骤: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,然后复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。 目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出,由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,理论上无需开发任何插件、APP,就能实现跨平台的稍后读收集与智能阅读计划的推荐。部署完成后,您可以在电脑、手机端通过飞书机器人与稍后读助手进行对话,也可以直接在 Coze 商店中与 bot 进行对话,如果部署到微信服务号、订阅号,还可以通过这些渠道调用 bot。
2025-02-16
. 了解射频识别技术的基本原理及常见应用。 2. 能够利用射频识别技术开展实践,了解物与物 之间近距离通信的过程。 第7课 电子标签我揭秘 7.1 乘坐火车时,人们只需拿身份证在检票机上刷一下,便能顺利通过检票 闸机,进出火车站。在这个过程中,正是 RFID 技术在发挥作用。 揭秘射频识别技术 本课将关注以下问题: 1. RFID 系统的工作流程是怎样的? RFID 是一种物品标识和自动识别技术,本质上是一种无线通信技术, 无须与被识别物品直接接触。RFID 系统由电子标签和读卡器组成(图 7
射频识别(RFID)技术是一种物品标识和自动识别的无线通信技术,无需与被识别物品直接接触。RFID 系统由电子标签和读卡器组成。 其基本原理是:读卡器发射特定频率的无线电波,当电子标签进入有效工作区域时,产生感应电流,从而获得能量被激活,并向读卡器发送自身编码等信息,读卡器接收并解码后,将信息传送给后台系统进行处理。 常见应用包括:乘坐火车时的身份证检票,物流领域的货物追踪管理,图书馆的图书借还管理,超市的商品结算等。 在利用射频识别技术开展实践时,能够了解物与物之间近距离通信的过程。例如在物流中,货物上的电子标签与读卡器之间通过无线电波进行信息交互,实现对货物的实时监控和管理。 RFID 系统的工作流程大致为:读卡器发射无线电波,激活电子标签,电子标签向读卡器发送信息,读卡器接收并解码信息后传送给后台系统。
2024-10-21
对图片和视频进行智能标签
以下是关于对图片和视频进行智能标签的相关内容: 用 SD 训练一套贴纸 LoRA 模型的打标方法: 1. 点击左侧菜单【WD1.4 标签器】。 2. 在 path 中粘贴素材文件夹的根目录路径。 3. 将阈值设置为 0.35(生成尽可能多的标签来描述图片内容,阈值是指 AI 理解图片内容给出关键词的评分,分数越大越确定,一般阈值设大于 0.35)。 4. 选择公认成熟稳定的 Tagger 模型作为训练 lora 的底模,其它设置基本不用更改调试。 5. 点击【启动】,会为目标文件夹里的图像素材自动打标,自动打标完成后,会在素材原文件直接生成对应图像的 txt 打标文件。 【SD】提示词标签选择器 Easy Prompt Selector 的使用: 1. 按顺序选择一些标签词,如女孩、白头发、蓝眼睛、兔子耳朵等。 2. 选择画质和视角,如最好的质量、杰作、高度详细等。 3. 选择艺术风格,如皮克斯动画、轮廓光。 4. 在负面提示词中进行选择并点击选框结尾的“负面”。 5. 选择模型,如“revAnimated”,调整尺寸后点击生图。 用 SD 训练一套贴纸 LoRA 模型的打标优化方法: 1. 方法一:保留全部标签。对标签不做删标处理,直接用于训练。一般在训练画风,或想省事快速训练人物模型时使用。优点是不用处理 tags 省时省力,过拟合的出现情况低;缺点是风格变化大,需要输入大量 tag 来调用、训练时需要把 epoch 训练轮次调高,导致训练时间变长。 2. 方法二:删除部分特征标签。训练某个特定角色时,要保留蓝眼睛作为其自带特征,那么就要将 blue eyes 标签删除,以防止将基础模型中的 blue eyes 引导到训练的 LoRA 上。一般需要删掉的标签如人物特征 long hair,blue eyes 这类;不需要删掉的标签如人物动作 stand,run 这类,人物表情 smile,open mouth 这类,背景 simple background,white background 这类,画幅位置等 full body,upper body,close up 这类。优点是调用方便,更精准还原特征;缺点是容易导致过拟合,泛化性降低。过拟合会导致画面细节丢失、画面模糊、画面发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。
2024-08-29
如何用rpa来实现读取本地excel表格里的内容进行筛选,提取某些数据值后,再自动化填写到飞书的多维表格去。怎么来实现这个功能
要使用 RPA 实现读取本地 Excel 表格内容进行筛选,并将提取的数据值自动化填写到飞书的多维表格,可参考以下步骤: 1. 关于扣子:“”(Coze)是字节跳动在 2024 年上线的新一代一站式 AI Bot 开发平台,也被称为“字节版 GPTs”。它是一个低门槛的 AI 应用开发平台,其核心目标是让没有编程基础的用户也能够轻松参与到 AI 生态的建设中。 2. 登录后,在左侧功能列表的工作空间中,点击右上角“+字段”创建工作流,自行输入名称和描述。 3. 已做好工作流后,逐步拆解每个节点的配置: 开始节点:此节点不需要做任何配置,没有输入以及输出。 读取飞书表格内容节点:点击开始节点后面的“+”,搜索“飞书多维表格”,选择“search_record”功能。添加后,点击该节点的配置,在界面右侧的参数框中,需要填写 app_token、field_names。filter 是对数据的筛选条件,没有筛选需求可直接忽略。其中,app_token 是多维表格的唯一标识符,即表格 URL 中的一段;field_names 则是要读取的具体字段,比如“标题”、“内容”,以作为后续操作的输入。该节点运行后,就能将多维表格中的内容提取出来。
2025-04-09
简历筛选
在简历筛选方面,主要有以下相关内容: 智慧招聘智能人岗匹配综合解决方案中: 人才画像生成:通过文档解析服务以及 GLM4 对候选人简历内容进行智能解析,将候选人的技能、经验、教育背景、项目经历等转化为结构化数据。 岗位画像分析:使用 GLM4 分析企业提供的岗位描述,识别岗位需求中的核心技能、经验要求、文化适配度等信息,将其解析为结构化的数据形式。 智能人岗匹配:使用 GLM4 对岗位和候选人画像进行语义分析,通过理解复杂语言信息,实现更高维度的智能匹配。 处理流程涉及 Prompt 工程。 七大行业的商业化应用中:人力资源领域的简历筛选是其中的一部分。 摊位信息中提到有帮 HR 筛选简历的 AI 工具,如:
2025-03-31
AI 简历筛选器
以下是为您整理的关于 AI 简历筛选器的相关信息: 1. 有多种帮助 HR 筛选简历的 AI 工具,例如: 行业新闻 AI 生成与自动推送的工作流。 小红书 AI 生成的工具。 Newsletter AI 生成的工具。 可以运行但存在 bug 的代码编写的工具。 2. 一些具体的 AI 简历筛选工具及特点: ResumeMatcher:AI 驱动的开源简历优化工具,提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。采用 FastEmbed 计算简历与职位匹配度,结合 textacy 提取核心术语,精准优化简历内容。链接: 飞书多维表格的 AI 功能:能够完美解决简历筛选的各个问题,支持批量操作,无识别 PDF 文件的限制。 3. 相关分享文章: 微信公众号文章《我如何让 AI 一口气筛选 300 份校招简历》,链接: ,作者分享了使用不同 AI 工具筛选简历的过程和感受。
2025-02-25
我是一个AI小白,我使用AI的主要目的是使用这些工具,简化我工作中费时费力的事情,比如:表格的制作,筛选数据;图片的抠图,渲染,产品的口播介绍;日常工厂管理文件的编写及执行步骤;工作手册及岗位绩效的编写;作业指导书的编写
以下是为您整合的相关内容: 对于 AI 小白来说,使用 AI 工具简化工作中的费时费力之事是可行的。 在接触 AI 工具时,对于超出自己理解范围的事情,最简单有效的方法就是尝试。学习新事物,实践比听闻更重要。 比如在 AI 视频制作方面,人物设定与剧本是关键部分,包括主体、动作、场景等要素;分镜处理也较为重要,要考虑用几个镜头表述内容;生成环节如同抽卡,可多尝试,最后进行粗检和后期处理,如 AI 配音剪辑、加过渡滤镜等。小白制作 AI 视频要做好脚本即提示词,有耐心抽卡,并不断提升撰写提示词的能力。撰写提示词时要了解主体、动作、场景,避免使用专有名词和网络名词,给 AI 清晰描述。工具选用方面,没有绝对好的工具,只有适合的,如小白可使用剪映,主力机是 MacBook Pro 可使用 final cut。还可向 ChatGPT 询问获取灵感。 另外,在“AI 布道”活动中发现,AI 工具虽强大能做很多事,但也在其与普通人之间形成了一道墙。AI 是未来必然的方向,其科普还有很长的路要走,但尽可能简单地试用它,能让普通人更快受益。无论是什么身份、什么年龄段的人,都可以尝试使用 AI 工具。 如果您想要跟相关作者交朋友、一起在 AI 路上探寻,欢迎戳这里:
2025-01-30
如何通过提示词提高模型数据对比和筛选能力
以下是一些通过提示词提高模型数据对比和筛选能力的方法: 1. 选择自定义提示词或预定义话题,在网站上使用如 Llama3.1 8B Instruct 模型时,输入对话内容等待内容生成,若右边分析未刷新可在相关按钮间切换。由于归因聚类使用大模型,需稍作等待,最终结果可能因模型使用的温度等因素而不同。 2. 在写提示词时不能依赖直觉和偷懒,要实话实说,补充详细信息以避免模型在边缘情况上犯错,这样也能提高数据质量。 3. 在分类问题中,提示中的每个输入应分类到预定义类别之一。在提示末尾使用分隔符如“\n\n\n\n”,选择映射到单个 token 的类,推理时指定 max_tokens=1,确保提示加完成不超过 2048 个 token,每班至少有 100 个例子,可指定 logprobs=5 获得类日志概率,用于微调的数据集应在结构和任务类型上与模型使用的数据集相似。例如在确保网站广告文字正确的案例中,可微调分类器,使用合适的分隔符和模型。
2024-12-20
写一个关于AI面试B端软件的需求文档,里面核心功能包括AI面试功能、背调功能(比如线上、证明人、应聘者提供的材料)、简历筛选关键词功能(比如UI设计里面负责项目包括用户调研、原型设计、需求缝隙、高保真设计、切图)、提取简历证书项目功能(比如初级设计师、建筑设计师、一级建造师)。
以下是为您生成的关于 AI 面试 B 端软件的需求文档: 一、核心功能 1. AI 面试功能 用友大易 AI 面试产品:具有强大技术底座、高度场景贴合度、招聘全环节集成解决方案、先进防作弊技术及严密数据安全保障,能完成面试、初筛并自动发送面试邀约。 海纳 AI 面试:通过在线方式自动面试、评估,精准度高达 98%,面试效率比人工提升 5 倍以上,候选人到面率提升最高达 30%。 InterviewAI:在线平台提供面试职位相关问题及 AI 生成的推荐答案,候选人用设备麦克风回答,每个问题最多回答三次,会收到评估、建议和得分。 2. 背调功能 线上背调。 证明人背调。 对应聘者提供材料的背调。 3. 简历筛选关键词功能 UI 设计方面,负责项目包括用户调研、原型设计、需求缝隙、高保真设计、切图。 4. 提取简历证书项目功能 初级设计师。 建筑设计师。 一级建造师。 二、案例参考 1. HR 相关案例 HR:团队绩效管理,根据团队和个人绩效的往期数据,分析员工绩效排名,输出绩效考评和迭代改进建议。 HR:面试工具,作者开发使用 GPT4 技术的实时转录工具,帮助求职者在面试中生成完美回答。 2. 其他工作场景案例 销售:话术总结优缺点,涵盖产品特点、服务优势等方面。 销售:定制销售解决方案,涉及企业产品和服务内容等方面。 客服:定制客服话术,包含产品知识、使用方法等关键词库。 三、提示词工程师面试经验分享 某岗位面试一面完不到 2 个小时就通知二面,效率较高。 技术面:面试官直接给出同行美妆 GPT 案例,让判断实现方式,应试者提出 C 端优化方案及补充 B 端商业化方案后通过。 BOSS 面:了解学业情况、经历和意向,询问经典问题。
2024-12-02
如何使用cursor进行编程
以下是关于如何使用 Cursor 进行编程的相关信息: Cursor 旨在让您极其高效,是使用 AI 进行编码的最佳方式。您可以从代码库中获得最佳答案,参考特定文件或文档,一键使用模型中的代码。 它允许您使用指令编写代码,通过简单的提示就能更新整个类或函数。 Cursor 能通过预测您的下一个编辑,让您轻松完成更改。
2025-04-18
请给我提供一个 AI辅助我进行知识管理的方案
以下是一个 AI 辅助知识管理的方案: 1. 利用提示词规划 PARA 分类模式:PARA 代表项目(Projects)、领域(Areas)、资源(Resources)和档案(Archives)。AI 可分析您的工作模式和内容类型,自动生成提示词,助您将信息和知识分类到相应部分,简化分类过程,加快组织和检索信息。核心是理解以行动为驱动的笔记逻辑。 2. 借助提示词设计笔记标签系统:有效的标签系统对知识管理很关键,AI 能分析笔记内容和使用习惯,推荐合适的标签和结构,提高检索效率。 3. 让知识助手 Bot 渐进式积累领域知识:随着在特定领域的深入,需要系统积累和更新知识。知识助手 Bot 可根据学习进度和兴趣点,定期推送相关文章、论文和资源,实现渐进式学习,扩展知识边界并确保知识更新。例如基于 dify.ai 将数百个思维模型整合成知识库,根据不同对话和条件判断为用户选择适用的思维模型分析工具,封装成智能分析的 Bot。 4. 基于已积累知识的 RAG 方法进行深度研究:RAG 是结合检索和生成的 AI 模型,应用于知识管理,能在深度研究时自动检索相关知识点和资料,辅助构建更全面深入的分析。 5. 打造个人知识导师,随时对话辅助梳理线索:创建个人知识管理员机器人,随时与之对话,询问特定知识点或寻求解决问题思路。它能基于知识库自学习,了解您的知识结构和需求,成为不可或缺的知识伙伴。 6. 构建最了解您的智能体作为 AI 写作助手:涵盖构思、草稿生成、内容迭代、润色与优化等全流程。构思阶段利用智能体生成创意点、主题或大纲;草稿生成基于构思让智能体生成文本草稿;内容迭代通过 promptchain 工具设计迭代提示修改完善草稿;润色与优化对最终文本进行语言风格和语调调整。通过实践和反馈优化 prompt 设计,使写作助手贴合个人风格和需求。 此外,生成式人工智能在知识管理应用程序方面也有新兴应用,例如用作管理组织内基于文本(或可能基于图像或视频)知识的手段。一些研究表明,针对组织内特定知识体系微调模型培训,可有效管理组织知识。一些公司正与领先的商业提供商合作探索基于生成式人工智能的知识管理理念,但用户可能需要培训或帮助来创建有效提示,且知识输出应用前可能仍需编辑或审查。
2025-04-11
请问DeepSeek如何与生产型企业进行结合创造效益 ?
DeepSeek 与生产型企业的结合可以从以下几个方面创造效益: 1. 模型优化与性能提升:英伟达基于 FP4 优化的 DeepSeekR1 检查点现已在 Hugging Face 上开源。这种优化将模型Transformer 模块内的线性算子的权重和激活量化到了 FP4,适用于 TensorRTLLM 推理。每个参数从 8 位减少到 4 位,使磁盘空间和 GPU 显存的需求减少约 1.6 倍。使用 TensorRTLLM 部署时,需要支持 TensorRTLLM 的英伟达 GPU(如 B200),并且需要 8 个 GPU 来实现 tensor_parallel_size=8 的张量并行。代码利用 FP4 量化、TensorRT 引擎和并行计算,实现高效、低成本的推理,适合生产环境或高吞吐量应用。 2. 部署指南:社区伙伴 Hua 投稿的《在 Azure AI Foundry 部署 DeepSeek 大模型全指南》,手把手指导在微软 Azure AI Foundry 平台上完成 DeepSeek R1(671B)模型的完整部署流程,包含环境准备、资源管理、模型测试及 API 调用说明。 3. 为企业带来实质提升:DeepSeek 的强化学习和联网搜索能力改变了信息获取方式,从“检索—阅读—摘要”转变为“提问—获得答案”,大幅提升工作效率。其开源策略打破了技术垄断,让国内大模型能力迅速提升。在企业级部署方面,通过行业知识蒸馏和领域自适应训练,实现对企业非结构化数据的深度解析能力。特别是在实时决策支持、多模态交互及复杂知识图谱构建方面,为企业打造具备持续进化能力的数字神经中枢。这种“AI 即服务”的部署模式,重构了传统工作流效率,并通过预测性分析和认知自动化开启企业智能化的第二增长曲线。同时,还可以考虑垂直场景强化学习机制的增加,如在智能制造场景中嵌入设备故障模式自发现的奖惩机制;以及可信计算架构的升级,针对金融、医疗等高合规需求场景。
2025-04-10
有没有全自动AI剪辑工具,丢入素材后可以根据我的规则要求设置进行多素材混剪
目前有一些工具可以帮助您实现全自动 AI 剪辑,以下为您介绍一种多素材混剪的方法: 1. 声音克隆: 工具:Fish Audio 操作: 准备一段需要克隆的音频(可以是类似屈原的古风声音,或自行录制一段)。 打开网站:https://fish.audio/zhCN/train/newmodel/ 。 上传准备好的音频,按照指引完成声音克隆。 进入声音库选择需要使用的声音,将第一步生成的文案输入,使用克隆好的声音生成对应的音频文件。 下载生成的音频文件备用。 2. 视频合成: 工具:Viggle.ai 操作: 在网上下载“回答我”的原视频。 打开 Viggle.ai 网站,登录后进入视频合成功能:https://viggle.ai/createmix 。 上传“回答我”原视频和第二步生成的人物形象图,生成新版本的“回答我”视频。 预览效果,满意后下载合成好的新视频。 3. 视频剪辑: 工具:剪映 操作: 打开剪映软件(手机或电脑版均可)。 导入第二步合成好的新视频和第一步生成的音频文件。 将音频与视频时间轴对齐,确保声音和画面同步,添加字幕等。 如需叠加特殊背景,可以导入自己的背景图(如楚国风景)。 预览整个视频,检查效果,微调后导出最终视频(建议 MP4 格式)。
2025-04-09