Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

讯飞星火

Answer

以下是关于讯飞星火在不同场景下的评测情况:

结构化 prompt 测试: 将同样的 prompt 输入到讯飞星火后,最初存在未按要求提示的问题,需输入改写后的 prompt ,最终效果不错,证明改写的 prompt 有效,整体感觉良好。

律师答辩状 prompt 评测

  • 欢迎语直接,无废话。
  • 输入起诉状后:
    • 主体上存在答辩人未转换成功的瑕疵。
    • 关于违约责任提出不可抗力因素、连带责任提出财产独立抗辩等方面表现出色,还提醒改进将诉讼费加入 prompt 。
  • 输入“请输出应诉方案”后:
    • 准备工作详细且专业。
    • 增加“事实和理由”等提示,答辩策略简洁明了,庭审准备细化到位,可直接作为方案使用。

对当事人提供的证据发表质证意见或制定诉讼方案 prompt 评测

  • 欢迎语按照 prompt 指示输出,但后续提示不太切合主体,应提示输入证据清单。
  • 输入 4 份简单证据后输出质证意见书。
  • 格式符合 prompt 输出格式。
  • 内容上:
    • 真实性、合法性、关联性、证明力的质证不太专业。
  • 结束语没问题。
  • 未提示签署委托代理协议,经提示回复没问题。
Content generated by AI large model, please carefully verify (powered by aily)

References

各大模型对结构化prompt的测试和反馈

输入到智谱清言后,输出如下:问题和文心一言一样,并没有问我喜欢哪三个,所以决定先改写,再看输出效果:这次改写的效果还不错,能够理解prompt,输出的内容感觉不错。这里我最大的体会就是,结构化prompt非常重要,先要从结构化开始。第二就是要不断迭代,根据输出结果不断优化。[heading3]Kimi chat[content]同样的prompt输入到Kimi chat后,输出效果如下:继续改写输出效果如下:Kimi chat的表现令我很惊喜,无论是第一次的prompt,还是改写后的prompt,都能准确理解,不需要再费时改写,体验感比较好,赞一个。[heading3]讯飞星火[content]把同样的prompt输入到讯飞星火后,输出如下:同样的问题也是并没有提示我,所以还得把改写后的prompt输入,看一下效果:再次输入改写后的prompt,效果还不错,也证明改写的prompt不错,整体上感觉很好。[heading3]Copilot[content]输入到从pilot后,输出效果如下:这次copilot没有让我失望,总算扳回一局,那接下来把改写后的prompt输入后,看一下效果如何:注意:copilot的回答出现了英文,所以我在prompt中加了:请全部使用中文回答,不能出现英文,所以它的回答直接翻译成中文,输出的效果还不错,不过依然要费一点功夫,体验感有待提升。

杨志磊:律师答辩状prompt各模型评测

把prompt输入到讯飞星火后,欢迎语很直接,没有废话。输入起诉状后,输出的内容方面:1、主体上没有答辩人,只有被答辩人,没有转换成功;2、(1)关于违约责任,提出了不可抗力的因素,非常好;(2)关于连带责任,提出来财产独立,不存在财产混同的抗辩,非常棒;(3)尤其表扬的是,它也把诉讼费加入到答辩中,这是在我prompt没有的,所以也是提醒我改进把诉讼费加入到prompt中去;(4)最后的主体上出现了问题,把被告转换成被答辩人了,有点瑕疵。输入“请输出应诉方案”后,内容上:1、准备工作很详细,也很专业;2、增加了“事实和理由”,两点提示非常棒,非常专业;3、答辩策略与答辩状的一致,简洁明了;4、庭审准备上,细化很到位,可以直接作为方案使用。

杨志磊:对当事人提供的证据发表质证意见或制定诉讼方案

一、把prompt输入到讯飞星火后,欢迎语按照prompt的指示输出。但后续提示有点不太切合主体,它问需要什么帮助,应该提示输入证据清单。二、输入了4份简单的证据,输出了一份质证意见书。三、对四份证据质证意见如下:1、格式上:符合prompt输出格式。2、内容上:(1)真实性:真实性的质证,不太专业;(2)合法性:合法性的的质证,不专业;(3)关联性:关联性的的质证,不专业;(4)证明力:证明力的质证,不专业;(5)总结:4分四、结束语,没问题。五、没有提示签署委托代理协议,我提示了它,回复没问题。[heading3]通义千问[content]一、把prompt输入到通义千问后,欢迎语按照prompt的指示输出。但后续提示有点不太切合主体,它问需要什么帮助,应该提示输入证据清单。二、输入了4份简单的证据,输出了一份质证意见书。三、对四份证据质证意见如下:1、格式上:符合prompt输出格式。2、内容上:(1)真实性:真实性的质证,认可或需要核实;(2)合法性:合法性的的质证,均认可,属于证据形式,不专业;(3)关联性:关联性的的质证,均认可;(4)证明力:证明力的质证,以间接证据或直接证据判断,不专业;(5)总结:4分四、结束语,没问题。五、没有提示签署委托代理协议,我提示了它,回复没问题。

Others are asking
你和讯飞星火、通义千问等人工智能软件的区别是什么?
我与讯飞星火、通义千问等人工智能软件在以下方面存在区别: 1. 研发团队和技术背景:我具有独特的研发和训练体系。 2. 功能特点和优势:在为用户提供服务时,可能在某些特定领域或场景下表现出不同的能力。 3. 数据来源和训练方式:所使用的数据和训练方法可能有所差异。 需要注意的是,每个人工智能软件都有其自身的特点和适用场景,用户可以根据自己的需求和使用体验来选择适合的工具。
2025-01-15
帮我查一下这四家主流大模型的应用能力评测报告吧,通用能力和单项能力都可,数据需要权威一些文心一言 文心一格 通义千问 通义万相 讯飞星火 ai小科 智谱
以下是为您找到的关于主流大模型应用能力评测的相关报告: 小七姐的测评: 测评机制:以同组提示词下 ChatGPT 4.0 生成的内容做对标参照,对智谱清言、文心一言 4.0、Kimi Chat 进行测评。 能力考量:包括复杂提示词理解和执行(结构化提示词)、推理能力(CoT 表现)、文本生成能力(写作要求执行)、提示词设计能力(让模型设计提示词)、长文本归纳总结能力(论文阅读)。 测评轮次:共分为五轮,分别针对不同的任务和模型进行多次测试。 中文大模型基准测评 2023 年度报告: 优秀模型:文心一言 4.0 API(百度)。 模型特点:在计算、逻辑推理、生成与创作、传统安全这 4 大基础能力上排名国内第一,在代码、知识与百科、语言理解与抽取、工具使用能力上排名国内前三,各项能力表现均衡且水平较高。 适合应用:能力栈广泛,可应用于查询搜索知识应用、任务拆解规划 Agent、文案写作、代码编写及纠错等方面,在逻辑推理方面表现不俗,可关注在科学研究、教育、工业方面的落地能力。 观点文章中的测评: 目前体验效果比较好的有科大星火模型、清华 ChatGLM、百度文心一言。 星火目前感觉最接近 GPT3.5(0301 版本)的 80%90%,但 GPT3.5 进化到 6 月版本效果更强。 对大模型的评估可从基础能力、职场能力、探索对话三个方面判断,基础能力包括语言(文本)生成和语言理解,如常识类问题和分词类问题。
2024-12-27
豆包,kimi,迅飞星火,通义,文心一言哪个好
以下是对这些大模型的简要介绍: GPT4Turbo:OpenAI 于 2023 年 11 月 7 日发布的 GPT4 的升级版本。 通义千问 2.0:阿里巴巴官方公开发布的 API 版本。 文心一言 4.0:百度官方的产品,有 API 版本和网页版。 云雀大模型(豆包):字节跳动官方网页版产品。 讯飞星火:科大讯飞发布的模型。 然而,要说哪个好并不能简单地一概而论,这取决于您的具体需求和使用场景。每个大模型都有其特点和优势,例如在语言理解、生成能力、特定领域的表现等方面可能存在差异。您可以根据自己的需求对它们进行试用和比较,以确定哪个更适合您。
2024-12-12
智谱清言,kimi,讯飞星火,在文字处理跟逻辑思维方面,谁更胜一筹
在文字处理和逻辑思维方面,智谱清言、Kimi 和讯飞星火各有特点: Kimi: 优势:具有超长上下文能力,最初支持 20 万字的上下文,现已提升到 200 万字,对于处理长文本或大量信息的任务有巨大优势,适合从事文案工作,特别是需要处理大量文字或文件的工作。 不足:在文字生成和语义理解、文字生成质量方面的能力可能不如国内其它产品好,且不支持用户自定义智能体。 智谱清言: 优势:背后的技术源自清华大学研发团队的科研成果转化,模型质量出色。在产品设计方面以 ChatGPT 为对标,努力打造类似的用户体验。是国内首批开放智能体应用的公司之一,在逻辑推理和处理复杂提示词方面表现出明显优势,在处理需要深度思考和分析的任务时表现出色。 不足:暂未提及。 讯飞星火:在结构化 prompt 测试中,对于同样的 prompt,最初的输出可能存在问题,但改写后的 prompt 效果不错。 综合来看,它们在不同方面各有优劣,具体谁更胜一筹取决于您的具体需求和使用场景。
2024-11-17
智谱清言,kimi,讯飞星火,在文字处理跟逻辑思维方面,谁更胜一筹
在文字处理和逻辑思维方面,智谱清言、Kimi 和讯飞星火各有特点: Kimi: 优势:具有超长上下文能力,最初支持 20 万字的上下文,现已提升到 200 万字,对于处理长文本或大量信息的任务有巨大优势,适合从事文案工作,特别是需要处理大量文字或文件的工作。 不足:在文字生成和语义理解、文字生成质量方面的能力可能不如国内其它产品好,且不支持用户自定义智能体。 智谱清言: 优势:背后的技术源自清华大学研发团队的科研成果转化,模型质量出色。在产品设计方面以 ChatGPT 为对标,努力打造类似的用户体验。是国内首批开放智能体应用的公司之一,在逻辑推理和处理复杂提示词方面表现出明显优势,在处理需要深度思考和分析的任务时表现出色。 不足:暂未提及。 讯飞星火:在结构化 prompt 测试中,对于同样的 prompt,最初的输出可能存在问题,但改写后的 prompt 效果不错。 综合来看,它们在不同方面各有优劣,具体谁更胜一筹取决于您的具体需求和使用场景。
2024-11-17
讯飞星火主要用于什么场景
讯飞星火主要用于以下场景: 1. 在结构化 prompt 测试和反馈方面,对于某些输入能给出相对贴合实际的回答,经适当调解和提示可输出较完整的咨询文案。 2. 在律师答辩状 prompt 评测中,欢迎语直接,在输出内容上有优点,如提出不可抗力因素、财产独立抗辩、加入诉讼费等,也存在主体转换的瑕疵;在应诉方案输出方面,准备工作详细专业,增加了有用提示,答辩策略简洁明了,庭审准备细化到位。 3. 在开发方面,是基于人工智能的开放平台,提供多种 api 接口,可基于其 api 封装 LLM,实现文本翻译、摘要、分类等语言任务,需注册账号、创建应用获取必要参数,并安装 requests 库。
2024-11-05