利用 AI 进行数据分析可以参考以下实际案例与技巧:
原文地址:https://mp.weixin.qq.com/s/Fld25MxyoFEnUbnDmGJNXg 本文作者:krryguo,腾讯 IEG 前端开发工程师。声明:本文涉及与 ChatGPT 交互的数据已严格脱敏。
逻辑流程图如下:上面说的两种方式对应流程图的上下两个步骤,红色部分是重点。SQL分析:用户描述想分析的内容,后台连接DB,附带表结构信息让AI输出SQL语句,校验是SELECT类型的SQL,其他操作如UPDATE/DELETE绝不能通过!!校验通过后执行SQL返回结果数据。再将数据传给GPT(附带上下文),让AI学习并分析数据,最后输出分析结论和建议,和结果数据一起返回给前端页面渲染图表、展示分析结论。目前已实现两张表关联查询。个性化分析:用户上传文件,如有需要可以简单描述这是什么数据、字段意义或作用辅助分析。前端解析用户上传的文件,再传给GPT分析数据,后续步骤与上面一致。流程描述得比较详细,就不具体讲解开发过程和代码了,而是会更多讲述开发时的一些问题、重点和技巧。相关重点:
原文地址:https://mp.weixin.qq.com/s/Fld25MxyoFEnUbnDmGJNXg本文作者:krryguo,腾讯IEG前端开发工程师导语|本文将重点介绍AI与数据分析结合的应用,通过实际案例与相关技巧,描述ChatGPT如何助力数据分析,帮助读者更好地理解并掌握这一领域的创新实践。在如今AI爆炸的时代,涌现出各种AIGC能力,可能我们已是司空见惯了。之前分析过一句话生成图表和BI看板,这一次将重点介绍AI数据分析,通过实际案例与相关技巧,描述ChatGPT如何助力数据分析。声明:本文涉及与ChatGPT交互的数据已严格脱敏。[heading2]介绍[content]AI数据分析,我这里实现了两种方式,支持多维数据分析:1.SQL分析:分析平台自身的使用情况,如图表配置化平台,输入一句话可分析用户配置图表相关的数据2.个性化分析:平台上支持上传数据,可提供数据信息(非必填),以此自定义分析用户自己上传的数据分析完成后展示结果数据的图表和分析结论,图表支持折线图和柱状图,可随意切换。
1、为什么还要反复校验是不是SELECT SQL语句?这里不仅仅是AI不完全可控的原因,还有永远不要相信用户的输入,万一用户恶意输入一些描述,非要执行UPDATE/DELETE等恶意操作,那就完了。所以一定要再次校验AI生成是否是安全的SELECT SQL语句,非查询类SQL坚决不通过!!提示不支持此类请求。2、为什么到AI分析那一步骤还要拼接上下文?上文是有表结构信息和SQL语句,这些可以提供给GPT更好理解数据和字段的意义,分析更准确。3、针对表结构长类型字段,不允许直接查询,防止token消耗过多。其实最好还是告诉GPT只允许查询哪几个字段,或者用哪几个SQL函数,尽量让GPT生成可控。[heading3]个性化分析[content]1、用户上传的数据解析后需要判断数据格式是否符合要求,超长可以限制截取前面若干项,防止token消耗过多。2、在前端解析用户上传的数据,分析完可以直接用于渲染数据图表,无需再让后端再返回。3、需要支持用户补充输入,可以简单描述这是什么数据、字段意义或作用,用于辅助AI分析。如果都是易理解语义化的字段名,可以无需描述,GPT也能识别。遇到一些多维度数据,GPT可能会误将其他字段作为维度分析,为了准确性可以输入:“以xxx(字段名)为维度分析”;还可以输入:“这是xxx数据”更好帮助AI分析。