以下是关于 Python 数据分析的相关内容:
BORE 框架与数据分析: 自动驾驶产品经理的工作中会涉及大量数据分析,数据分析是一门独立完整的学科,包括数据清洗、预处理等。从工具和规模上,写 Excel 公式、用 Hadoop 写 Spark 算大数据等都属于数据分析;从方法上,算平均数、用机器学习方法做回归分类等也属于数据分析。
用 ChatGPT 做数据分析的工具:
实践:用 Kaggle 的天气数据集绘制气温趋势折线图与月降雨天数柱状组合图:
关于 ChatGPT 的预设 prompt: 在特定的设置下,当发送包含 Python 代码的消息给 Python 时,它将在有状态的 Jupyter 笔记本环境中执行,有 60 秒的超时限制,'/mnt/data'驱动器可用于保存和持久化用户文件,本次会话禁用互联网访问,不能进行外部网络请求或 API 调用。
自动驾驶产品经理是一个非常需要实事求是的工作,要设计一个什么功能,空口说是不算证据的,数据很重要。再加上我司的数据基础建设做得挺好,所以我在工作中会接触到大量的数据,做很多数据分析工作。良好的数据分析也可以帮助产品设计的功能更好更合理,当然也就更容易通过需求评审会。从工具和规模上来说,写一两行excel公式是数分,用hadoop,写spark算大数据也是数分。从方法上来说,算平均数是数分,用各种各样的机器学习方法做回归,分类也可以叫数分。数分前有时候还要做进行数据清洗,数据预处理等等。这是一门独立完整的学科,话题要展开实在是太大,我就不在这里提供具体例子了。用ChatGPT做数分可以利用的数据分析工具这里提供一些简单的罗列,如果不知道我在说什么,可以上网搜一搜教程。1.excel:各位最熟悉,也是最简单的就是excel了。写点公式就算进阶用法(比如说有的岗位的JD甚至明确要求会用vlookup这一个函数),再进一步,我们可以写一点Excel宏,也就是在excel里头运行VBA程序。在excel界这已经是非常高级的用法了,它非常强大,作为产品你能用到的绝大部分需求都可以用它解决。(还有人用excel宏来写计算机病毒,叫做宏病毒,毕竟VBA也是编程语言)ChatGPT可以非常轻松地根据你的需求和描述写出可以用的excel宏。2.python:python有很多强大的数据分析库。数分有pandas,numpy等,画图有seaborn,plotly,matplotlib等,机器学习的就更多了。这是个很大的话题,但是产品日常工作学点pandas+绘图库就够用。一般数据分析的代码可以用jupyter notebook来运行(非常合适数据分析!),用anaconda管理安装的各种包,详情请看网上的python数据分析教程。3.R语言:这是一个专门用来搞统计的语言,不过Python已经够用,在此按下不表。
[heading4]项目要求[content]绘制气温趋势折线图+月降雨天数柱状组合图组合图,也就是需要绘制双y轴的图形[heading4]打开数据集,分析数据[content]我们发现第一行有着Formatted Date,Precip Type,Temperature表头,这三列与我们数据可视化的目的有着明显关联,Formatted Date的数据提取整理后可以作为图标的横坐标,Precip Type的数据可以反映月降雨天数,Temperature的数据可以反应气温趋势。简单来说,需要三项关键数据,x轴上的,两个y轴上的数据。[heading4]新建python文件,开始编程[content]选择python文件,命名保存,例如我命名的“实践一”调用库[heading5]a、读取数据[content]该文件格式为csv,因此可以用pandas库中的文件路径可用鼠标右键点击,然后复制路径或者复制相对路径得到,完成后如图所示。读取数据[heading5]b、数据处理[content]处理出x轴的数据让我们尝试使用MarsCode书写代码:MarsCode提示词:处理有关气温的数据MarsCode提示词:处理有关降雨的数据MarsCode提示词:[heading5]c、创建图表[heading5]d、添加标题与图例[heading5]e、保存并显示图形[heading4]试运行[content][heading4]Debug[content]可以发现左纵坐标数据明显有误,降雨天数不可能这么大,重新分析数据集,我们发现它一天记录了多个时刻的天气状况,而写代码时没有考虑到这个情况,直接把出现了“rain”的都记录了进去,导致数值远远大于实际值。给MarsCode说明现在面临的问题,然后重新生成代码MarsCode提示词:将原来的改为:再次运行:结果符合预期,我们的可视化目的实现了!
翻译你是ChatGPT,一个由OpenAI培训的大型语言模型,基于GPT-4架构。知识截至日期:2022-01当前日期:2023-10-20内联LaTeX:\\(\\)块状LaTeX:\\[\\][heading1]工具[heading2]python[content]当你发送包含Python代码的消息给python时,它将在一个有状态的Jupyter笔记本环境中执行。python将响应执行的输出或在60.0秒后超时。'/mnt/data'驱动器可用于保存和持久化用户文件。本次会话禁用了互联网访问。请勿进行外部网络请求或API调用,因为它们会失败。