以下是一些数据集的下载途径:
大模型微调的意义在于学习新的知识,因此我们需要使用一份叫做数据集的东西。数据集就是用来让大模型重新学习的知识数据集的获取以及简单的原理可以参考文档:[self-llm/LLaMA3/04-LLaMA3-8B-Instruct Lora微调。md at master·datawhalechina/self-llm](https://github.com/datawhalechina/self-llm/blob/master/LLaMA3/04-LLaMA3-8B-Instruct%20Lora%20%E5%BE%AE%E8%B0%83.md)数据集:json下载地址:[https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json](https://github.com/datawhalechina/self-llm/blob/master/dataset/huanhuan.json)[huanhuan.json](https://bytedance.feishu.cn/space/api/box/stream/download/all/R73db8mk5o7bNix4semcdsMAnAe?allow_redirect=1)[heading3]进行微调[content]有了数据集,就可以使用代码进行微调了。1.首先我们把数据集上传到你的服务器1.编写微调代码代码如下:1.执行微调代码1.微调完成大概15分钟左右就可以微调完成
本实践课程为湖南大学赵芷谦编写[heading3]本实践材料[content]为了帮助编程初学者们更轻松地学习本文内容、上手实践项目,推荐使用豆包MarsCode编程助手获得技术支持,同时也可以使用豆包MarsCode助教寻求问题解答。豆包MarCode编程助手:豆包MarsCode助教:https://doubao.com/bot/ycPXsB5d数据集下载请点击链接:https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html[heading3]本实践需要的语法基础[content]Python基础与环境配置:模块导入(import):包管理工具:需通过pip安装pandas,seaborn,matplotlib,scikit-learn等库。开发环境:代码适合在Jupyter Notebook或IDE(如PyCharm,VS Code)中运行。[heading4]数据处理基础(Pandas)[heading5]1.DataFrame创建方法扩展[content]从字典创建字典键自动成为列名,值作为列数据从文件加载适用于外部数据导入场景[heading5]2.列操作增强[content]删除列重命名列条件筛选类型转换[heading4]数据可视化增强[heading5]1.Seaborn高级配置[content]调色板设置分面绘图组合图表[heading5]2.Matplotlib图表优化[content]图表尺寸控制多子图布局保存图表网格线增强
本实践课程为湖南大学陈俊希编写[heading3]本实践材料[content]为了帮助编程初学者们更轻松地学习本文内容、上手实践项目,推荐使用豆包MarsCode编程助手获得技术支持,同时也可以使用豆包MarsCode助教寻求问题解答。豆包MarCode编程助手:豆包MarsCode助教:https://doubao.com/bot/ycPXsB5d数据集下载请点击链接:https://www.kaggle.com/datasets/muthuj7/weather-dataset建议创建一个文件夹,将下载下来的数据集放入文件夹中。此文件夹便于存储之后项目的所有文件。