要做一个 AI 开源项目,以下是一些关键步骤和要点:
明确项目目标和范围:确定您的 AI 开源项目要解决的具体问题和应用场景,以及项目的边界和功能。
制定.cursorrules:
选择合适的技术和框架:例如 Fooocus 这样的图像生成开源项目,它内置多种风格,适合小白上手,且具有离线、开源、免费等特点,支持在多种操作系统上使用,并借鉴了稳定扩散和 Midjourney 的设计思想。
考虑开源的角色和影响:从长远来看,开源模型的情况会变得复杂。对于具有高度能力的模型,如能够自主创办和建立大型科技公司或进行科学研究的模型,其是否开源会产生难以预测的后果。
总之,创建一个 AI 开源项目需要综合考虑多方面的因素,包括技术选型、规则制定、目标明确等,以确保项目的成功和可持续发展。
记得我刚开始写.cursorrules时,完全不知道该写什么。经过一段时间的摸索,发现其实就是把项目中影响AI输出方向的"规矩"写下来。上面截图是一张相对全面的.cursorrules写法。我们也可以按照自己的项目需求来优化里面的内容和结构。来看看几个关键部分:一)先说清楚你是谁这就像你找了个技术大牛来帮你,先告诉他"你期待他是什么样的人,拥有什么专业技能"。这样AI就会按照专家的水准来思考和coding。案例:二)告诉AI你要干什么这相当于项目启动前的需求对齐。你告诉AI:"我们这个项目要做成什么样"。AI就会始终围绕这些目标来写代码。案例:三)定好项目的"规矩"这是在强调团队的代码规范。统一的代码风格不仅看着舒服,维护起来也更容易。AI会严格按照这些规范来写代码。案例:四)明确文件放哪就像整理房间要分区一样,代码也需要规划好"位置"。这样AI生成的代码就不会乱放,后期找起来也方便。案例:五)指定用什么"工具"提前说好用什么框架和库,AI就不会随便引入其他依赖,保证项目的整洁和统一。案例:六)告诉AI怎么做测试这就像做菜要试味道一样,写代码也要测试。提前告诉AI测试的标准,它生成的代码就会考虑到可测试性,也会主动帮你写测试用例。案例:七)推荐参考资料这相当于给AI一个"学习资料",它会基于这些最佳实践来写代码,避免一些常见的坑。案例:八)UI的要求是什么最开始的案例中不涉及到任何页面的开发。如果咱们的项目需要画页面,可以补充下UI的要求。案例:
|多行文本|标签|备注|附件|其他|附件2||-|-|-|-|-|-||Fooocus|图像生成|Controlnet作者的开源项目Fooocus,可以关注下,内置了挺多风格,小白上手快<br>Fooocus是一个图像生成软件,它通过用户提供的提示(prompts)来生成图像。用户只需要关注提示和图像,不需要进行手动调整或设置复杂的技术参数。Fooocus的目标是通过人与计算机之间的交互,探索新的思维媒介,扩展人类的想象力。<br><br>使用Fooocus,您可以通过简单的鼠标点击生成图像,无需手动调整。它还包含了许多针对高级用户的特殊功能,以获得更完美的结果。<br><br>Fooocus是离线的、开源的和免费的软件,您可以在Windows、Linux和Mac上使用它。它使用了稳定扩散(Stable Diffusion)和Midjourney的设计思想,并进行了优化和改进。<br><br>总之,Fooocus是一个方便用户生成图像的工具,它简化了操作过程,让用户能够专注于提示和图像的创作|[https://github.com/lllyasviel/Fooocus](https://github.com/lllyasviel/Fooocus)|视频介绍:[https://www.youtube.com/watch?v=ObGUQum1Ec8&ab_channel=%E6%95%B0%E5%AD%97%E9%BB%91%E9%AD%94%E6%B3%95](https://www.youtube.com/watch?v=ObGUQum1Ec8&ab_channel=%E6%95%B0%E5%AD%97%E9%BB%91%E9%AD%94%E6%B3%95)||
主持人:你认为开源在这个生态系统中扮演什么角色?Ilya:开源是一个复杂的问题。我将向你描述我的思考过程。我认为在短期内,开源只是帮助公司生产有用的产品……让我们来看看。为什么人们想要开源,选择使用开源模型而不是由其他公司托管的闭源模型?我认为,想要成为你希望使用模型的方式的最终决策者,并决定你希望如何使用模型以及哪种用例,这是非常有效的你希望支持的。我认为对开源模型的需求将会很大。我认为会有相当多的公司会使用它们。我想短期内也会出现这种情况。我想说,从长远来看,我认为开源模型的情况会变得更加复杂。我不确定正确的答案是什么。现在看来,有点难以想象。所以我们需要戴上未来的帽子,也许是未来主义的帽子。当你记得我们正在与计算机交谈并且它们理解我们时,进入科幻模式并不难。但到目前为止,这些计算机、这些模型实际上还不是很能干。他们根本无法完成任务。我确实认为有一天模型的能力水平将会非常高。就像归根结底,智慧就是力量。目前,这些模型的主要影响,我想说,至少流行的影响主要是围绕娱乐和简单的问题。所以你和Model谈论这件事真是太酷了。你产生一些图像。你们进行了交谈。也许您有一些可以回答的问题。但这与完成一些大型而复杂的任务有很大不同。如果你有一个可以自主创办和建立一家大型科技公司的模型呢?我认为如果这些模型是开源的,它们将产生难以预测的后果。就像我们现在离这些模型还很远一样。到目前为止,我的意思是眼睛时间尺度,但这仍然不是你所说的。但总有一天,你会拥有可以自主进行科学研究的模型,比如构建、交付大型科学项目。至于这种能力的模型是否应该开源就变得更加复杂。