以下是一些大模型的应用开发平台:
提供了用于[推理和监督式微调(SFT)的工具链](https://link.zhihu.com/?target=https%3A//ai.google.dev/responsible%3Futm_source%3Dagd%26utm_medium%3Dreferral%26utm_campaign%3Dexplore-responsible%26utm_content):通过原生Keras 3.0支持JAX、PyTorch和TensorFlow。随时可用的[Colab](https://link.zhihu.com/?target=http%3A//ai.google.dev/gemma/docs/get_started)和[Kaggle notebook](https://link.zhihu.com/?target=https%3A//www.kaggle.com/models/google/gemma/code),以及与流行工具如Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM的集成,使得开始使用Gemma变得简单。预训练和指令调优的Gemma模型可以在笔记本电脑、工作站或Google Cloud上运行,通过Vertex AI和Google Kubernetes Engine(GKE)轻松部署。在多个AI硬件平台上的优化确保了行业领先的性能,包括NVIDIA GPU和Google Cloud TPU。使用条款允许所有组织,无论大小,负责任地进行商业使用和分发。Gemma模型的参数如下所示。其中Gemma 2B采用512 TPUv5e训练,预训练数据量为2T tokens,而Gemma 7B采用4096 TPUv5e训练,预训练数据量为6T tokens。Gemma在技术和架构上和谷歌的商业大模型Gemini同源,这使得Gemma在效果上也超过其它同类开源模型,如Llama 2:
5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成
LLM Spark(免费可用):用于构建生产就绪大模型应用的开发平台。