Chat with Wiki - 2023年大模型发展有什么重要技术

Answer

2023 年大模型发展的重要技术包括以下方面：

模型发布：百川智能发布 Baichuan2—Turbo，字节云雀大模型等。
涉及领域：涵盖通用、医疗、汽车、教育、金融、工业、文化/零售/交通等多个行业。
关键进展：从 22 年 11 月 ChatGPT 的惊艳面世，到 23 年 3 月 GPT4 作为“与 AGI（通用人工智能）的第一次接触”，再到 23 年末多模态大模型的全面爆发。
多模态大模型的应用：
- 优点：适应性极好，方便适应各种奇葩需求；对算法要求降低，大部分功能由大模型提供，特别是非结构化信息处理；API 访问方式简化了边缘设备要求，方便在多种设备适配。
- 缺点：推理时长是最大障碍，传统目标检测或人脸识别优化后能达到 100 - 300ms，而大模型动则需要 10 秒的延时，限制了许多场景；模型的幻象和错误率较高，在多链路复杂应用中迅速变得不可行；在大多数生产模式下，仍需使用云服务数据中心，存在隐私问题；商业私有化部署是刚需，当下开源模型与 GPT4 有代差。

Content generated by AI large model, please carefully verify (powered by aily)

References

2023年度中文大模型基准测评报告.pdf

SuperCLUE：AI大模型2023年关键进展•百川智能发布Baichuan2—Turbo字节云雀大模型闭源通用大模型百川BaichuanYi-34B开源医疗汽车教育行业大模型MindGPT部分领域岐黄问道银河大模型..................序列猴子BlueLM AndesGPT孟子云天书玉言金融工业文化/零售/交通AInno-15B妙笔大模型

AGI万字长文（上）| 2023回顾与反思

2023年是大模型澎湃发展的一年：从22年11月ChatGPT的惊艳面世，到23年3月GPT4作为“与AGI（通用人工智能）的第一次接触”，到23年末多模态大模型的全面爆发，再到刚刚面世的Sora再次震惊世界。大模型给了世界太多的惊喜、惊讶、迷茫、甚至恐惧。有人问我：“AGI的出现可以和人类哪次发现/发明相比？”“大概是人类开始使用‘火’的时刻。万有引力、iPhone什么的都不值一提。”就像我在去年4月份文章中写的——在AGI和任何新事物的出现的时候：我们总是倾向于高估它的短期，但却低估它的长期。（前文[《AGI|高估的短期与低估的长期》](http://mp.weixin.qq.com/s?__biz=MzIwMTE0MDIwMA==&mid=2247484405&idx=1&sn=5e5c3104511adedad247d23149b14a80&chksm=96f33172a184b8647e786bf57685eb8e085e0f3f1e91aa3be797b49708b82135f41088959e2b&scene=21#wechat_redirect)）目前正是这个大趋势的真实写照：

基于多模态大模型给现实世界加一本说明书

优点：适应性极好，通过提示词工程，方便「适应各种奇葩需求」。对算法的要求降低了不少，大部分功能由大模型提供，特别是非结构化信息的处理。大模型的API访问方式简化了边缘设备的要求，无论在Android、iOS、HarmonyOS()或各种嵌入式设备上都能方便适配。「AGI终将到来，拥抱未来，虽然路途艰难但相信方向是正确的。」缺点：大模型的推理时长目前仍是最大的障碍，传统目标检测或人脸识别优化后能达到100~300ms，而大模型动则需要10秒的延时，限制了许多场景。模型的幻象和错误率仍然较高，导致上述推理时长问题，在多链路的复杂应用中迅速变得不可行。在大多数生产模式下，仍然需要使用云服务数据中心，提交的画面不可避免地涉及到隐私问题。商业私有化部署是刚需，当下的开源模型离GPT4代差在半年以上，技术人员任重道远的。[heading2]未来展望[content]大模型三要素，算法，算力和数据，巧妇难为无米之炊。车载支架已就位，待我出门逛一圈，将后端采集的prompt和源图存入数据集，然后进一步展开工作。人生就是一趟单向旅途，你能所做的只是「尽量不错过沿途的风景」。2024年了，先提前给大家拜个早年。在大型语言模型面前，技术已经平权，要卷的只剩下「创意和工程化落地能力」了。