以下是对您提出的生涯规划领域垂直大模型产品的可行性分析和发展规划,并为项目取名为“生涯智途”。
可行性分析:
发展规划:
希望以上分析和规划对您有所帮助。
通俗来讲,大模型就是输入大量语料,来让计算机获得类似人类的“思考”能力,使之能够理解自然语言,能够进行『文本生成』、『推理问答』、『对话』、『文档摘要』等工作。既然是学习,那我们就可以用『上学参加工作』这件事来类比大模型的训练、使用过程:1.找学校::训练LLM需要大量的计算,因此GPU更合适,因此只有购买得起大量GPU的贵族学校才有资本训练自己的大模型2.确定教材::大模型顾名思义就是大,需要的数据量特别多,几千亿序列(Token)的输入基本是标配3.找老师::即用什么样的算法讲述“书本”中的内容,让大模型能够更好理解Token之间的关系4.就业指导::学完书本中的知识后,为了让大模型能够更好胜任某一行业,需要进行微调(fine tuning)指导5.搬砖::就业指导完成后,下面就要正式干活了,比如进行一次翻译、问答等,在大模型里称之为推导(infer)在LLM中,Token([2])被视为模型处理和生成的文本单位。它们可以代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token是原始文本数据与LLM可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary),比如:The cat sat on the mat,会被分割成“The”、“cat”、“sat”等的同时,会生成下面的词汇表:|Token|ID||-|-||The|345||cat|1256||sat|1726||…|…|
|你的摊位活动主题和内容|摊位区域|摊位编号|摊位类型||-|-|-|-||AI智能全息仓体验你自己的数字人,AI智能交互玩具与你作伴,体验与AI伙伴的语言艺术。|D|1|玩具||跨境电商,配料表分析,|D|10|产品体验+电商||AI数字人的技术以及应用场景|D|11|数字人刻录||STEAM科创、AI科技与生活<br>主要是通过生活中的科技创意在生活中的应用,通过电子电路、物联网、计算机编程与人工智能技术,展示科技创意。|D|12|产品展示||AI相册|D|13|相片||百度数字人试拍|D|14|产品展示+体验||Zion无代码工具——30分钟搭建一个可收费的AI Agent前端小程序|D|15|产品展示+agent搭建||AI搜索产品体验|D|16|产品展示||通过AI为企业对接政府政策及智能选址推荐|D|17|产品展示||滨电智言:杭州电子科技大学滨江研究院于2023年8月31日发布了自主研发的垂直领域大模型“滨电智言”。专注于增强领域知识的知识生成与优化、模型训练与微调、基于RAG的知识检索与语义匹配等核心能力。滨电智言初步构建了面向医疗健康、能源工业、科技教育等垂直领域的底层模型能力,具备基于大模型的AI应用开发能力,包括智能问答、知识构建、内容生成、Text2SQL2BI、数据分析等。|D|18|大模型|
朱啸虎:第一,要有垂直行业数据,大模型公司很难自己获取。第二,要能实现数据闭环,用以持续提升自己的垂直模型。第三,要能持续保持和客户的连接,因为大厂不可能自己去一个个磕客户。这三点特别重要。也就是说,在原有业务基础上加AI是最靠谱的,也比较容易;但先有AI模型或产品,在上面加东西是很难的。[heading3]Q:国内创业者或者大厂,他们是怎么考虑这件事的?[content]朱啸虎:我们一直在聊,大厂确实也在关心自己的边界在哪里。有些大厂还比较好,它不想抢太多创业公司的机会。但我觉得不管中国还是美国(的创业公司),靠别人的怜悯那是不现实的,你必须对客户、大厂都有自己的价值,才能真正找到自己的根据地。Q:你觉得现在国内大模型的商业化落地进展怎么样?大家处在一个什么样的阶段?朱啸虎:现在都在拿着锤子找钉子。说实话到今年年底,我觉得头部的几个大模型都基本能做到3.5水平,明年11月有希望到4。但OpenAI的GPT-4出来以后,它真正能够落地的商业化场景(在美国)也是很有限的,类比中国,应该也差不多。