"李开复认为,中国大语言模型的演进不会一步到位,会经历L1到L3三个阶段。"
作者:涂鸦君
(相关资料图)
编辑:tuya
7月3日,创新工场董事长兼CEO李开复亲自带队的大模型创业公司正式亮相。该大模型公司命名“零一万物”,总部位于北京,官网(01.AI)同步上线 。
据官网介绍,零一万物致力打造全新的 AI 2.0平台,其深信,以大语言模型为突破的AI 2.0 正在掀起技术、平台到应用多个层面的革命,预测AI 2.0 时代将诞生新一批 AI-first的应用,催生以AI为内核的应用生态,探索崭新的商业模式。
对于公司定名为“零一万物”,李开复表示,零一即01,代表的是数字世界,从零到一,乃至宇宙万物,寓意“零一智能,万物赋能”的雄心。
零一万物同步启动DeeCamp 2023前沿大模型项目,广为邀集对大模型领域具有热情和创意的优秀实习生,参与六大前沿热门的大语言模型研发课题。该项目包含自动化生成对抗性样本提升大型语言模型的安全性、通过外部工具增强大语言模型、探索不同数据预处理和选择方法对预训练语言学习模型的有效性、探索不同机制下人工反馈强化学习 (RLHF)在训练大语言模型的影响、大语言模型生成文本的识别、大语言模型的情境适应性相关实践课题。
团队组建上,筹备3个月以来,零一万物已吸纳数十名核心成员,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。已加入的联创团队成员包括:阿里巴巴前副总裁、百度前副总裁、滴滴/百度前首席算法负责人、谷歌前中国高管、微软/SAP/Cisco/前副总裁,算法和产品团队背景均来自国内外大厂。
零一万物暂未公布核心团队具体的人员信息。据天眼查App显示,公司法人代表是马杰,持股占比为99%,创新工场(北京)企业管理股份有限公司持股1%。马杰此前在百度担任副总裁、元宇宙产品“希壤”负责人,月两个月前,媒体报道马杰从百度离职,加入创新工场负责AIGC业务。
李开复自年初开始,在多个公开场合多次强调“AI 2.0是绝对不能错过的革命”,并于3月19日正式宣布入局大模型创业。他表示自己正在亲自筹组Project Al 2.0,这是创新工场塔尖孵化的第7家公司,也是一个致力打造AI 2.0全新平台和生产力应用的全球化公司。
他认为,中国大语言模型的演进不会一步到位,而是会经历L1到L3三个阶段。现阶段,中国大多数公司处于L1阶段,下一步需要跨越“涌现”门槛,成为L2级主流大语言模型,最后追赶L3全球一线公司,成为强大的人工智能“基础设施”。“大模型的技术门槛很高,非常需要整合一个兼具科研能力和开发实力的高效团队,制定贯彻公司的技术和产品战略,从上到下一致执行。”
目前,零一万物的技术路线为自研大模型,已经构建了个数千卡GPU集群,进行训练、调优和推理。在数据方面,主要是提高有效参数量和使用的高质量数据密度,以构建连续、可控、科学化的训练能力。参数规模上,已实现了百亿参数规模的模型内测,现在正向300-700亿参数规模扩大。
公司目前正搭建实验平台,同时拥抱开源,未来计划推出开源的模型版本,但也不能过度依赖于开源模型,只有尽快建立自己的技术优势,构建起强大的生态护城河,才能真正抓住AI2.0的历史机遇。
此外,零一万物还将推出结合图片、视频、3D的多模态模型。与市面上目前已有的大模型产品一样,零一万物也将推出专属的App作为应用入口。平台中间件和开发者工具也将逐步对外发布。
近年来创新工场持续孵化AI项目,代表项目创新奇智是港交所的“AI+制造第一股”,并在今年4月研发了AIGC引擎“奇智孔明AInnoGC”。不同于其他的通用类大模型,该产品面向垂直行业应用的AIGC工程算法引擎,聚焦私有化部署。