七月未过半,又有一批大模型扎堆亮相

    2023-07-14 李雪曼 lv Created with Sketch.


经历了一段时间的狂飙后,以为大模型的热度会慢慢降低,然而并没有。进入 7 月以来,与同事关于“热”这个话题聊得最多的除了北京的高温天气,就是大模型。这不,7 月未过半,又有一批大模型“扎堆”亮相,我们来看看都有谁家:


7 月 13 日,在 2023 京东全球科技探索者大会暨京东云峰会上,京东正式发布言犀大模型,同时还发布了言犀 AI 开发计算平台,预计 8 月份正式上线。


7 月 11 日,王小川旗下百川智能正式发布 Baichuan-13B 大模型,号称“130 亿参数开源可商用”。

 

7 月 8 日,在 2023 年世界人工智能大会“大模型与深度行业智能”创新论坛上,中国移动正式发布人工智能科技创新的最新成果:九天·海算政务大模型和九天·客服大模型。


7 月 7 日,华为开发者大会 2023(Cloud)在东莞举行,华为常务董事、华为云 CEO 张平安在会上发布盘古大模型 3.0。盘古大模型 3.0 是一个面向行业的大模型系列,分为 L0 基础大模型、L1 行业大模型、L2 场景模型三层架构。


7 月 7 日,2023 世界人工智能大会上,达观数据发布国产自研“曹植“大模型。据悉,曹植大模型是国内首个垂直行业专用的自主可控的 GPT 大语言模型,具有长文本、垂直化和多语言特色。


7 月 6 日,在 2023 世界人工智能大会开幕式和科学前沿全体会议上,上海人工智能实验室与商汤科技联合香港中文大学等高校发布全新升级的“书生通用大模型体系”,包括书生·多模态、书生·浦语和书生·天际等三大基础模型,以及首个面向大模型研发与应用的全链条开源体系。


7 月 6 日,在 2023 世界人工智能大会上,中国电信数字智能科技分公司正式对外发布中国电信大语言模型TeleChat,并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。此轮AI浪潮中,不仅中国电信高调加码大模型,其他两大运营商也高调披露各自大模型进展,比如,中国移动的“九天”1+N大模型体系,主要面向政务和客服两大应用场景;中国联通“鸿湖图文大模型”,据悉是首个面向运营商增值业务的大模型。


7 月 4 日消息,北大团队发布了首个中文法律大模型 ChatLaw,为大众提供普惠法律服务。该模型支持读取文件、录音,一键自动抽取并梳理关键信息,生成导图、图表,可视化分析;支持法律文书写作、法律建议、法律援助推荐。


7 月 2 日,天眼查与华为云联合发布了全球首个商查大模型——"天眼妹"可信商业助理。据了解,该产品是业界首个基于"可信数据+可信算法"的面向个人端的可控大模型数字产品。该产品已经完成内部测试,预计 7 月底对用户开放邀请试用。

0714.png


此外,7 月 3 日消息,李开复以 Project AI2.0 之名入局大模型的创业公司和官网正式亮相,公司名为“零一万物”,总部位于北京。该公司定位为打造 AI 2.0 的平台和应用,技术路线为自研大模型,三个月内已实现百亿参数规模的模型内测,目前正向 300 亿-700 亿参数规模扩大。


可以看到,在这波 AI 浪潮中,不断有新的大模型涌现,竞争也在不断升级。过去几个月内,国内相继发布了数十款大模型,其中许多都是通用的。这些大模型也许聊天、文本生成表现很出色,但在解决真实的行业和产业场景问题时,缺乏专业能力。这其中一个非常关键的原因是,大模型的训练过程中缺乏充分的产业数据。

 

7 月份亮相的这一批大模型,更多把重点聚焦在了大模型与企业自身产业的结合上,比如,京东的言犀大模型,就强调“源于产业,服务产业”,融合 70% 通用数据与 30% 数智供应链原生数据,致力于深入零售、物流、金融、健康、政务等产业场景,解决产业实际问题。

 

盘古大模型 3.0,首次明确定位“为行业而生”。据了解,盘古大模型强调在细分场景的落地应用,主要解决商业环境中低成本大规模定制的问题,用AI赋能千行百业。目前,盘古大模型 3.0 已在煤矿、铁路、气象、金融、代码开发、数字内容生成等领域发挥作用。

 

此外,还有北大团队发布的中文法律大模型 ChatLaw,天眼查与华为云联合发布的商查大模型——"天眼妹"等,则是更为垂直的行业大模型。随着对大模型的深刻认知,越来越多人认识到大模型的最大价值不在 C 端,而是在具体产业中。我们可以看到,不管是国外的 OpenAI,还是国内百度、阿里巴巴、华为等科技巨头,都有着庞大的 ToB 业务基础,并且他们已经把大模型嵌入到了部分应用场景中。

 

例如,OpenAI 背后仰仗的是微软,今年 3 月份,微软已经将 GPT-4 大语言模型融入到全新的 Office 应用中,谷歌也将 Duet AI 整合进了 Gmail、Google Docs 等办公软件中。国内 AI 技术落地的首站,也是将目光聚焦在了应用场景丰富的协同办公领域。

 

总而言之,大模型的最终着陆点是实体产业,解决行业痛点,创造行业价值应该成为它的主要目标。因此,我们需要积极推动科技公司与产业的合作,确保大模型具备切实的专业能力和行业适应性。通过与行业企业合作,让大模型获取更多真实的产业数据,加强大模型的训练,以提供更专业、更精确的解决方案。只有这样,AI 技术才能走得更远,大模型才能在各个行业场景中充分发挥其潜力,并为产业创造明确的价值。


    本文作者:李雪曼 责任编辑:李雪曼 本文来源:牛透社
声明:本文由入驻牛透社的作者撰写,观点仅代表作者本人,绝不代表牛透社赞同其观点或证实其描述。
  • 李雪曼
    媒体认证
    lv Created with Sketch.
  • 60篇

    文章总数

    35.31万

    文章总浏览数

意见反馈
返回顶部