大模型“热”中的“冷”思考:京东言犀大模型如何重塑产业

2023-07-14 16:13:08 来源: 21世纪经济报道

  今年以来,AI大模型成为超级热点。无论是科技巨头或是初创企业纷至沓来,发布各家的大模型产品。

  琳琅满目的大模型令人血脉偾张,但产业界的态度则颇有些玩味。“预算已经留好了,但就是不知道该怎么落地。”有多位关注AI大模型的头部企业人士曾感慨道,“目前更多还是观望中。”

  如今,迎着AI大模型的热潮,京东的入局则有所不同。7月13日,在2023京东全球科技探索者大会暨京东云峰会上,京东对外推出千亿级言犀大模型。

  从时间维度而言,京东言犀大模型的推出并不算早。相较之下,ChatGPT的发布时间为2022年11月30日,百度文心一言、阿里通义千问、科大讯飞002230)星火大模型的公布时间分别为今年3月、4月和5月,先发的声浪优势明显。

  不过,相较于其它的通用大模型,京东言犀大模型定位为行业模型,强调源于产业、服务产业。其围绕内容生成、人机对话、用户意图理解、信息抽取、情感分类几大类任务,实现基座模型+垂直领域模型精调,深入各垂直业务场景。

  “我们坚定地认为大模型本身是实现产业价值的工具,而不是目的,最终大模型真正实现它的价值一定是在产业的应用当中。”京东集团CEO许冉在会上表示,“当产业效率和产业的边界拓展得到质的提升时,大模型才有了更加实际的价值和意义,这不亚于一次新的工业革命。”

  大模型热潮下对产业价值的冷反思,也是言犀大模型姗姗来迟的原因。京东集团技术委员会主席、京东云事业部总裁曹鹏进一步指出,单一大模型本身无法产生直接价值,技术只有放到场景中才能产出实际价值。“

  “大模型的难点不在于技术追赶,而是产业突破。”京东探索研究院院长、京东科技智能服务和产品部总裁何晓冬直言道。而经过长时间的探索,目前在产业落地方面,言犀大模型已在零售、健康、物流、金融等领域拥有了诸多实践成果。

  产业大模型

  与其它大模型有所不同的是,京东在发布会上直接披露了言犀大模型的训练数据类型。

  据何晓冬介绍,京东言犀大模型的训练数据中,70%为通用域数据,此外还有13.6%为零售数据,6.7%为健康数据,3.2%为物流数据,以及还有金融、保险等数智供应链原生数据,同时京东每年还能产生数百亿级别优质交互数据。

  在何晓冬看来,大模型产业落地需要具备全新AI“三要素”,亦即从数据到场景化数据,从单点算法到多功能协同并在系统、产品层面实现端到端结合,以及大规模分布式计算实现算力提升。其中,数据作为“养料”,决定了大模型的底色与能力边界。而京东拥有的丰富真实的产业数据,无疑能够令大模型聚焦知识密集型、任务型产业场景,解决真实产业问题。

  “除了训练标准大模型通用的数据集外,我们把京东自己的数据都纳入到里面。数据集上的差异使我们可以在比较擅长的行业里提供差异化的模型能力。”京东集团技术委员会主席、京东云事业部总裁曹鹏表示。

  何晓冬也指出,“从零售、物流、健康、金融,再到工业,京东供应链有整条链条,一头连着产业互联网,一头连着消费互联网,从采购采销、交易、物流配送,包括终端服务一系列业务,每天都会产生大量的数据,这些数据和场景保障了我们的大模型是直接面向场景和行业应用的。”

  而京东这种长链路、复杂协同、更多动态数据回流的场景,也成为了大模型最好的“练兵场”。“京东的发展本身就来自于场景的历练,这些实践和历练也为我们积累了非常丰厚的产业数据和行业know-how,让我们有能力做出贴合于产业需求,能够解决产业痛点的大模型,并且持续在真实的场景中历练,形成一个有效良好的循环。”许冉在大会上表示。

  除了根植于复杂供应链环节和产业场景这一竞争优势外,京东多年持续投入所积累的AI技术能力,也是言犀大模型的重要优势之一。

  事实上,早自2021年,京东便开始组建天琴超算集群并训练大模型,推出十亿级模型K-PLUG。截至目前,K-PLUG生成的商品文案可覆盖京东超3000个品类,累计生成30亿字,人工审核通过率超过95%。

  2022年,京东推出百亿级模型Vega,能够广泛应用于情感分析、语义匹配、语法纠错、智能问答、常识推理等多种下游自然语言处理任务,在国际权威的复杂语言理解任务评测SuperGLUE榜单上获得高分成绩。

  今年5月,京东云旗下的言犀团队凭借“任务型智能对话交互关键技术及大规模产业应用”,斩获吴文俊人工智能科学技术奖科技进步奖。而何晓冬博士也荣获了吴文俊人工智能科学技术奖杰出贡献奖,京东成为唯一一个同时斩获项目奖和个人奖两类殊荣的企业。

  也是在此前持续的技术积累下,如今,京东新一代千亿级大模型言犀才能够正式亮相。“基于这样场景、数据以及多年的技术积累,京东成为了打造大模型的前沿高地,也是产生产业大模型的最佳阵地。”何晓冬表示。

  多场景实践

  对于京东的大模型战略而言,言犀大模型的推出只是一个节点。

  何晓冬指出,京东言犀大模型将实现“三步走”发展规划。继7月13日京东正式推出言犀大模型与言犀AI开发计算平台之后,2023年下半年,京东将进一步聚焦如何让模型在实体行业的场景中产生真实价值,结合京东内部各个细分场景锤炼和打磨言犀大模型,到今年年底迭代出扎实的产业服务。

  预计到2024年上半年,京东将向外部严肃商业场景开放大模型能力,向产业输出可用可控、可信、可负担的定制化模型。目前,京东已经走到第二步,并在内部取得了丰富的实践成果。

  在零售领域,言犀大模型的应用主要围绕人、货、场三个核心要素展开。在“人”方面,大模型能够根据用户喜好做出智能推荐,并通过不断交互深入挖掘用户多元化需求,不断优化用户体验;在“货”方面,基于海量的大数据分析,向商家呈现购物趋势以及潜在商机,帮助其做出更加高效智能的采销决策,给予商家更加便利的经营环境。在“场”方面,AIGC等多项技术的整合对零售行业的赋能,将会推动其跃迁到更为沉浸式的场景,丰富购物体验。

  在健康领域,大模型的多轮交互、工具调用、总结摘要、图文多模态等能力,则能够助力京东健康多场景应用升级,包括个人健康助手、诊疗助手、医疗文案书写、诊疗服务调度等。其中健康助手及辅助诊疗的赋能升级可以有效切合用户自身特点,提升诊疗专业性和安全性,目前这两项功能已涵盖超千种疾病专业性服务。

  在物流领域,大模型则主要应用于三方面,包括大模型+预测、大模型+3DSCADA以及大模型3D场景理解。其中,大模型+预测,是指“京东物流超脑”通过算法+基于大模型的文本和数据分析进行辅助决策,在基于销量预测的需求计划和供应计划领域内实现供应链的降本增效。

  大模型+3DSCADA则是基于用户的仓储布局描述,结合三维可视化技术,实现仓储布局的快速调整,同时快速验证不同仓储布局方案的合理性,变革原有3DSCADA的用户交付模式,提升方案制作效率。

  大模型3D场景理解则是将现有仓储运营的实际运营数据映射至仓储3D模型中,通过大模型分析、理解当前仓储3D模型的异常运营问题并给出改善性建议,变被动调整为主动干预,降低专家的时间成本。

  在营销增长方面,京东科技市场和平台运营团队依托日常的金融营销工作结合大模型应用的探索打造出AI增长营销平台。通过对营销的理解,以及用户运营经验的持续积累,大模型解决了诸如关键性任务,动态适应性、用户体验等问题,大幅优化了营销运营流程,降低运营人员的学习成本与操作成本,实现方案生产效率上百倍提高;将过去涉及产品/研发/算法/设计/分析师等5类以上职能才能完成的流程,压缩至1人;同时,一个入口的全新交互模式,让人机交互次数从2000次降低至少于50次,将操作效率提升了超过40倍。

  此外,依托京东言犀大模型以及京东在产业和供应链侧的优势,京东还发布了全新升级的优加DaaS和言犀智能服务两大平台以及面向零售、金融、城市、健康、物流五大领域的行业解决方案。

  “我们坚持用‘基础研究’和‘产业运用’两条腿走路,既要加深基础研究和技术攻关,也要在产业场景中锤炼技术、升级迭代和培育市场。”许冉表示,“从产业端切入大模型,犹如从北坡去攀爬技术的珠穆朗玛峰,这个道路更加艰险,但它的风景却更加波澜壮阔,探索的价值也更为巨大。”

关注同花顺财经(ths518),获取更多机会

0

+1
  • 太平洋
  • 天风证券
  • 国创高新
  • 天晟新材
  • 威士顿
  • 水羊股份
  • 信达证券
  • 龙泉股份
  • 代码|股票名称 最新 涨跌幅