IDC:百度智能云获大模型平台及向量数据库技术评估双第一
近日,度智全球领先的模型IT市场研究和咨询公司IDC发布《中国生成式AI应用开发平台市场:企业统一AI开发平台的雏形》报告。IDC所定义的平台评估大模型平台包括两部分,一个是及向据库技术模型开发平台,即提供模型训练与调优工具,量数赋能开发者自主使用基础模型进行开发,双第另一个是度智应用开发平台,支持开发人员聚焦应用开发,模型提供低代码无代码开发工具。平台评估
该报告不仅对市场上主流的及向据库技术大模型平台厂商进行了对比分析,还为企业用户选择大模型平台提供了关键的量数技术指标。在此次评估中,双第百度智能云获得七项满分,度智位于所有大模型平台厂商第一名。模型亚马逊云AWS、平台评估阿里云并列第二名。
IDC报告指出,大模型平台给应用程序开发提供了一个新的路径,企业在选择大模型平台的时候,应该重点关注厂商在模型层和数据层的能力。在模型层能力方面,如何让模型更好的适配企业的应用场景至关重要。而在数据层能力方面,如何做好RAG(检索增强生成),保证生成内容的准确性,消除幻觉最为关键。
而在这两个方面,百度智能云都有深厚的技术积累。百度智能云千帆大模型平台(以下简称千帆平台)是大模型与AI应用开发及服务平台,可以从模型开发、模型服务、应用开发三大维度,为企业提供全流程服务。目前,文心大模型日均调用量超过15亿次,千帆平台已经帮助客户精调了3.3万个模型、开发了77万个企业应用。
模型精调助力大模型与产业深度融合
大模型具有强大的泛化能力,可以处理很多通识类问题,但在某些特定行业及领域的表现不如人意。这是因为不同行业有着独特的专业知识、逻辑和数据特点,通识知识无法完全覆盖这些特殊需求。模型精调是增强大模型在行业应用中表现的关键,通过将行业的专业知识和数据特征融入大模型,可以让其更好地满足行业特定需求,从而提升应用的准确性和可靠性。
行业内主流大模型服务商也正在通过大模型平台提供模型精调服务,帮助企业快速打造AI应用。
AWS SageMaker集成了亚马逊的高性能预训练模型库,这些预训练模型在大规模的通用数据上进行了训练,已经学习到了丰富的特征表示和知识,为模型精调提供了良好的基础,同时,SageMaker 还提供了多种先进的机器学习算法,用户可以根据精调任务的特点和需求,选择合适的算法来进一步优化模型性能。
百度智能云千帆大模型平台提供了完整的工具链,是业界首个上线DPO、KTO等模型训练方法的平台,提供了高质量通用语料数据和开箱即用的模型精调样板间。无论是想要自己准备数据、做精调,还是想快速上手、复制行业最佳实践,千帆平台都可以高效支持。目前,在千帆平台上,每天有超过一半的调用量是来自精调后的模型。
拿医疗行业举例,杭州全诊医学基于千帆平台和文心大模型打造了AI医疗助理应用,能够在导诊、预诊、诊间、入院、手术、随访等全阶段服务医生患者。以辅助医生撰写病历为例,全诊医学通过使用20万份精标病历数据对大模型进行了精调,使AI医疗助理的医学用语更准确、更规范,大幅提升病历内容质量。病历生成的准确度提升了45%,医生的接诊量提高了20%,造福更多病患。
RAG已成为企业解决大模型幻觉问题的有效手段
生成式 AI 已成为企业布局和投资的重点,企业希望借助大模型实现降本增效和产品创新。然而,通用大语言模型(LLM)在实际应用中往往存在幻觉问题或回答不准确的情况,尤其是在面向 B 端场景时,难以有效满足企业的落地需求。为解决这一问题,企业通常采用 RAG(检索增强生成)技术,将生成式 AI与企业内部数据库、知识库相结合,使生成内容更加准确、合理。在此过程中,向量数据库凭借其在语义理解和高效检索方面的独特优势,成为企业实现 RAG 的关键组成部分。
不久前,IDC发布了《RAG与向量数据库市场前景预测》报告,对使用大模型的企业进行了深入调研。报告显示,在生成式 AI 的开发过程中,41% 的高管认为构建 RAG 架构至关重要;此外,81% 的 IT 领导者认为,基于业务数据的生成式 AI 模型能够为企业带来显著的竞争优势。这表明,RAG 技术在提升通用大模型准确性方面效果显著,且企业对其认可度正持续提高。随着更多企业意识到 RAG 的重要性,它有望成为生成式 AI 落地的关键推动力。
在分析了RAG和向量数据库市场的发展趋势后,IDC还评估了市场上的主要厂商。在这一评估中,百度智能云的向量数据库 VectorDB 在核心性能、功能全面性、大模型支持、战略与生态合作、工程化落地五个关键领域保持领先,综合排名并列第一。
目前,百度智能云 VectorDB 已经在超过 500 家客户中实际落地使用,支持 HNSW、Puck、PQ 等常用算法,主流 LLM、RAG 框架,以及百度智能云千帆和开源 Embedding 模型,支持企业一站式部署落地。面向未来,百度智能云 VectorDB 将继续在产品形态、内核功能、生态支持三个方面重点发力,为企业 AI 应用落地服务,提供最专业的向量数据库服务。