随着DeepSeek在人工智能和大数据领域的持续发展,其在技术创新和应用拓展上展现出了惊人的活力。而ChatBI作为下一代BI的革新方向正在重新定义企业数据分析的交互方式和决策模式。许多企业雀雀欲试开始积极布局这一领域,在年后仅仅不到一个月的时间就有将近几十家的客户向永洪科技团队咨询关于ChatBI的相关技术与应用,希望借助ChatBI的力量,打破传统BI的限制,实现更加智能化、人性化的数据分析与决策。因此,他们纷纷表示愿意投入资源,与永洪科技团队携手合作,加速ChatBI技术的商业化进程,以期在发展中脱颖而出,成为下一个像哪吒一样引领潮流的佼佼者。
通过综合分析众多客户前期的项目POC以及深入的交流,今天我们将探讨三个方面的问题:
(1) 永洪的ChatBI到底能帮我们解决什么问题?效果如何?具体使用了什么技术路线?
(2) 到底怎样将ChatBI落地?需要准备些什么?
(3) ChatBI未来的方向是什么?
解决哪些问题,效果如何?
永洪的ChatBI里面的关键模块vividime Copilot,既可以解决问数查数,又可以解决深层次的数据问题比如归因分析、数据预测、异常值分析等。再从精度、性能及可信度方面来看:
√在精度方面,vividime Copilot通过引入多轮召回、输入提示补齐、分步骤语义和DSL拆分、后置校验机制,在复杂业务场景下仍能保持90%以上的分析准确率。
√在性能方面,vividime Copilot问答响应速度也许并不是很理想,相对于速度,我们优先考虑问答的正确率和执行复杂问答任务的能力。在这方面永洪采用Agent框架设计,会将问题拆分为多个子任务,在处理较复杂的提问,执行链路就会变长。同时永洪也采用了类似DeepSeek-R1思考过程的人工设计的思维链(CoT)来拆解问题和描述任务内容的处理过程,用来增加模型生成的准确率和稳定性,但思维链的一个明显代价就是大量消耗输出Token数。在大模型服务器方面永洪建议采用的是Qwen2.5-32B版本,非量化版模型实测推理速度稳定维持在约为23token/s,速度并不高,这些都会制约vividime Copilot问答实时响应速度。
√在可信度方面,ChatBI在应用中,难免会有错误的答案,怎样先确定思考的过程是否正确?生成的结果怎样排查到错误,并快速修复?解决这些问题,才能代表一个ChatBI产品具有可信性。永洪给到用户的是整个分析过程是可以完全可视其推理逻辑,这使得用户能够清晰地追踪和理解每一个分析步骤背后的逻辑依据。通过判断生成图表所绑定的字段以及筛选器来识别数据是否准确,对认为不准确可以调整其中的维度、度量、指标、分组条件、枚举值、统计值等,按照自己的设想二次点选生成新的相关图表。还可以通过点赞的方式对更改后的准确结果进行固化。
具体使用了什么技术路线?
永洪采用NL2SKILL的技术路线,相比于Text2SQL或NL2SQL,其核心目标不是将自然语言转化为标准化的SQL语句,而是将自然语言转化为端到端的分析技能(元数据查询、绘制图表、数据洞察、图表解读等),采用自主设计的领域描述语言(DSL)定义,覆盖从数据查询到分析结果输出的完整流程。这种路线有三大优势:首先保持最大的灵活性和扩展性,还可避免完全受限于基座大模型的SQL生成能力和某些任务无法用SQL表达的限制,同时用户提问被大模型转换为图表的中间语义层DSL描述,能较容易地直接转换为图表显示。
整个智能问答过程通过意图识别与技能分类 → 元数据与知识动态召回 → 任务调度与子任务编排 →LLM生成响应与DSL转换 → BI引擎解析与执行的链条将自然语言转化为可落地的分析动作。其核心价值可以降低使用门槛,业务人员直接获取洞察,无需理解技术细节;提升分析深度,融合查询、计算、建模、可视化多环节;适应复杂场景,通过动态调度应对多变的企业需求。
怎样将ChatBI落地?需要准备些什么?
ChatBI项目想要成功落地需要从数据、业务、人三线并进,数据线实现元数据标准化与知识沉淀;业务线选择高价值场景快速验证,建立用户信任。人线要有明确的角色和职责,配套的组织驱动力。
(1) 数据方面
相对于BI,ChatBI对数据质量要求更严苛,本质上是由于自然语言的开放性和模糊性与机器对结构化数据的精确性要求之间的矛盾。因此在这种情况下需先保证数据准确,在保证数据质量,如字段名汉字化、字段类型正确、避免字段名歧义,避免数据冗余和不一致,加工关键指标(避免“不可回答的问题”)等。在这里加入数据模型和指标管理平台会是一个不错的选择。
知识沉淀在永洪通过配置知识库的方式来解决复杂问题、领域问题。在我们实践中分为如下四类:
√规则结构化:企业里独有的知识,如销冠、高价值订单等定义。
√上下文感知:特定词汇,“本单位”、“本部门” 等无法被AI理解的词汇。
√可视化预置:明确展现图表类型, 如占比分析用饼图展示,情况结果用表格展示。
√混合检索:对于开放性的问题,与数据字段完全无关的问题,如输出营销总结?企业为了员工做了什么努力?
永洪的知识库配置体系通过规则结构化、上下文感知、可视化预置、混合检索四重机制,将分散的企业知识转化为ChatBI的“认知能力”。
(2) 业务方面
结合永洪的实践,我们推荐挑一个业务场景先试点,可结合数据情况、用户数、使用频次等挑选场景。聚焦价值明显、可行性高、风险可控的原则,先选择一个小而具体的场景,确保ChatBI能够真正解决该场景下的痛点。通过试点,我们可以积累宝贵的经验,了解ChatBI在实际业务中的表现和局限性,为后续全面推广打下坚实的基础。同时,试点过程中也能够让业务部门感受到ChatBI的价值,增强他们对新技术的信心和接受度。在试点成功后,我们可以逐步扩大ChatBI的应用范围,将其融入到更多的业务场景中。
(3) 人方面
结合上面数据和业务的考量,我们来看chatBI应该是怎样的落地流程?如下:业务调研明确场景——知识提炼——准备数据——数据预处理——知识库配置——场景测试(通用化场景测试、业务化场景测试)——UAT 测试——正式上线——用户培训——持续优化。在这个流程中业务专家、IT专家、数据专家都是必不可少的,业务专家负责明确业务场景和需求,为ChatBI的应用提供方向;IT专家负责技术实现和系统集成,确保ChatBI与现有IT架构的兼容性和稳定性;数据专家则负责数据的收集、清洗和治理,为ChatBI提供高质量的数据支持。值得一提的是,领导层的参与也是必不可少的,领导层提供战略方向,确保ChatBI项目与公司整体战略保持一致,并在资源分配上给予必要的支持,还能增强项目在组织内部的影响力,推动各部门之间的协作与配合。
ChatBI未来的方向是什么?
从永洪的角度,结合自身在BI产品上的优势特色,下一步会进一步按照降低使用门槛的方向实现智能生成报告,智能查找报告,智能设置报告,智能操控报告等。同时也会探索产品深度嵌入业务决策,实现“分析-模拟-决策”闭环,这一闭环将帮助企业在数据洞察的基础上,快速响应市场变化,制定并执行更加精准有效的决策策略。
最后总结一下,从LLM的技术特性与商业智能(BI)场景的深度融合视角来看,LLM将为BI产品体系带来革命性能力跃迁。要充分明确各自的优势,LLM以其强大的自然语言处理能力,能够更好地理解用户的查询意图,提供更加精准、个性化的数据分析结果。而BI产品则擅长将复杂的数据转化为直观、易懂的图表和报告,帮助用户快速洞察数据背后的商业价值。将两者相结合将开启智能决策新纪元。
商业化的 ChatBI 目前面临着诸多挑战,未来的发展道路充满艰辛,需要不断突破多重瓶颈,各厂商在这一过程中应保持严谨的态度,持续投入大量的资源和精力。永洪坚信智能分析革命必将全面爆发,我们会始终坚守初心,不断探索创新,致力于提升 ChatBI 的性能和功能,为客户提供更优质、更高效的服务。