Skip to content

现状问题

政府开放数据量大、涉及业务范围广,用户在海量数据中寻找所需信息时,面临搜索结果局限于关键字匹配、推荐关联度低、搜索速度慢、数据质量不高等问题,导致用户花费大量时间精力筛选和整理数据,无法发挥开放数据最大价值。

数据开放平台通用搜索性能差,用户“找数难”
数据开放搜索查询结果单一,导致数据实用性不高
开放平台数据间关系网构建难,存在技术空白

项目措施及前后对比

打造全国首创“字段搜索”模式,打破表与表之间的壁垒,以规则自动发现为核心,融合逻辑规则与机器学习,进行字段级数据挖掘和关联分析。建立数据质量保障体系,基于采石矶数据质量系统能力提升数据质量,确保数据的准确性和完整性。

访问体验差:搜索结果与推荐关联度低

数据滞后:人工发现数据质量问题,存在严重滞后性

脏数据多:源数据质量问题多,空值、格式错误、数据多归口多等

开放数据字段级分析,高效、精准发现数据间关联关系,提供更精细的数据搜索服务、更精准的数据关联推荐

自动发现数据质量问题,通过实体解析、冲突解析、数据补全等能力智能化提升数据质量,直观解决数据滞后、脏数据、缺失数据等问题

项目成果

上线以来平台整体数据质量提升35%

数据接口调用次数提升1.79亿次

搜索结果的相关性和质量明显提高,用户满意度整体提升30%