Skip to content

钓鱼城

规则和ML结合的智能数据分析系统

愿景

让数据分析成为“快消品”,实现企业数据价值最大化

理论

图关联规则(GAR),拥有逻辑解释的AI预测,自动发现数据中的深度关联关系

技术

提供自动化智能数据分析方法,实现高精准、可解释的数据分析、数据预测和数据决策

数字化转型需要更好的人工智能技术和关联数据

挑战一:

传统专家人工制定规则:高成本,低准确性与一致性

挑战二:

AI黑盒模型:结果不可解释、可靠性存疑

挑战三:

平衡大数据分布式计算的计算资源与效率之间的矛盾,可否寻找新的方式降低资源(通讯,计算)总开销

逻辑规则和机器学习相结合

分布式图关联规则发现、推理

基于不同应用的并行可扩展性模型

增量图数据计算,数据时效性校验

可解释

以图理论为基础进行逻辑规则推导,可以对预测结果进行解释

自动规则发现

持续发现并积累“惊喜”规则,发现常人看不到的线索

实时响应

秒级响应处理百亿级数据,且支持更多维度和大数据范围

精准度提升

在链路预测和属性预测方面,较单个模型精准度提升约30%

关键技术

图计算

以图作为数据模型,分布式并行计算挖掘图数据中存在的关联规则

分布式计算

自研分布式图计算系统,实现分布式计算事务拆分,多节点并行计算动态扩容,可靠识别异常节点,实现任务调度、任务分发、负载均衡,支持实时监控各节点的状态信息

逻辑规则与机器学习

解決人工制定规则准确性等问题,提升机器学习结果的可解释性

自动特征工程

对客户数据进行数据校验、清洗、特征提取,从而获取更好的数据特征

数据源管理

提供关系型数据转换为图数据的功能,抽取的图数据为规则发现建立基础,集中管理不同数据源

数据接入

支持对接多种主流的数据库数据源和CSV文件数据源,数据源接入方式丰富,操作简单

构图配置

既支持智能构图,也支持手动构图。智能构图能自动识别出各个关系表间存在的关联关系,降低构图的成本。手动构图简单易用,交互友好

数据角色

不同的数据类型在数据中充当不同的角色,根据角色进行针对性的处理,提高算法的效率和准确度

模型配置

通过特征工程实现业务数据的属性自动提取,丰富数据源属性,提升数据分析准确性

规则发现

提供图数据分析和规则发现服务,通过指定数据源、支持度百分比、发现深度以及配置模式结构控制挖掘粒度,系统自动生成规则、计算规则的评价指标、获取实例并提供可视化界面

轻量化配置

无需代码,实现数据潜在规则的自动挖掘分析

可视化规则

通过可视化技术,实现数据规则的查看与理解,打破模型分析结果不可解释的局限