计世网

TigerGraph首次将模式匹配与高效图计算相结合
作者:佚名 | 来源:互联网
2019-04-12
TigerGraph 2.4帮助企业实现实时的大数据深度分析

 


  日前,全球唯一可扩展的企业级图数据库TigerGraph宣布将在二季度推出其最新版本TigerGraph 2.4。这项新技术将图模式匹配与实时深度链接分析相结合,这一独特组合特别适用于欺诈与洗钱检测、安全分析、个性化推荐引擎、人工智能和机器学习等。这一新版本的发布,将使企业更加轻松地通过图计算洞悉深度链接的数据价值。

  模式匹配由来已久,但从该技术中获得业务洞察力则往往会受制于两大问题:难以实现大型数据集的并行扩展计算,无法进行深度链接分析--需在数据集中遍历三步以上的跳转或层级。

  例如,确定银行和金融服务的最终受益人所有权,意味着从每家子公司到其母公司业务部门,一直到公司总部,查找每个组织的关键利益相关者,并在整个公司架构中为每个利益相关者添加所有权部分。每多一步跳转查询,搜索中的数据规模都会以指数形式扩展,这就需要大量并行计算才能遍历数据。

  每个新的跳转都打开了一个新维度的信息世界,但是其他图数据库由于无法处理这些日益复杂的计算,所以只能浅尝辄止。例如,长久以来,人工智能(AI)和机器学习(ML)开发人员一直都在苦苦寻求对互联数据进行更深入的分析。洞察深度越深,模式和相应的特性就越好,进而为业务项目带来更加准确的结果。

  TigerGraph创始人兼CEO许昱博士表示:"不同于市场上其他可深入两至三层相关数据的图数据库,TigerGraph的模式分析高效且易于处理,能够深入关联实体10层或更多层,并根据多维标准实时计算风险或相似性得分。高效的图分析,不仅仅是一个强大的大规模并行处理引擎;它了解用户想要了解的内容并专注于此,并舍弃其余部分。图的沟通力和直觉力,是指能够将一组复杂关系理解为一个整体模式:一条路径、一组分支、一个循环。TigerGraph的模式匹配增强了TigerGraph的GSQL查询语言,使之更容易实现。"

  标准模式匹配解决方案具有一个定义好的起点(例如特定客户帐户或付款),及一个定义好的具有固定跳数的模式(例如从客户帐户到所有付款的遍历--从帐户到付款接收者等)。发现欺诈或洗钱循环是复杂的,因为它没有定义好的起点,因为付款可能来自于任何客户帐户,也没有定义好的查询步书,因为欺诈者或洗钱者通常使用超过10层的合成帐户来隐藏其活动。

  借助其大规模并行处理(MPP)引擎,TigerGraph 2.4能够解决各种规模数据集的标准模式及复杂模式的匹配。

  TigerGraph的GSQL模式匹配支持,允许用户以简洁、易读的格式来表达多步查询。通过在一行中表示多步查询模式,能够提高用于机器学习的分析及特征工程的模式透明度。通过新添加的模式匹配查询语法,结合"累加器"(Accumulators)的独特GSQL功能,TigerGraph的大规模并行处理(MPP)图引擎可以确保任意规模图分析的可扩展性与高效性。累加器允许数据科学家和开发人员来定义计分或排名的多维标准,以示两种模式的匹配程度。

  有关累加器如何与GSQL中的新模式匹配查询相互协作,包括下面几种示例:

  "    下一代推荐引擎--传统推荐引擎可以查看客户购买的产品,查找购买这些产品的其他"类似"客户,并将这些客户购买的其他产品视为对相关客户的建议。累加器却可根据客户的人口统计、与相关客户共享或共同购买商品的最近交易时间、共享商品类别中的总支出,以及基于特征的相似性评分,如"亮灯游戏"、"七彩虹游戏"或"超级英雄蝙蝠侠"等,来定义更加全面、明确的"相似"客户选择标准。所有这些因素都与基于最近浏览及搜索历史记录的客户即时购买意愿相结合,计算每个建议的可能性或适用性得分。

  "    欺诈和洗钱检测--欺诈检测寻找类似于已知欺诈或洗钱案例的交易模式,而累加器与TigerGraph中的模式匹配相结合,使数据科学家能够定义欺诈或洗钱检测的多维标准。由于新付款每秒钟都在发生,累加器会根据多维度的评分标准,如涉嫌参与欺诈或洗钱的其他账户的付款规模、频率及百分比,重新计算每次付款、每个发送或接收付款的账户的最新欺诈或洗钱风险评分。这与付款、客户账户图中多达10个层级的模式匹配相结合,以标记潜在的欺诈交易和已超过可接受风险阈值且需要由欺诈或反洗钱分析师进行调查的账户。

  "    通过实时深入链接模式分析驱动人工智能和机器学习--可解释的人工智能需要每个决策的可追溯性--无论是向客户推荐特定产品或服务,还是标记参与欺诈或洗钱的账户。累加器"展示了实现每个决策所涉及的数学计算",从而使公司和政府能够向一线员工及终端消费者推出可解释的人工智能解决方案。基于图的功能可以针对每个模式进行计算,并将这些功能输入机器学习解决方案,以提高多个用例,包括推荐引擎、欺诈和洗钱检测、客户360和网络安全等的准确性。

  此外,TigerGraph还宣布,AWS用户可在GraphStudio中原生使用其S3数据,可显著提高AWS云业务用户效率。GraphStudio采用拖放式图形用户界面,可将存储在本地文件中的数据轻松映射到图模型中,这一点广受好评。对于在S3文件中拥有数据的AWS用户,现在也可以获得一致的易用性。GraphStudio的Native S3 Import(原生S3导入器)与主流的云数据存储提供了更好的协同,并且易于使用数据导入,使得在AWS上运行TigerGraph更加简单。

  TigerGraph还宣布了新的TigerGraph JDBC连接器,使Java开发人员能够比以往更加轻松地将TigerGraph集成至其应用。

  TigerGraph 2.4和全新的TigerGraph JDBC连接器预计第二季度发布。

  OpenCorporations是全球最大的开放式企业数据库。全球调查记者借助其用来发现腐败、洗钱和有组织犯罪的模式。该数据库已选用TigerGraph来更好地支数据库进行调查查询。

  OpenCorporations首席执行官Chris Taggart表示:"OpenCorporations致力于为公众提供更多可用和更广泛的公司信息,特别是揭露犯罪和反社会活动,比如腐败、洗钱和有组织犯罪等。随着我们工作的继续深入和数据的不断增长,我们面临着扩展数据来满足业务需求等挑战。TigerGraph出色的可扩展性功能和性能让我们能够实现以前无法做到的事情,并更好地支持正在进行的调查工作。"

  TigerGraph提供了唯一可扩展的企业级图数据库,无论数据集的规模或复杂程度如何,都能实时应对最棘手的数据挑战。TigerGraph将所有数据源存储在一个统一的多图存储中,该存储可以轻松、高效地扩展以发现和预测关系。不同于传统的图数据库,TigerGraph可以将实时多步查询扩展到数万亿个关系。

责任编辑:刘沙