数据挖掘工具可以让你对你的事件数据、用户指标或聚合指标数据创建你自己的SQL查询,然后展示结果并创建自定义显示面板。这可以让你创建比在折线图和条形图(Slice & Dice)更加复杂的查询,而不需要通过直接访问连接到第三方的SQL工具。其适用于对你的数据执行快速的临时查询。

DataMining

数据结构

TableBrowser事件(Event)数据保存在一个单一的宽大表格中以实现对快速查询的最优化。每个事件在表格中被指定为简单的一行,像交易这种复杂事件可以包含项目和货币数组并被指定为多行。事件表格每隔一段时间随着新事件而更新,编写本文档的当前更新频率是1-2小时。

数据库中的列基于事件结构而唯一的命名,随着你扩展或者更新你的事件,事件表格将获得额外的列以添加任意新参数。

每个事件都有一个唯一的事件ID(eventID)来指示它。主事件ID(mainEventID)、父事件ID(parentEventID)和事件级别(eventLevel)参数在查询包含产品项目和货币数组的复杂事件时非常有用。

用户指标(User Metrics)数据在数据挖掘工具中也是可查询的。用户指标表格包括你的游戏中每个玩家的简单一行数据。表格中的列代表每个用户指标的字段。使用数据挖掘工具你可以访问三种类型的用户指标:

  • 通用指标(Generic Metrics)。这是每个游戏自动计算的用户指标。例如玩过的总会话数(totalSessionsPlayed)
  • 事件计数指标(Event Count Metrics)。你的游戏发送的每个事件类型都将会有一个事件计数指标。例如事件升级计数(eventLevelUpCount)
  • 参数指标(Parameter Metrics)。你在你的事件中发送的任何参数都可以有多个指标。这其中的一些将默认启用,但是如果你想要一个指定的参数被用为一个指标,或者如果你添加一个新的参数到你的游戏,你将需要检查你的游戏参数管理页面的相关指标复选框。指标选项是否可用取决于参数类型。
    • 基于字符串的参数可以记录一个参数的第一个最后一个值。这可以用于记录一个玩家购买的第一个项目或者他玩的最后一个任务。例如最后任务名称字段(fieldMissionNameLast)
    • 数值(Numeric)参数可以记录第一个最后一个值,但是其还可以记录最小最大计数总计。因此你可以跟踪类似于最大金币余额的事情。例如用户最大XP字段(fieldUserXPMax)

用户指标表格每天更新一次,其包括一个你的游戏中每个玩家的最近玩家指标的快照,无论其上次玩游戏已经过去多久。
请注意,吸引(Engage)平台在A/B测试应用和活动(Campaigns)中评估玩家分组标准时不使用这些用户指标快照,其使用的所有正在玩游戏的玩家的用户指标版本更加精确。

驱动你的指标图表的聚合的指标数据(Aggregated Measure Data)也可以查询。聚合的数据保存在六个包含你的完整游戏历史的日常、用户等级概要的实际表格中。

  • fact_user_sessions_per_day:包含每个玩家的会话总数。
  • fact_wau_users:包含每周用户数。
  • fact_mau_users:包含每月用户数
  • fact_mission_users_per_day:包含每个玩家每天玩过的、完成的、失败的任务详情。
  • fact_product_users_per_day:包含每个玩家每天产品购买的信息。
  • fact_event_type_users_per_day:包含每个玩家每天记录的事件类型的计数。

值得庆幸的是你不需要记住你的所有事件参数或者用户尺度字段名称,在屏幕的右侧有一个包含你的事件列表和用户尺度列及其类型的图例。这个图例可以通过点击隐藏按钮最小化。

TableBrowserMinimise

查询管理

在数据挖掘页面顶部的工具栏可以让你给你的查询一个描述性的名称并将其保存。你可以加载之前保存的查询,运行它们并以CSV文件导出他们的结果。

 

EventMiningToolbar

构建一个查询

输入或者粘贴你的SQL到查询面板。你的数据挖掘SQL查询的Vertica分析数据库会运行以支持一些优异的分析功能。请参阅Vertica的SQL参考手册以了解更多信息。

DataMiningQuery


请注意,数据挖掘工具是为迅速的临时查询而准备的,其不应被用于尝试和下载大量的导出数据。如果你需要下载大量的导出数据请使用你的S3数据存档。有查询超时用来约束和限制可以被返回的行数以阻止数据挖掘工具被用于大规模的导出。


小心使用SELECT *语句

在像Vertica的所有列中指定哪一列你感兴趣比起使用SELECT *语句更加有效率。如果你指定了你要查询的列名称其将会运行的更加迅速。
反之,如果你计算列数,你应当总是使用一个COUNT(*)语句来让Vertica选择计数最好的列

可视化结果

默认情况下你的查询将返回一个结果的表格,
datamining-vis0

但是你也可以创建你的查询的可视化展示,并使用其生成自定义显示面板。
datamining-vis1
你可以通过点击结果或可视化标签在结果表格和可视化视图之间切换。

  • 连续图(Series)和饼图切换按钮可以在可视化的连续图(Series)和饼图之间切换。
  • 在可视化标签中的图表选项按钮被用于定义你的图表中X和Y轴标签,还有选择哪个数据列需要在X轴展示,Y轴的范围和是否其堆积也在这里选择。
    chart options
  • 添加绘图(Add Plot)按钮被用于定义每个要在你的图表显示的数据连续图(Series)。你可以通过多次点击添加绘图按钮展示多个堆积的连续图(Series),并定义连续图(Series)的每个值和指定连续图(条形图或折线图)的类型及其他显示选项。
    Plot Options
  • 点击绘图(Draw)按钮以重新绘制你的用于查询结果的可视化展示以及进行可视化设置。
    month

透视你的数据

你甚至可以在查询结果页面使用数据透视表功能来总结你的数据。

pivot

点击数据透视表(Pivot Table)按钮然后选择你想要设定的行、列和数据字段。

这时你可以通过点击位于图表选项页面的堆叠(Stacked)复选框创建堆叠图表可视化展示。

stacked

然后为每个堆叠组添加额外的绘图信息

stacked2

在保存你的数据挖掘查询后你可以通过拖拽你的查询到位于自定义显示面板编辑器的一个面板以最终添加其到一个自定义显示面板。然后你可以通过设置适当的选项来选择这个查询将被显示为一个表格还是图表。

custom

custom dashboard