字段类型
字段简单的可以理解成使用EXCEL表时的行或列标题,标题下面每一列或是每一行的值就是字段的值。字段是数据库表引入的一个概念,这里将其继承了过来。BDP工作表的字段类型共有三种:
- 日期
- 文本
- 数值
支持的字段操作有四种:
- 添加字段
- 提取网址参数
- 地址转换为经纬度字段
- 分区字段
下面将分别来介绍一下上面提到的三种字段类型和三种字段操作
日期类型字段
字段类型是日期,表示该字段的值是日期或是时间,前面会有图标显示。日期类型字段支持使用计算函数进一步处理以及在图表中作为维度或是数值进行数据分析。
文本类型字段
字段类型是文本,表示该字段的值是一个字符串,记录的是一些文本信息。比如接入了一个订单数据表,订单的接收地址,收件人等等这些字段类型都是文本。文本类型字段支持使用计算函数进一步处理以及在图表中作为维度或是数值进行数据分析。
数值类型字段
字段类型是数值,表示该字段的值是一个数值或是数字,包含INT,NUMERIC等类型。比如企业内部存放业务数据的数据库中的一张表中的一个字段类型是INT型,那么利用同步客户端或是通过BDP直连数据库进行同步,同步到BDP后,这个字段类型对应为数值。数值类型字段支持使用计算函数进一步处理以及在图表中作为维度或是数值进行数据分析。
添加字段
在企业内部一般都是会有一些指标,那么这些指标一般是需要对已有的字段进行计算得到,比如企业内部对绩效考核的计算,对业务指标的计算。BDP提供了添加字段的功能,支持利用几十种函数对现有字段进行计算得到需要的字段。
添加字段包含以下几个操作步骤:
1. 确定指标的定义
根据业务以及进行分析的需要制定相应的指标,方便进行后面的数据分析。
2. 添加指标
在工作表列表框选择要处理的工作表,点击右上角的添加字段,设置要添加的字段名,字段类型以及计算公式。同时下方有丰富的函数,可以根据字段的类型选择相应的函数进行处理,选中相应的函数时,会有函数使用的详细说明和事例。比如订单中现在有商品价格和实付价格,如果要计算补贴,将两个字段值进行相减即可。
3.校验添加的指标的准确性
添加的字段生成好后,可以在工作表页面校验字段值的准确性,以及是否符合预期。
提取网址参数
网址中一般都包含很多需要传递给服务器用来做判断的信息。在SEM(搜索引擎营销)中,落地页网址中一般会包含通配符信息,用来判定这个点击是从哪一个创意来的。在APP渠道推广的时候,每一个注册来源页都会对应不同的网址,通过提取网址中的source参数可以判定这个注册用户是哪一个渠道来的,进而优化相应的渠道投放。BDP提供了提取网址参数功能来帮助用户处理这类数据。
提取网址参数包含以下几个操作步骤:
1.选择要处理的工作表以及添加提取来源字段
在工作表列表框选中要处理的工作表,在右上角添加字段处选择提取网址参数。进入提取参数页面后,选择要提取的参数名称,点击提取即可看到提取的参数。
2.编辑提取的参数字段名和字段类型
提取的参数字段名和字段类型都是支持修改的,可以根据业务的需要设置相应的字段类型和字段名。
3.选择归并的参数字段
提取的参数有一些表示的含义可能存在相同或是重复的情况,这就需要合并一些参数字段。合并后的字段支持修改字段名和字段类型。
地址转经纬度
电商每天会产生大量的订单数据,订单数据里面记录了用户的下单地址和收货地址,通过GIS地图可以直观了解每个区域的销售额和利润,这样就可以更好的确定在各个区域的市场和营销策略。APP通过埋点会得到每个用户的登陆信息,通过用户的登陆IP地址可以知道用户所在的地区,通过GIS地图可以分析出每个区域的用户活跃情况,这样就可以确定自己的APP活跃用户区域分布情况。由于GIS地图是根据坐标来生成相应的结果,但是我们的现有的数据都是文本形式的地址,BDP提供了地址转经纬度的功能,支持将文本形式的地址转化为经度和维度,这样就可以借助GIS地图来方便的进行相应的分析。
地址转经纬度的详细操作可查看地址转经纬度,里面有详细的操作介绍。
分区字段
当工作表的数据量过大时,会出现查询速度过慢的情况,为了加快查询速度,BDP提供了分区字段功能。分区字段相当于为字段建立索引,当你使用这个字段作为筛选器时,能根据建立的索引迅速定位查询范围,加快图表数据查询效率。除分享表、追加合并表及提取表外,其他类型的工作表如符合设置分区字段的条件,都会出现设置入口。
在设置分区字段的时候有以下几条限制:
- 分区字段只有在数据行数超过一定量的情况下(目前是超过1000万)进行设置,才能显著提升查询效率
- 分区字段只支持日期和文本字段的区分
- 字段设置分区后,分区数不宜过多。超过一定分区数量,可能会影响查询效率
- 设置成分区的字段,应该是在图表中,作为筛选器的字段。符合该种条件的分区字段,在通过筛选器查看图表数据时,效率提升显著
- 当工作表更新或其他原因,造成原来设置的分区字段,分区超过一定限制时,建议你最好删除或修改分区字段,以免影响图表查询速度