DataQuotient 画像分析体验

画像分析体验总结：

整体分为两个部分：

标签管理：

1
2
3

1、配置对应的数据源，将数据源表定义为“实体”，字段定义为标签
2、配置同步计划和任务，进行数据的同步管理，
3、类似于数据的映射，将技术语言与业务语言通过实体，关系，标签进行映射。

群体画像：

1
2
3

更主要的是关注业务上每个字段的筛选，过滤条件，组合出满足业务要求的分析场景。
更是提供了群体计算、群体分析、群体对比、相似度分析，使得从业务的角色能更快速、更灵活、更主观的操作数据。
通过多种图表方式展现圈定的结果。

体验前后的差异对比：

没有使用阿里产品前的实现方式：

1	每一次业务规则的调整，都需要修改代码，重新执行，才能得到最新的结果

使用阿里产品的实现方式：

1	只需要在界面上重新配置过滤规则，然后执行筛选，就能得到最新的结果，并能通过多种图表方式直观的呈现出来。

特点：

省去了重新修改代码的环节，从业务的角度调整规则即可实现画像分析。随着多种图表展现形式对结果的反馈，可以不断的完善规则，从而提高了画像分析的准确性和时效性。

适用场景：

基础的标签（指标）数据生成好后，提供给业务人员，进行业务角度的数据分析使用，可以快速的将群体方案直接发布为API对外提供

目标与操作过程：

本次目标：

1、尝试用这份数据找分析出，高压力中年油腻男，单身带娃，无父母补贴，低学历，高年龄

2、尝试用这份数据找分析出，单身女强人，单身无娃，有父母补贴，高学历，中低年龄

前提条件 – 数据准备：

一、准备数据源：

1、建立数据表：

CREATE TABLE `test_data_quotient_person_info` (
  `person_id` varchar(32) DEFAULT NULL COMMENT '人员ID',
  `id_card_number` varchar(32) DEFAULT NULL COMMENT '身份证号',
  `person_name` varchar(32) DEFAULT NULL COMMENT '姓名',
	`person_sex` varchar(32) DEFAULT NULL COMMENT '性别： 1-男 2-女 3-不详',
  `marry_tag` int(10) DEFAULT NULL COMMENT '婚姻标签：0-未婚 1-已婚',
  `children_number_tag` int(10) DEFAULT NULL COMMENT '孩子个数标签',
  `education_tag` int(10) DEFAULT NULL COMMENT '学历标签：0-初等学历 1-中等学历 2-高等学历',
	`person_age` int(10) DEFAULT NULL COMMENT '年龄',
	`parent_number_tag` int(10) DEFAULT NULL COMMENT '父母存活个数标签'
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2、配置数据：

二、配置dataworks数据同步：

1、按照数据源的方式建表，然后选择对应的同步信息：

2、配置调度：

此处省略

画像分析 – 标签管理

三、云计算资源：

1、配置外部的云计算资源，类似于“数据集成”中的数据源管理。

2、配置好外部云计算资源后可以查看对应的库表信息：

四、标签中心：

1、新建标签模型实体

1	关系模型还未体验

2、实体绑定标签数据表

绑定表的时候需要先”更新缓存表“更新成功后，才能看到新加入的源数据表。

3、选择绑定表后，先点击主字段，绑定为主标签，再绑定所有字段

4、我的标签–快查功能：

任务同步成功后，才能使用到画像分析的云计算资源分析引擎，对标签数据进行探查与分析：

可灵活的选择标签字段，查看数据，通过图表（柱状图、饼图、折线图）展现，数据的聚合（最大、最新、均值、求和、次数）情况

五、标签同步：

1、配置同步计划：

不能配置已经上线的标签，标签需要先下线，才能配置同步

目标云计算资源需要选择，mysql；选择odps，在群体画像–群体列表中将无法找到云计算资源

2、同步计划配置完成后点击启动，将数据同步到画像云计算资源中

3、可在同步任务中查看同步状态，和进行重跑操作，以及查看错误日志

六、API服务：

与dataworks的数据服务功能类似

画像分析 – 群体画像

七、配置群体：

1、新建群体：

2、选定实体后可以添加标签的逻辑：

3、目标场景的圈定条件为

一、中低学历奶爸
    性别：男 ： 1
    孩子个数 ： 大于0 ：  1-2  或者 >0 
    学历： 中、低学历 ：    0-1  或者 <2
二、高年龄奶爸
    性别：男 ： 1
    孩子个数 ： 大于0 ：  1-2  或者 >0 
    年龄： 大于30 ：    >30