在互联网逐渐步入大数据时代后,不可避免地给企业、组织及用户的行为带来一系列改变与重塑。最大的变化,用户的所有行为在企业/组织面前几乎都是可视的。随着大数据技术的深入研究与应用,企业/组织的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“标签画像”的概念也就应运而生。
简而言之,实体画像是根据实体社会属性、行为、发展趋势等信息抽象出的一个标签化的模型。构建实体画像的核心工作即是给实体贴“标签”,而标签是通过对实体信息分析而来的高度精炼的特征标识。给实物打标签是常见的一种数据分析归类手段,在移动互联网的时代,各个平台对标签的应用场景无处不在。
01 产品需求背景
随着企业的数字化转型不断发展,从海量的数据中识别并提炼数据价值是一件非常重要的事情。在企业的标签管理中,会面临着数据无法统筹、标签缺乏治理、计算方式单一等问题,同时也对标签平台的能力有了更高的要求,集中体现在以下四点:
1.数据散落无法统筹到统一的数字底板上
用户行为数据,物品信息数据,经营数据、事件数据等各类数据散落在不同的平台,难以完整地描述单实体的完整社会、行为属性。
- 产品能力:数据多源分析
2.标签缺乏全链路周期治理
目前市面上的标签平台缺乏一个从数据接入、标签计算、标签存储、标签使用等全链路、血缘的监控和可视化展现功能,无法进行标签溯源和方便高效的问题排查。
- 产品能力:标签治理
3.标签需要丰富多样化的计算方式
标签需要丰富多样的计算方式,以支撑标签的权重、时效、预测、分析、关系、实体描述等多种应用场景,因此必须结合实时、离线数据,支持关系型运算、实时离线混合计算、多种AI模型。
- 产品能力:混合计算
4.传统关系型数据库无法满足查询和计算需求
各行业数据积累越来越多,海量数据需要计算和抽取属性、内容来描述现实世界的实体目标,传统的关系型数据库、普通的大数据计算引擎无法满足计算需求和海量数据下的查询需求。
- 产品能力:海量数据查询与计算
02 标签平台概述
产品架构图
基于用户需求和多种多样的数据来源,标签平台经过标签建模、标签工厂多维分析加工处理,生成标签结果数据,构建丰富的标签服务,实现大数据标签体系的数据赋能,支持多元化应用场景。
产品构建了完整的标签治理体系,囊括从标签运营、全链路血缘、质量管理、权限管控的全生命流程。同时针对标签计算本身添加其时效性参数、标签权重值、AI预测标签、手动自动运维标签功能、标签历史版本和标签数据同步交换功能,最大化实现数据价值变现。
北明数科结合公安、政务、智慧城市、有呼必应事件等多领域深厚的大数据技术积累,为客户提供基于数据的标签体系建设能力,将数据标签化,通过给实体打上标签的方式,让数据的价值密度更高。
03 标签平台主要功能
1.标签构建
根据获取到的源数据形成可用的实体属性和实体行为、特征等数据,通过业务建模、引擎计算进行加工生成事实标签、模型标签、以及预测标签。根据业务需要进行用户分群,精准定位用户群体,标签整体随着业务变化、运营策略调整而实时更新。
- 标签类目
根据业务对象的属性构建标签类目体系,对标签信息进行结构化描述,清晰的展示标签之间的关联关系。
新建标签分类
- 标签建模
分析业务需求、确定业务口径、分析数据规律,进行数据标签的规划和模型构建。
标签建模
- 标签开发
通过建模生成的标签,执行业务标签实例,生成相应数据,并给目标打上对应标签,构建对上层提供数据服务的基础。
标签开发
2.全链路任务监控
- 实体任务监控
提供对实体采集任务的监控,以可视化方式展示周期/手动采集任务的执行情况,可对任务周期进行配置。
实体任务监控
- 标签开发任务监控
针对标签开发中的标签模型、标签日表、聚合等任务以可视化方式展示其执行情况,方便开发人员监控整个从实体到标签的全链路任务执行过程。
标签开发任务监控
3.画像平台
对用户线上和线下行为深度洞察,构建全面、精准、多维的用户画像体系,提供丰富的用户画像数据以及实时的场景识别能力。可针对个体和群体进行画像,并自定义画像展示内容和分析图表,同时可结合历史行为、数据自定义内容进行趋势分析。
画像平台
4.标签分析挖掘
以标签、实体为基本元素,提供自定义可视化拖拽的图形分析功能,支持交并差以及自定义组合功能算子,对标签数据结果进行运算,中心以快速、高效、便捷、实用为设计理念,为线索研判、分析决策、多维组合分析、趋势预测等场景提供有效支撑。分析挖掘结果支持以文件形式下载,或转储到库表,方便进一步分析、使用。
标签分析挖掘
5.标签中心
对整个数据中台的标签以平铺、目录等多种视图直观展现整个标签生态数据,支持对标签多样维度的分析、版本管理、任务监控、权限管理和设置、标签实体管理、标签血缘分析、标签数据预览、标签维护等功能。
6.标签资产
以单个标签为中心,解析标签模型元数据,形成清晰、准确的数据血缘图和数据流向图,以历史事实的方式记录数据的来源、处理过程等。形成整条可数据溯源的标签链路,达成从原始采集端到服务输出端全链路的计算监控、数据溯源、问题排查等。
标签资产
7.标签质量
- 质量检测规则
提供对标签生产结果数据和标签模型定义的质量检测。针对标签模型,提供对模型元数据的命名、定义进行规范化检测。
- 标签质量报告
针对标签数据提供对标签命中数、含义冲突、标签使用运营情况、热度等进行整体的分析研判,形成闭环的正反馈提高标签整体效能
7.标签应用
04 产品优势
1.画像模板
可自由拖拉拽的方式定制多种画像分析模板,根据用户喜好自由组合标签画像的展现方式,生成个体和群体画像。
2.混合计算
支持实时数仓和离线数仓混合计算,生成基于时效性的动态标签和基于客观事实的静态标签,多样化描述实体的主观认知和客观事实属性。
3.全链治理
覆盖标签地图、标签溯源(标签时间轴)、血缘、标签质量、标签热度、标签维护、标签覆盖率、标签评价、手工维护等全链路治理能力。
4.机器学习
利用线性回归、决策树、聚合算法、RNN、TF-IDF、NLP等算法,为标签生成、标签生命周期管理、标签权重、预测等场景提供算法支持
05 应用场景
1.金融风控--客户画像
通过数据模型,如企业评分标签,以及企业标签信息,构建企业画像,根据权重,进行企业评分,通过将多维指标进行规则化运算,让用户更直观掌握企业总体信息。
2.城市大脑--人员标签
依托某省级城市的数智中台底座,通过标签平台建设人口基础库和主题库,进而提供数据分析、画像分析、数据共享、数据查询服务。人口库可以根据不同主题专题的人员相关数据进行横向拓展,不断完善人员的扩展信息,打造全面的人员档案。
进入北明数科官网,了解数字化转型更多详细内容,预约免费演示!
该系列历史文章汇总:
全域数据一体化构建① | 数据治理平台
全域数据一体化构建② | 预警平台
全域数据一体化构建 ③ | 知识图谱
全域数据一体化构建 ④ | 物联感知平台
全域数据一体化构建 ⑤ | 智能检索平台
评论留言