数据可视化在数据策略上的艺术与科学
王任泽

法国 Lascaux 洞窟的石器时代遗迹被认定为最古老的史前壁画,是人类最早的绘画创作。事实上,这些壁画也是当时人类利用“信息图表”(Infographics)记载生活的表现,能用以统计牲畜的种类和数量。

所谓“一图胜千言”,这是因为大脑处理文字和图像的方式不同:文字处理是“循序线性的”,而图像处理则是“同步进行的”,对人脑来说图像比文字容易理解。科学研究发现图像思考是双眼生物演化而来的天赋能力,图画是最基本而有效的表达工具,这也是在资料量爆炸的时代,数据可视化、信息图表成为显学的原因。

为何需要数据可视化

试想如何利用目前的疫情统计,让社会大众了解保持“社交距离(Social Distancing)”是控制新冠肺炎疫情的最佳解?当代处理数据的设备和技术,让数据工程师和数据分析师减少大量作业时间,完成数据清理、整备、建模和分析的工作。然而在分析结果产生之后,透过数字来描述脉络、述说故事、找到洞察并不容易。庞杂的信息利用图像来呈现,往往会有出乎意料的效果。

以防疫卫教为例,华盛顿邮报在一篇探讨如何对抗疫情的报导当中,先以时间序列图描述新冠肺炎感染人数呈“指数成长”,再以不同阻绝策略动态模拟病毒的扩散。比对四种模拟之后,验证“广泛保持社交距离(Extensive Distancing)”的情况下,感染人数曲线最为平缓,控制效果最佳(见下图)。此篇报导动态图表的意涵深入浅出,在网络上被大量转载和分享。

Simulation of Extensive Distancing
(图表来源:Why outbreaks like coronavirus spread exponentially, and how to “flatten the curve”https://www.washingtonpost.com/graphics/2020/world/corona-simulator/)

数据可视化的兴起也产生了新型态的工作,“数据记者”(Data Journalist)即是新兴职务之一。顾名思义,数据记者以数据可视化工具产生信息图表,加强写作和报导内容,让新闻讯息更容易向社会大众传播。早期的数据记者出现于开源社群,利用开放数据和可视化的技术产出图表,分享政治、社会、文化和环境等议题内容,间接促进了政府建立更完整的开放数据平台。随着信息图表加入了更多设计元素,时至今日数据新闻(Data Journalism)已成为新闻媒体的标准配备,走在浪头上的媒体甚至有专职数据记者的编制。

如同文字信息的传播,一组引人入胜的信息图表不但可以有效达到沟通的效果,更能快速地在社群中扩散。要制作一组有价值的信息图表,建议评估以下几项要素:

聚焦策略目标与诊断指标

数据可视化在企业层面的应用,就是能够即时帮助营运决策的数据仪表板(Dashboard)。一个企业所拥有的数据,散布于各个单位部门,要能第一时间掌握营运现况的数据并不容易。依据笔者的经验,企业对于数据仪表板的需求,通常隐含了两个命题:“多来源数据整合”和“商业智能(Business Intelligence, BI)”。可视化是信息呈现的方式,解决营运问题、达成企业目标要透过数据整合和分析找到答案。

管理大师彼得·杜拉克(Peter Drucker)倡导目标管理(Management by Objectives, MBO),其后世人衍生“驾驶舱内”的隐喻:关键结果领域(Key Result Areas, KRA)的指标,是引导企业发展方向之必要“仪表板”。做为商业用途的可视化信息图表,选定要呈现的策略目标和诊断指标(Diagnostic Metrics)甚为重要。策略目标具体的展现是“关键绩效指标(Key Performance Indicators, KPI)”,必须有代表性并且可用科学方式衡量,诊断指标则是客观的“度量”。

举例来说,某个企业设定“三个月内官方网站的流量增长10%以促进销售机会”,“促进销售机会”是策略目标,“流量增长10%”是KPI,用来测量流量的“访客数”则是诊断指标。

列举数码行销常见的KPI与诊断指标

消费旅程接触点

KPI

诊断指标(列举)

影片广告

关注提升

观看数、观看率、观看时间长度

展示型广告

互动增加

点击数、点击率、点击进站数

关键字广告

需求提升

搜索曝光量、点击数、点击率

网站

流量增长

访客数、不重复访客数、造访次数

电子商务

业绩增长

转换数、转换率、收益

多来源数据整合与视觉图表呈现

实务上,笔者经常遇到需要整合多来源数据的情境。例如企业想要了解数码媒体投放成效,除了检视媒体端的指标之外,也要同时观察媒体导流访客的网站使用行为,甚至要掌握这些访客是否带动电商转换率。有什么做法可以兼顾营运监测的即时性和互动性?

要满足这样的需求,除了在消费者互动的各个环节布署数据搜集机制,还可以将不同平台上的数据呈现在同一组数据仪表板当中。试想将 Google Ads、Facebook Ads 等媒体广告数据,并同网站流量数据及电商销售数据整合在一组仪表板上,透过筛选器选择任何时间区间进行观察和比较,进一步挖掘(Drill-down)不同媒体管道和广告素材的成效差异,可以大幅提升即时优化和绩效管理的效率。

你或许听过 Google Data Studio,或是 Tableau、Qlikview、微软 Power BI 等,都是业界常见的数据可视化解决方案。这些工具皆具备多来源的数据连接器(Data Connectors)和图表库,帮助企业打造兼顾美感和易用性的数据仪表板。

奥美应用案例

自2019年7月起,我们已陆续利用数据可视化工具发展数据产品,为客户开发仪表板。目前有五种不同类型的模板,如下表所列(因应实际需求客制开发则不限于这五类型):

数据仪表板类型

仪表板类型

规格

适用情境

适用行业

Data Source Integration

进阶

活动执行要监测好多平台的数据,如何快速提供整合性的资讯?

各行业适用

Grand Achievement

客户最关心的是整体活动成效和执行进度

零售业、电商

Performance Marketing

操作成效型活动,客户不提供网站流量数据的优化作法

金融业、保险业、基金公司

SEM

简易

如何增减关键字广告锁定的字组?

各行业适用

Social Posts Promotion

专为社群贴文设计的日常报表

各行业适用

由于客户营运资讯不宜作为公开案例,我们利用范例资料建置了展示仪表板供内外部测试,如下图所示。这组范例仪表板包含网站数据、电商数据以及 Google Ads 和 Facebook Ads 两种媒体数据,可体验“即时数据查询”和“互动图表操作”,让复杂的数据更容易理解和使用。

供内外部测试的范例仪表板

去年底我们也开始串接政府开放数据做可视化应用。新冠肺炎抗疫期间,“卫服部健保署”和“疾管署”陆续释出“健保特约机构口罩剩余数量明细清单”、“COVID-19 台湾最新病例、检验统计”、“COVID-19 各国家地区累积病例数与死亡数”、“地区年龄性别统计表-严重特殊传染性肺炎”等开放数据,提供社群朋友开发应用界面。

我们将台湾疫情统计、确诊案例分布、全球疫情统计、国际旅游警示以及医事机构口罩剩余数量汇整于一组仪表板,并透过数据源即时更新数据,提供关心疫情的民众一个资讯分流的平台:“Taiwan COVID-19 Situation Dashboard” https://bit.ly/2T4gRUD。 (这组仪表板被台湾公共数码创新空间的“口罩供需资讯平台” https://mask.pdis.nat.gov.tw/ 所收录)

如果你对数据可视化有兴趣,不妨找我们聊聊!

返回