第1章 商务数据分析概论
本章学习目标
(1)理解从数据分析到商业价值的数据思维;
(2)理解商务数据分析的基本概念与内涵;
(3)理解商务数据分析的过程与框架;
(4)熟悉商务数据分析的典型应用场景。
本章首先对数据、信息与数据分析的概念进行梳理,并通过一个洞察客户偏好的示例来介绍数据的商业价值;其次比较商务智能、数据分析、商务分析的概念,由此总结商务数据分析的定义与内涵,并梳理进行商务数据分析的基本步骤;再次选取商务数据分析的一些典型应用场景进行介绍;*后基于本书的主要内容与框架,整理导学知识图谱,方便读者对本书有一个整体的认知。
1.1 数据及其商业价值
1)数据、信息与数据分析
信息系统中存放的是数据,这些数据犹如企业经营者的眼睛,可以反映出经营的问题。数据是以定性或定量的方式来描述事物的符号记录。在把握数据这个概念时,需要注意以下三点。①数据与数值:数值仅仅是数据的一种存在形式,除了数值,数据还包括文本、图像、视频等多媒体存在形式。②数据与信息:信息来源于数据,是可以降低不确定性的东西。例如,“昨天的气温是30℃”,这里的30℃是数据;而“明天的气温将高达30℃”,这里的30℃就是信息,它降低了人们对“明天”天气估计的不确定性。因此,数据是一种物理性的符号;信息则是对数据的加工,是观念性和逻辑性的。数据与信息不可分离,两者是形与质的关系。③数据分析:数据分析的任务是从数据集中鉴别出其所包含的信息。
2)数据的商业价值:一个洞察客户偏好的简单示例
英国著名的连锁超市Safeway董事长肯 莫里森爵士曾经说过这样一句话:任何商人只要了解客户的两个信息,其事业就一定会成功,一个信息是他所服务的客户到底喜欢什么;另一个信息是他所服务的客户不喜欢什么。
客户对各种商品的喜欢或不喜欢的程度称为客户偏好。例如,用数值1,2,3,4,5表示客户对商品的喜欢/不喜欢程度。假设有商品集合{A,B,C,D, E},甲、乙、丙、丁、戊分别表示5个客户。因为这种信息隐藏在客户的心中,所以客户的偏好向量是很难直接获得的。但在电子商务平台上,客户往往对所购买的商品进行评分,通过这些数据,可以概括出如表1-1所示的客户偏好。
表1-1中的符号“?”表示某客户没有购买过某商品,所以没有评分。那么商家如何知道客户对没有购买的商品的偏好程度呢?观察表1-1发现,对商品集合{A,B,C,D}来说,甲的偏好向量为(5321),丁的偏好向量也为(5321),两者完全一致,即甲与丁的偏好向量的欧几里得距离(Euclidean distance)为0。甲对商品E的评分为1,即“非常不喜欢”。那么,既然甲和丁的偏好完全一致,根据“物以类聚,人以群分”的生活常识,可以判断出客户丁对商品E也会“非常不喜欢”。同理,客户乙与客户戊的偏好向量也完全一致,而客户戊对商品E的评分是“5”,那么据此可判断出客户乙对商品E也将会“非常喜欢”。
从上述这个简单的例子可以看出,数据中隐藏着很多对运营商有帮助的信息,这些信息反映了数据的商业价值。
从数据到能反映商业价值的信息并非单纯的数据建模,而是要把数据代入业务场景中,通过数据产生价值,从而解决业务场景中的问题。因此,首先要进行数据业务的定义,即把数据对应的业务问题转换成实际可分析和解决的问题;然后进行数据分析和建模,即通过多种数据挖掘的方法进行分析;*后进行数据业务的实施,即根据数据分析和建模的结果进行业务改进,实现真正的商业价值。因此,没有*后一步,再完美的数据建模都是无法实现数据的商业价值的。
1.2 商务数据分析的概念和步骤
1)商务数据分析的定义与内涵
大多管理信息系统(management information system,MIS)都是从事务处理系统(transaction processing system,TPS)开始构建的,这些系统可极大地提高业务处理的效率。伴随着业务活动,管理信息系统记载了各业务单元的业务活动数据,这些数据称为商务数据。商务数据分析源自数据分析,兼具商务分析和商务智能的特点。
商务智能是利用数据仓库与数据挖掘技术将系统中的数据转化为知识,帮助经营者得出经营决策的工具。
数据分析是强调用统计分析对大量数据进行分析,提取出有用信息和形成结论而对数据加以详细研究与概括总结的过程。
商务分析从企业的业务决策入手,包括对业务进行分析、建模、模拟,需要对趋势做出判断。
可见,商务数据分析的内涵是以企业业务为出发点,收集大量数据并从中提取信息、形成分析结论,得出可以预测趋势、指导业务实践的判断。虽然商务数据分析涉及许多模型和算法,但是它不仅仅是某一个公式或者一串代码,它的真正魅力在于系统的、客观的、有逻辑的思考。在进行商务数据分析时,要确保数据具有商业时效性,立足于应用场景,并用数据去还原场景,让数据产生实际价值。
2)商务数据分析的基本步骤
商务数据分析的基本步骤(图1-1)有明确需求和目的、数据收集、数据处理、数据分析、数据展现和分析报告。
(1)明确需求和目的。明晰哪些商务决策需要商务数据分析来辅助,并据此制订数据分析的工作计划。
(2)数据收集。根据商务数据分析的需求及目的定义相应的业务数据。
(3)数据处理。从大量难以理解的数据中抽取并推导出有价值、有意义的数据,剔除数据噪声。
(4)数据分析。运用统计学、商务智能等数据分析工具挖掘数据的价值。
(5)数据展现。为降低人们的认知负担,需采用合理的数据展现方式。目前,数据可视化被业界普遍采用。
图1-1 商务数据分析的基本步骤
(6)分析报告。向商务决策者阐明商务问题的本质、业务趋势及商务分析结论等。
1.3 商务数据分析的主要应用领域
在当今社会中,伴随着技术发展和商务需求的增加,商务数据分析的发展和应用越来越完善。在技术发展方面,首先,互联网、计算机、智能手机、应用程序和软件包收集、存储、移动了大量个人或组织的有关数据,数千个应用程序平台(如Android、iOS、Windows)的数据几乎覆盖了全球的个人活动;然后,数据的积累速度给数据的存储、管理、分析和决策应用提出了前所未有的挑战,而技术的发展给整合各种数据源提供了可行性,能够有效地应对这样的挑战;*后,存储与计算能力以及简单易用的编程工具和平台为商务数据分析带来了便利。
在商务需求方面,企业之间的竞争越来越激烈,为了满足生存和发展需要,企业必须对未来的趋势做出预测和分析。此外,由于全球化商业的复杂性和不确定性增加,企业的商务风险明显增大,正如管理学巨匠彼得 德鲁克所说:“在未来的社会中,不能正确预测趋势将导致企业100%的失败。”为了尽可能降低商务风险,商务数据分析发挥着越来越重要的作用,在不同领域也有了十分广泛的应用。目前,商务数据分析的应用已经涉及电商、医疗、金融、体育等各个领域,本章将选取一些典型的应用场景进行简单介绍。
(1)客户分析。客户分析主要是基于客户的信息和数据进行商业行为分析。客户是企业生存和发展的基础,企业只有进行充分的客户分析,才能更好地制定相应的营销策略。客户分析的步骤一般包括:①明确目标客户以及他们的需求,对目标客户的基本情况和行业特征进行总体分析;②了解目标客户的消费行为和购物偏好,以此制定相应的商品营销策略;③结合已有的客户数据,进行进一步的客户细分、客户价值分析、客户流失预测等,提升客户满意度和忠诚度。
(2)营销分析。根据营销学中的4P原则,营销分析主要包括产品(product)分析、价格(price)分析、渠道(place)分析和促销(promotion)分析。其中,产品分析主要是结合产品的目标、定位、功能、运营等方面,制定完善的产品策略;价格分析主要是分析产品的成本与市场价位是否合理,以期达到降低成本、提高利润的目的;渠道分析主要是分析渠道形势,制定经济性的渠道决策,合理配置并优化渠道;促销分析主要是通过一系列打折促销活动,吸引客户的关注,从而提升销量、提高利润。
(3)社交媒体分析。社交媒体是基于社会化网络服务、即时通信软件、电子邮件等互联网传播媒介,进行用户之间的内容生成与分享的平台。社交媒体分析正是在这样的背景下产生的。通过对不同社交媒体的内容、话题、用户、互动等进行分析,可以构建社交媒体用户画像,了解用户对某个话题的情绪态度,预测用户感兴趣的内容与话题,改善社交媒体的服务质量,提高社交媒体的用户活跃程度等。
(4)金融数据分析。金融行业能够产生海量的金融数据。该行业具有本身的特殊性和复杂性,要求数据具有严格的逻辑性、稳定性、实时性,因此金融数据分析对于金融行业从业者来说至关重要。通过金融数据分析,我们可以找到股票移动的规律并确定是否参与投资,可以进行贷款偿还预测和客户信用分析,可以利用关联规则算法划分对银行融资感兴趣的客户,针对性地进行金融产品的推荐等。
(5)体育数据分析。商务数据分析已经扩展到体育领域,电影《点石成金》中就已经展现了对棒球比赛的统计数据进行分析来指导球员赢得胜利的案例。通过对个人身体素质数据进行分析,可以寻找有价值的运动员;通过对运动员训练反馈的数据进行分析,可以提高运动员的战术水平;通过对比赛日双方团队的表现数据,可以预测某场球赛某个团队的胜率,等等。
(6)医疗健康数据分析。医疗健康数据分析主要利用互联网和大数据对各层次的健康信息进行整合与挖掘,从而提升医疗健康服务,使各级各类的医疗行业高效运营。医疗健康数据分析的场景十分广泛,通过对患者临床诊断数据的聚类整合,可以对相似病情进行辅助诊断;通过对某种疾病数据的分析,可以进行疾病的早期预测,为精准医疗和预防提供决策支持,等等。由于医疗健康数据复杂且多源,目前此领域的应用仍处于初步发展阶段,未来的应用前景可期。
(7)物流供应链分析。物流供应链数据来自企业资源计划(enterprise resource planning,ERP)、供应链管理(supply chain management,SCM)系统、全球定位系统、基于射频识别(radio frequency identification,RFID)技术的跟踪等。从*初的原材料,到组装、运输、仓储、零售等环节,数据分析不可或缺。通过物流供应链分析,可以精准地预测需求,可以智能调度货运人员,可以制定更加科学的库存管理策略,等等。有效的物流供应链分析可以帮助企业做出正确的供应链管理决策,提高供应链的灵敏度,降低物流成本。
(8)欺诈行为检测。欺诈行为检测是大数据安全管理的重要环节之一。伴随着数据获取成本的降低和数据异地存储、可复制性的增加,欺诈行为越来越多。通过对用户交易信息、信用卡数据、电话短信信息等进行分析,可以有效识别出潜在的欺诈行为,降低欺诈风险。例如,通过对信用卡数据的分析,可以检测出潜在的信用卡欺诈行为;通过对频繁就医和住院行为的分析,可以检测出医保欺诈行为,等等。
1.4 导学知识图谱
本书的导学知识图谱如图1-2所示,该图谱给出了全书的内容与框架。
【习题】
1-1 举例说明数据与信息的区别。
1-2 举例说明商务数据分析的基本步骤。
1-3 就你熟悉的领域,试论述如何将商务数据分析应用到该领域。
展开