为什么统计素养是提升人工智能技能以实现业务现代化的关键
该博客是Building AI Leadership Brain Trust Blog Series的延续,该博客系列的目标读者是董事会董事和CEO,以提高他们的谨慎职责,以开发更强大的AI技能和能力,从而确保其AI计划取得持续的成果。
在本博客系列中,我在AI领导力大脑信任框架中确定了40个技能领域,以指导董事会董事和CEO确保他们可以发展并加快对成功AI计划的投资。您可以在我的第一个博客中看到四十个领导层的“大脑信任”技能的完整名单 。
本系列中的每个博客都探讨了一组技能,或者更深入地探讨了其中一个技能领域。我得出的结论是,要释放人工智能价值的最后一环,董事会董事和首席执行官必须加快建立统一的大脑信任(在相关的数字和AI技能方面具有硬性规定的统一的领导技能),以使他们的组织更现代化。迅速。
在最近的三个博客中,我讨论了数学素养的重要性,在此博客中,我将讨论统计素养的重要性,这是建立强大且以操作为中心的AI功能的关键技术素养技能之一。
技术能力:
1.研究方法素养
2.敏捷方法素养
3.以用户为中心的设计素养
4.数据分析素养
5.数字素养
6.数学素养
7.统计素养
8.科学(计算科学,复杂性科学,物理)素养
9.人工智能(AI)和机器学习(ML)素养
10,可持续发展素养
该博客定义了统计知识,并提供了关键见解和问题,董事会董事和首席执行官可用来指导其领导层,以推进公司发展和维持AI卓越中心以支持所有业务功能的过程。
什么是统计知识是什么意思?
著名作家HG威尔斯(HG Wells)说最好的是100多年前:“对于有效的公民身份来说,有一天统计思考与读写能力一样是必要的。”
曾经有段时间如此真实。随着数据的爆炸式增长,解释数据模式以及评估统计数据和分析数据是每位董事会董事和高级管理人员的关键核心能力。所有员工必须培养统计素养,以解释数据并了解用于决策的报告。但是,当我经常问高管们是否正在对员工进行统计知识方面的培训时,我经常发现他们认为这个问题有点晦涩难懂-实际上,现代化对企业来说是必不可少的。
统计素养是一个包含在内的概念,要求领导者对各种形式和数据表示感到自在且胜任。统计数据涉及数据分析过程,还涉及数字意义,理解变量和符号,解释表和图形,样本映射概念,数据收集方法和问卷设计,概率和推论推理
统计学是数学的一个分支,它采用数字集,并使用各种数学方法(公式)将其简化为汇总。大多数商人都熟悉基本统计(例如平均值(平均值)),但是有许多不同的统计方法可以增加对AI的洞察力和相关性。当您听到“ AI”或“机器学习”一词时,您可能不会想到统计学,但统计学是关键的贡献领域,就像我之前的三个博客中讨论过数学素养一样。
统计领域是从数据中学习的科学。统计知识可帮助企业使用适当的方法来收集数据,进行正确的分析以及有效地解释和呈现结果。统计数据是一组工具,可帮助人们解释数据模式,识别有关数据的正确问题。统计通常被认为是应用机器学习领域的前提条件
正如本系列博客前面所定义的那样,人工智能致力于使计算机学会更像人类,并理解诸如大数据,机器学习,深度学习之类的术语,这些都是理解AI的关键概念。机器学习是指使用数学算法软件执行计算任务的计算机。由于AI有助于计算和判断未来事件(可能发生的事情,图像的真实情况,应避免的情况等),因此,数据量及其质量在使AI在学习中脱颖而出方面起着至关重要的作用。创建分类模式,探索情景假设,并从根本上将复杂的数据集组织为人类可以解释和做出决策的模式。
人类需要决定诸如以下的基本原则:
1.)定义用例和问题集,或定义发现假设以应用AI方法;
2.)选择最优化的AI算法来解决用例并证明假设;
3.)使用统计手段训练数据集以验证其准确性;
4.)解释结果和结果;和
5)确定如何采取行动来改善操作流程,执行力和价值实现中的人类决策能力,这是AI成功的关键。
AI领域的特点是使用个性化表达,例如关于算法和计算机程序的学习和成长。
在AI和机器学习方法中,统计素养是分析大数据或大数据集的关键。以下是一些最常使用的关键术语,这些术语来自您的数据科学家和AI资源可以理解的统计学科。为了改善与这些热情洋溢的数据专家的业务往来,这里有一些术语可增强您对关键统计概念的基础知识。
A / B测试-通常用于产品开发和市场营销实践中。A / B测试是一项随机实验,您可以在其中测试两个变体以确定最佳的操作过程。
偏差-是一种测量程序,如果平均而言给出的答案与真实情况有所不同,则认为该估计有偏差。偏差是测量值与真实值之间的平均预期差。
分类 是监督学习的示例,其中算法基于一组已知类别的特征将新数据放入预先存在的类别下。例如,它可以用于根据客户与先前在鞋子上花费过该金额的其他客户的相似性,来确定该客户是否可能在网上花费超过100美元。
因果推论-是测试给定情况下因果关系是否存在的过程。因果推理通常不仅需要良好的数据和算法,而且还需要主题专业知识来解释发现。
聚类-是分类,但没有监督学习方面。通过聚类,该算法接收输入的数据,并通过将相似的数据点分组在一起来找到数据本身的相似性。
相关性-相关性或依赖性是两个随机变量或双变量数据之间的任何统计关系,无论是否为因果关系。从广义上讲,关联是任何统计关联,尽管它通常指的是一对变量线性关联的程度(来源:Wiki Encyclopedia)。
交叉验证-是一种验证机器学习模型的稳定性或准确性的方法。尽管交叉验证有多种类型,但最基本的交叉验证包括将训练集分成两部分,并在一个子集上训练算法,然后再将其应用到第二个子集。因为您知道应该收到什么输出,所以您可以在预测中评估AI模型的有效性/准确性和强度。
假设检验-使用统计信息确定给定假设为真的概率。
线性回归-此方法通过将线性方程式拟合到观测数据来对两个变量之间的关系进行建模。这样,您可以基于未知变量的相关已知变量来对其进行预测。一个简单的例子是一个人的身高和体重之间的关系。
平均值-平均值通常称为平均值,因为平均值是数字的平均值:一组数字的计算出的“中心”值。计算方法:将所有数字相加,然后除以总数。
中位数-是数字排序列表中的中间数字。中位数可用于确定近似平均值或均值,但不要与实际均值相混淆。如果数字数量为奇数,则中位数为中间的数字,上下两个数字相同。
模式-是最常出现在数据集中的值。一组数据可以具有一个模式,多个模式或根本没有模式。其他流行的集中趋势度量包括均值(一组的平均值)和中位数(一组中的中间值)。
人口-正在研究的单位的集合。单位可以是人,地方,物体,时代,,程序或许多其他东西。许多统计数据都涉及从总体的随机样本中估计整个总体的数值属性参数。
概率-概率的质量或状态;产生给定事件的详尽的同等可能结果集中的结果数目与可能结果总数之间的比率;事件的机率是介于0到100%之间的数字。
Python-是用于通用编程的编程语言,并且是用于处理和存储数据的最流行的AI编程语言之一。
R是用于统计计算的编程语言和软件环境。R语言在统计学家和数据科学家中广泛用于开发统计软件和数据分析。
标准误差-标准误差是估算的统计准确性的量度。较大的样本量可减少标准误差
空间统计-是指将统计概念和方法应用于在其上附加了空间位置的数据,在该数据中,该位置元素被用作分析的重要和必要部分。
统计功效-是在原假设为假时做出正确决定以拒绝原假设的概率。换句话说,当有效果要检测时,研究很可能会检测到效果。高统计能力意味着错误地断定变量无效的可能性较小。
概括
英国首相本杰明·迪斯雷利(Benjamin Disraeli)在马克·吐温(Mark Twain)最常使用该句子之前,首先宣布“谎言,该死的谎言和统计数据共有三种” 。
统计数据的质量可能会有很大差异,因此,了解数据采样方式,使用的方法和技术以及了解数据集中的数据偏差对于确保统计方法有效并受支持至关重要。
联合国秘书长在“到2030年通往尊严之路”的综合报告中,建议了需要现代化的国家和公司,我们“将分析建立在可靠的数据和证据的基础上,以增强数据容量,可用性,分类,识字和共享。” 该报告强调,世界必须获得新的“数据素养”,才能配备能够在更加数字化的智能世界中工作所需的工具,方法,能力和信息。为了理解数据,高管必须增加对统计概念的了解。
数据通过多种数字技术渗透到我们的日常生活和企业生活中。通过数据,我们可以将整个世界计算为数学和统计概念。数据资产的民主化和数据素养对于所有组织(无论是私有组织还是公共组织)都能够现代化和应用人工智能方法至关重要。了解数据科学家和人工智能专家使用的基本统计数据和概念对于确保领导者可以领导,提出正确的问题以及有效地管理风险至关重要。
董事会董事和首席执行官要提出的使他们的业务现代化的关键问题是:
1.)我们的领导才能在各个层次上对统计知识的了解程度如何?
2.)我们公司是否有数据素养策略,教授数学素养以及统计素养的关键概念?
3.)我们是否正在招聘具有统计素养技能的人才?
4.)领导者是否可以轻松地找到具有统计知识深度的人才来解决复杂的业务问题?
5.)您的组织中正在使用哪些统计工具包,这些工具包是否易于访问?
最后,沃顿商学院教授洛林·维特(Lorin Witt)一直坚决主张改善数据访问,增强数据技能和一种在整个组织中以数据为依据的决策授权的文化。为了提高数据素养,统计素养是基础。
在硕士和博士课程期间研究过统计概念,并沉浸在AI中之后,我发现自己正在重新研究统计和数学学习资料,以提高我的数据素养领导技能。
标签: 人工智能技能