有赞的数据分析能力是否能够应对技术变革

作者: 点击数:

更新时间:2023-10-19

一、有哪些能够提升数据分析思路的书?

数据分析主要有哪些思维?学习的路线是怎么样的?

为了提供一个简单的方向指引,让数据分析思维的学习过程更加有趣,我做了一幅数据分析思维九段路线图,你可以把学习的过程当作一种游戏,享受段位升级的乐趣。

在段位升级的过程中,如果你理解起来感觉比较吃力,那么应该沉下心来,认真地先把基础打好,积累更多的数据分析经验。

DataFocus 企业大数据BI分析系统,让数据分析像搜索一样简单

1. 初段:目标思维

做数据分析,首先要一定明确目标,以终为始。

只有明确目标,才不会迷失方向,就像导航软件,如果没有设置目的地,那么它是没法告诉你路线图的。

目标思维主要体现在以下 3 个方面:

(1)正确地定义问题

比如说,小明听了煎饼大妈月入 3 万的故事,心里就想:为什么煎饼大妈月入 3 万?

这个问题的定义,应该是关注「月入 3 万」,而不是「煎饼大妈」。

也就是说,小明想的应该是「如何实现月入 3 万」,而不是「如何变成煎饼大妈」。

(2)合理地分解问题

比如说,煎饼大妈如何实现月收入 3 万?

这是一个比较大的问题,可以进行细分,因为收入等于订单数乘以客单价,所以把这个问题细分为两个小问题:

a. 如何实现一个月卖 5000 个煎饼?

b. 如何实现平均每个煎饼卖 6 块钱?

(3)抓住关键的问题

在不同的发展阶段,关键问题是不一样的。

比如说,对煎饼大妈来讲,刚开始做的时候,关键问题是:如何选择人流量大的好地段?

当选好地段之后,关键问题就变成:如何提高路人来购买的概率?如何提高客单价?如何提高重复购买率?

总之,数据分析的目标,就好比枪上的瞄准器,如果没有瞄准器,枪照样可以打,但是有了瞄准器,枪才可以打的更准。

2. 二段:对比思维

有人说:

在数据分析中,没有对比,就没有结论。

比如说,小明某次期末考试的成绩不好,英语只得了 30 分,小明的妈妈对他说:“你上次考试英语考了 70 分,这次怎么就考得这么差?你看你的同班同学,这次都考 80 分以上。”

常见的对比思维有以下 5 种:

(1)跟目标对比

(2)跟上个月比

(3)跟去年同比

(4)分渠道对比

(5)跟同类对比

数据分析的过程,就是在明确目标之后,通过对比等思维,找到问题的原因,得出分析的结论,提出可行的建议,从而起到帮助决策和指导行动的作用。

3. 三段:细分思维

有人说:

在数据分析中,细分是数据分析的灵魂,无细分,毋宁死。

比如说,小明某次考试的总成绩不好,细分一看,发现其他科目的成绩都不错,只有英语成绩特别差,只得了 30 分,从而拉低了整体的成绩。

常见的细分方法有以下 5 种:

(1)按时间细分

(2)按空间细分

(3)按过程细分

(4)按公式细分

(5)按模型细分

在运用细分思维解决问题的过程中,要做到有的放矢,围绕数据分析的目标,找到合适的方法,不要像无头苍蝇一样到处乱撞。

当发现数据异常时,尝试从不同的维度进行细分,这样既能锻炼你的数据分析思维,又能加深你对业务的理解。

DataFocus 企业大数据BI分析系统,让数据分析像搜索一样简单

4. 四段:溯源思维

做数据分析的时候,要多问几个为什么,追根溯源,在数据源寻找可能隐藏的逻辑关系和解决方案。

比如说,小明把自己每天的行动数据,都用 Excel 详细记录下来,其中包括每一时段的情绪数据。小明做复盘总结的时候,发现有一天情绪数据特别低,然后连续问了几个为什么:

(1)为什么这一天情绪数据特别低?

因为那一天小明上当受骗了。

(2)为什么会上当受骗?

因为骗子用生命安全来吓小明。

(3)为什么骗子能吓到小明?

因为小明担心自己的生命安全。

(4)为什么小明会担心生命安全?

因为求生是人类的本能反应。

(5)为什么人会有求生的本能?

因为人的大脑分为:年代久远的本能脑、相对古老的情绪脑和非常年轻的理智脑。

理智脑对大脑的控制能力很弱,大部分决策往往源于本能和情绪,而非理智。

到这一步,小明找到了自己上当受骗的根本原因,在于自己当时没有控制好自己的大脑,所以失去理智。

针对这个问题,小明运用「控制两分法」,并在脑海中反复进行演练,然后在实践中进行校正,实现与情绪的和平共处,从而更加理智地面对纷繁复杂的世界。

如果你经常运用溯源思维,就能提升数据的敏感度,并加深对业务的理解。

5. 五段:相关思维

相关思维,就是寻找变量之间相互关联的程度。

比如说,有一家超市的数据分析师发现,跟尿布一起购买最多的商品竟然是啤酒,啤酒和尿布有什么关联呢?

采访小明的爸爸,他说自己下班后,给小明的妹妹买尿布的同时,也会购买自己喜欢喝的啤酒。

如果一个变量改变的时候,另一个变量也朝着相同的方向发生变化,那么我们就说这两个变量之间存在正相关性。

运用相关思维,通常包括以下 3 个步骤:

(1)收集相关数据

(2)绘制散点图形

(3)计算相关系数

需要注意的是,相关不等于因果。即使两个变量之间相关,也不代表其中一个变量的改变,是由另一个变量的变化引起的。

比如说,国家的诺贝尔奖数量,与巧克力消费量之间呈现正相关关系,但这并不是说,多吃巧克力有助于获得更多的诺贝尔奖。

一种合理的解释是,诺贝尔奖的数量与巧克力的消费量,很可能都是由其他变量导致的,例如国民的受教育程度和富裕程度。

6. 六段:假设思维

胡适先生说过:

这句话非常适合用在数据分析领域。

大胆假设,就是要打破既有观念的束缚,挣破旧有思想的牢笼,大胆创新,对未解决的问题提出新的假设。

小心求证,就是基于上面的假设,用一种严谨务实的态度,寻找真相,不能有半点马虎。

比如说,有一天小明去买水果,跟卖水果的阿姨说:

“阿姨,你这桔子甜不甜?”

阿姨:“甜啊,不信你试试。”

小明:“好,那我试一个。”

小明剥开一个桔子,尝了一口说:

“嗯,不错,确实挺甜的,给我称两斤。”

运用假设思维,通常包括以下 3 个步骤:

(1)提出假设

(2)统计检验

(3)做出判断

大胆假设并非绝对可靠,但是通过小心求证,我们可以更好地认识世界上的许多现象,从而得出更有价值的分析结论。

7. 七段:逆向思维

到了七段,你已经具备比较丰富的数据分析经验,此时如果想要进一步有所突破,就得打破常规,具有逆向思维的能力。

比如说,有一天小明去买西红柿:“阿姨,你这西红柿多少钱一斤?”

阿姨:“两块五。”

小明挑了 3 个放到秤盘:“阿姨,帮我称一下。”

阿姨:“一斤半,3 块 7 毛。”

小明去掉其中最大的西红柿:“做汤不用那么多。”

阿姨:“一斤二两,3 块。”

小明拿起刚刚去掉的那个最大的西红柿,付了 7 毛钱,扭头就走了。

你看,本来是阿姨想占小明的便宜,虚报重量。但是,小明利用逆向思维,反而让阿姨吃了哑巴亏。

常见的逆向思维有以下 5 种:

(1)结构逆向

(2)功能逆向

(3)状态逆向

(4)原理逆向

(5)方法逆向

理解这些逆向的方法,有助于你打开数据分析的思路,不断提升自己的可迁移能力,尤其是底层的思维能力,做到以不变应万变。

8. 八段:演绎思维

演绎思维的方向是由一般到个别,主要形式是「三段论」,由大前提、小前提、结论三部分组成。

比如说,小明不仅知道:金属都能导电;而且知道:铜是一种金属;所以小明可以得出结论:铜能导电。

运用演绎思维,应该遵循 5 项基本原则:

(1)不要出现第四个概念

(2)中项要能向外延伸

(3)大项和小项都不能扩大

(4)前提都为否,结论不必然

(5)前提有一否,结论必为否

掌握以上基本原则,能帮你建立更加严谨的数据分析思维。

9. 九段:归纳思维

归纳思维的方向与演绎正好相反,归纳的过程是从个别到一般。

比如说,小明先知道:金、银、铜、铁等金属分别能导电,然后归纳出一个结论:所有金属都能导电。

这个过程,是先接触到个别事物,然后再进行归纳总结。

常见的归纳方法有以下 5 种:

(1)求同法

(2)求异法

(3)共用法

(4)共变法

(5)剩余法

这些方法是我们获取新知识的重要途径,不过需要注意的是,很多案例和故事都说明,有限的观察并不等于真理。

为了避免以偏概全,我们还要加强归纳思维的训练,积累更多实战的经验,这样归纳总结出来的结论,才能经得起时间的考验,才会更有现实意义。

通过归纳总结,得出有价值的分析结论,这既是数据分析的终点,也是数据分析的起点,形成一个正向的循环系统。

最后的话

正确的思维能力,是做好数据分析的必备条件,这也是很多人相对比较欠缺的一种能力。

要想成为一个有洞察力的人,就要多学习、多思考、多总结、多实践,通过刻意练习,举一反三,把数据分析的思维,应用到日常的工作和生活中去,逐渐提升自己的数据分析思维能力。

二、数字信号处理技术在大数据分析中的应用有哪些?

  您是否想更好地了解传统数据与大数据之间的区别,在哪里可以找到数据以及可以使用哪些技术来处理数据?

  这些是处理数据时必须采取的第一步,因此这是一个不错的起点,特别是如果您正在考虑从事数据科学职业!

  “数据”是一个广义术语,可以指“原始事实”,“处理后的数据”或“信息”。为了确保我们在同一页面上,让我们在进入细节之前将它们分开。

  我们收集原始数据,然后进行处理以获得有意义的信息。

  好吧,将它们分开很容易!

  现在,让我们进入细节!

  原始数据(也称为“ 原始 事实”或“ 原始 数据”)是您已累积并存储在服务器上但未被触及的数据。这意味着您无法立即对其进行分析。我们将原始数据的收集称为“数据收集”,这是我们要做的第一件事。

  什么是原始数据?

  我们可以将数据视为传统数据或大数据。如果您不熟悉此想法,则可以想象包含分类和数字数据的表格形式的传统数据。该数据被结构化并存储在可以从一台计算机进行管理的数据库中。收集传统数据的一种方法是对人进行调查。要求他们以1到10的等级来评估他们对产品或体验的满意程度。

  传统数据是大多数人习惯的数据。例如,“订单管理”可帮助您跟踪销售,购买,电子商务和工作订单。

  但是,大数据则是另外一回事了。

  顾名思义,“大数据”是为超大数据保留的术语。

  您还会经常看到它以字母“ V”为特征。如“大数据的3V ”中所述。有时我们可以拥有5、7甚至11个“ V”的大数据。它们可能包括– 您对大数据的愿景,大数据的价值,您使用的可视化工具或大数据一致性中的可变性。等等…

  但是,以下是您必须记住的最重要的标准:

  体积

  大数据需要大量的存储空间,通常在许多计算机之间分布。其大小以TB,PB甚至EB为单位

  品种

  在这里,我们不仅在谈论数字和文字。大数据通常意味着处理图像,音频文件,移动数据等。

  速度

  在处理大数据时,目标是尽可能快地从中提取模式。我们在哪里遇到大数据?

  答案是:在越来越多的行业和公司中。这是一些著名的例子。

  作为最大的在线社区之一,“ Facebook”会跟踪其用户的姓名,个人数据,照片,视频,录制的消息等。这意味着他们的数据种类繁多。全世界有20亿用户,其服务器上存储的数据量巨大。

  让我们以“金融交易数据”为例。

  当我们每5秒记录一次股价时会发生什么?还是每一秒钟?我们得到了一个庞大的数据集,需要大量内存,磁盘空间和各种技术来从中提取有意义的信息。

  传统数据和大数据都将为您提高客户满意度奠定坚实的基础。但是这些数据会有问题,因此在进行其他任何操作之前,您都必须对其进行处理。

  如何处理原始数据?

  让我们将原始数据变成美丽的东西!

  在收集到足够的原始 数据之后,要做的第一件事就是我们所谓的“数据预处理 ”。这是一组操作,会将原始数据转换为更易理解且对进一步处理有用的格式。

  我想这一步会挤在原始 数据和处理之间!也许我们应该在这里添加一个部分...

  数据预处理

  那么,“数据预处理”的目的是什么?

  它试图解决数据收集中可能出现的问题。

  例如,在您收集的某些客户数据中,您可能有一个注册年龄为932岁或“英国”为名字的人。在进行任何分析之前,您需要将此数据标记为无效或更正。这就是数据预处理的全部内容!

  让我们研究一下在预处理传统和大原始数据时应用的技术吗?

  类标签

  这涉及将数据点标记为正确的数据类型,换句话说,按类别排列数据。

  我们将传统数据分为两类:

  一类是“数字” –如果您要存储每天售出的商品数量,那么您就在跟踪数值。这些是您可以操纵的数字。例如,您可以计算出每天或每月销售的平均商品数量。

  另一个标签是“分类的” –在这里您正在处理数学无法处理的信息。例如,一个人的职业。请记住,数据点仍然可以是数字,而不是数字。他们的出生日期是一个数字,您不能直接操纵它来给您更多的信息。

  考虑基本的客户数据。*(使用的数据集来自我们的 SQL课程)

  我们将使用包含有关客户的文本信息的此表来给出数字变量和分类变量之间差异的清晰示例。

  注意第一列,它显示了分配给不同客户的ID。您无法操纵这些数字。“平均” ID不会给您任何有用的信息。这意味着,即使它们是数字,它们也没有数值,并且是分类数据。

  现在,专注于最后一列。这显示了客户提出投诉的次数。您可以操纵这些数字。将它们加在一起以给出总数的投诉是有用的信息,因此,它们是数字数据。

  我们可以查看的另一个示例是每日历史股价数据。

  *这是我们在课程Python课程中使用的内容。

  您在此处看到的数据集中,有一列包含观察日期,被视为分类数据。还有一列包含股票价格的数字数据。

  当您使用大数据时,事情会变得更加复杂。除了“数字”和“分类”数据之外,您还有更多的选择,例如:

  文字数据

  数字图像数据

  数字视频数据

  和数字音频数据

  数据清理

  也称为“ 数据清理” 或“ 数据清理”。

  数据清理的目的是处理不一致的数据。这可以有多种形式。假设您收集了包含美国各州的数据集,并且四分之一的名称拼写错误。在这种情况下,您必须执行某些技术来纠正这些错误。您必须清除数据;线索就是名字!

  大数据具有更多数据类型,并且它们具有更广泛的数据清理方法。有一些技术可以验证数字图像是否已准备好进行处理。并且存在一些特定方法来确保文件的音频 质量足以继续进行。

  缺失值

  “ 缺失的 价值观”是您必须处理的其他事情。并非每个客户都会为您提供所需的所有数据。经常会发生的是,客户会给您他的名字和职业,而不是他的年龄。在这种情况下您能做什么?

  您是否应该忽略客户的整个记录?还是您可以输入其余客户的平均年龄?

  无论哪种最佳解决方案,都必须先清理数据并处理缺失值,然后才能进一步处理数据。

  处理传统数据的技术

  让我们进入处理传统数据的两种常用技术。

  平衡

  想象一下,您已经编制了一份调查表,以收集有关男女购物习惯的数据。假设您想确定谁在周末花了更多钱。但是,当您完成数据收集后,您会发现80%的受访者是女性,而只有20%是男性。

  在这种情况下,您发现的趋势将更趋向于女性。解决此问题的最佳方法是应用平衡技术。例如,从每个组中抽取相等数量的受访者,则该比率为50/50。

  数据改组

  从数据集中对观察结果进行混洗就像对一副纸牌进行混洗一样。这将确保您的数据集不会出现由于有问题的数据收集而导致的有害模式。数据改组是一种改善预测性能并有助于避免产生误导性结果的技术。

  但是如何避免产生错觉呢?

  好吧,这是一个详细的过程,但概括地说,混洗是一种使数据随机化的方法。如果我从数据集中获取前100个观察值,则不是随机样本。最高的观察值将首先被提取。如果我对数据进行混洗,那么可以肯定的是,当我连续输入100个条目时,它们将是随机的(并且很可能具有代表性)。

  处理大数据的技术

  让我们看一下处理大数据的一些特定于案例的技术。

  文本数据挖掘

  想想以数字格式存储的大量文本。嗯,正在进行许多旨在从数字资源中提取特定文本信息的科学项目。例如,您可能有一个数据库,该数据库存储了来自学术论文的有关“营销支出”(您的研究主要主题)的信息。大数据分析技术有哪些https://www.aaa-cg.com.cn/data/2272.html如果源的数量和数据库中存储的文本量足够少,则可以轻松找到所需的信息。通常,尽管数据巨大。它可能包含来自学术论文,博客文章,在线平台,私有excel文件等的信息。

  这意味着您将需要从许多来源中提取“营销支出”信息。换句话说,就是“大数据”。

  这不是一件容易的事,这导致学者和从业人员开发出执行“文本数据挖掘”的方法。

  数据屏蔽

  如果您想维持可靠的业务或政府活动,则必须保留机密信息。在线共享个人详细信息时,您必须对信息应用一些“数据屏蔽”技术,以便您可以在不损害参与者隐私的情况下进行分析。

  像数据改组一样,“数据屏蔽”可能很复杂。它用随机和假数据隐藏原始数据,并允许您进行分析并将所有机密信息保存在安全的地方。将数据屏蔽应用于大数据的一个示例是通过“机密性保留数据挖掘”技术。

  完成数据处理后,您将获得所需的宝贵和有意义的信息。我希望我们对传统数据与大数据之间的差异以及我们如何处理它们有所了解。

https://www.toutiao.com/i6820650243210609166/

三、有较强的数据分析、判断能力具体是什么表现在哪里啊?

数据分析的能力就是从数据中找出问题的起因,表现,以及趋势 判断能力那就是有自己的想法,可以给领导提供决策建议

四、4组符合正态分布的体重数据之间比较是否有差异用什么分析方法?

采用单因素方差分析即可

用spss的话 在spss---分析---均值比较里面的 oneway anova 分析

下一篇

购进免税农产品如何抵扣进项税

凭农产品收购发票上的金额,按10%计算抵扣进项税

农产品

2023-05-03

浙江正特新增“跨境电商”概念

10月25日消息,浙江正特股份有限公司(以下简称“浙江正特”)新增“跨境电商”概念。入选理由是,浙江正特公司于10月11日在互动易上回复,其产品主要销往欧美市场,销售渠道包括大型连锁超市、品牌商、电商平台等。凭借研发设计能力和产品品质优势,公司进入了沃尔玛、好市多等大型连锁超市的供应商体系。该公司自主品牌“Abba P...

跨境电商

2022-11-23