原文: How to Get Started in Data Analytics – A Roadmap for Beginners

感谢共同译者:John Cheng

欢迎来到数据分析的世界!如果您正在考虑从事于此,可算是找对地方了。数据分析作为一个迅猛发展、令人心潮澎湃的领域,在当今数据社会下愈发重要。

面对现实,我们已经被海量的数据淹没了。从社交媒体,到金融交易,再到医疗记录,不乏可供筛选的信息。

因此数据分析师们应运而生。他们帮助我们理解所有数据,并将其转化为有价值的见解。

这些见解可以是颠覆性的。它们能帮助企业改善产品和服务,帮助政府发布更明智的政策,帮助个人在私人生活和职场中做出更好的选择。

除了其影响力,数据分析也是一个十分赚钱的工作。最近研究表明,美国数据分析师的年薪中位数大约在$70,000,这个数字随着经验和技术实力增长可能会更高。

当然,与任何职业一样,数据分析也有其面临的挑战:偶尔令人头疼的数据集、长久的冒名顶替症威胁,以及关于最佳编程语言或数据可视化工具的无休止争论。嘿!但是如果您准备好迎接挑战,这可能是适合您的领域。

所以如果您正在努力成为一个数据分析师,这篇文章为您量身打造。希望它能帮助您节省时间和精力,而不必像我一样浪费时间学习无关紧要的东西。

图1

第一步:了解数据分析师的职责

您正在考虑从事数据分析师职业吗?太棒了!在继续之前,让我们先花点时间了解一下它。

您看,数据分析师的工作不仅仅是处理图片和生成图表(即使这些也很酷)。它还涉及通过数据来洞察和解决问题。这意味着提出正确的问题,组织并评估数据,以及向他人解释您的结论。

数据分析师通常拥有的核心技能、参与的核心活动包括:

  • 收集并分析庞大数据集,为业务决策提供信息的模式、趋势和洞察。
  • 使用统计工具和技术,从数据中得出洞察。
  • 开发并实现数据收集系统,以及其他能优化效率和数据质量的策略。
  • 与其他小组合作,确定业务需求并开发数据解决方案。
  • 以清晰且可操作的方式与利益相关者交流自己的发现和洞察.

所以如果您不是数学或计算机方面的天才,不要担心。统计、计算机科学和商学都只是数据分析跨学科主题中包含的一小部分。每个享受学习、解决问题并希望有所作为的人都能真正地享受其中。

那如何才能了解更多数据分析师的工作内容呢?您可以从众多线上免费资源入手。比如说,这篇文章讨论了数据分析师的实际工作这篇文章讨论了数据分析和数据科学

许多博客、播客以及YouTube频道都提供数据分析相关的娱乐和资讯内容。我将会在下方列出一些多年来对我有帮助的YouTube频道。

要了解所需技能和素质,您还可以与其他数据分析师联系、参加会议或研讨会,并研究职位描述。

别忘了考虑一下您是否享受处理数据。您喜欢寻找规律和解决难题吗?您想让世界变得更美好吗?如果答案是肯定的,数据分析可能是您理想的职业选择。

您的第一步是了解数据分析师的工作。尽情享受,慢慢来,同时不要犹豫提出疑问。

第二步:探索数据分析师的工作要求

现在您已经对数据分析师的职责有了更深理解,是时候开始了解雇主有什么需求了。毕竟,您想要确保您的技能和知识符合就业市场的需求。

但在您开始担心没有足够经验之前,请记住:每个公司都是不同的。有些可能更需要编程技能,另一些可能更看重沟通能力和商业头脑。因此,调研并找出您想要的行业或公司最需要哪些特定技能和条件十分重要。

所以如何才能找到此类信息呢?您可以从查看 LinkedIn、Indeed 和 Glassdoor 等求职网站上的职位列表及描述着手开始。

下面列出了一些职位要求示例:

  • 熟练掌握SQL并有大型数据集的工作经验
  • 熟悉Python,熟悉Tableau、Power BI等数据可视化工具
  • 拥有强大的分析能力并能从复杂数据中洞察信息
  • 拥有统计分析和建模技术的经验
  • 拥有卓越的沟通能力,以及向技术和非技术受众解释复杂发现的能力

但是不要止步于此!您还可以联系在此领域工作或拥有您感兴趣职位的人。咨询他们的经验,以及他们认为哪些技能对他们的工作取得成功最为重要。您甚至可以尝试与他们安排非正式面试以了解更多此领域的信息,并获取从何入门的建议。

说到入门,一定要记住没有什么可以替代实践经验。尽管花所有时间观看教程可能很吸引人,但通过实际创建并上手真实的数据分析项目,您将更快更有效地学习。

因此,花些时间去探索工作要求,但不要忘了持续培养自己的技能并获得实践经验。付出一点努力,同时维持好奇心,您就能成为一名成功的数据分析师。

第三步:适应数学和统计学

好吧,我知道您在想什么。数学和统计学?哎呀!

动图11-1

但在知难而退前,请听我讲两句。一名数据分析师为了能够理解数据并从中获得有价值的洞悉,对这些概念有基本了解是必要的。

那么您应该熟悉哪些基本统计概念和公式呢?

现在,首先,有一些集中趋势的测量方法,被称为平均值、中位数和众数,它们可以让您了解数据集的典型值。您应该知道如何计算它们。

标准差是数据与平均值的分布差距的测量方法,您应该能够计算它。

为了找到变量之间的关系,并基于其联系生成预测,您还应该熟悉相关性和回归的概念。

但这不仅仅是数字。您还需要初步了解线性代数,它在许多数据分析方法中都有应用。这里有一个深入的课程(以及教科书)带领您入门。

您可能需要使用矩阵以修改和操作数据,或者您可能需要使用线性回归以根据历史趋势预测未来数值。

如果您没有扎实的数学背景,这可能看起来很难。但别担心!有许多可用的资源能辅助您学习。

比如说,可汗学院(Khan Academy)提供数学和统计的课程和练习任务。如果您更喜欢书籍,Andrew Park 撰写的 “Data Science for Beginners” 是很棒的资源,它以易于理解的方式涵盖了统计和数学原理。

freeCodeCamp 也正在开发数学课程,您可以点击此处阅读

您还可以阅读《您需要了解的统计学指南》,以进入数据科学领域、从事机器学习等领域。

千里之行,始于足下。关键是要从小处着手并逐渐积累知识。在您需要时,不要害怕提问或寻求帮助。只需稍加练习并坚持,您很快就会发现数学和统计学实际上挺有趣的(真的!)。

动图

第四步:精通 Excel 数据分析

Excel 是数据分析师装备库中的重要工具。几乎每个组织都在使用它,而且掌握它可以帮助您轻松地清理、操作并分析数据。

使用 Excel,您可以创建公式和函数以进行计算、创建数据透视表和图表以可视化数据,以及使用数据分析工具预测并识别模式。Excel对于回归分析、预测和情景分析尤其有用。

如果您真的想成为一名数据分析师,那么掌握 Excel 是必要的。幸运的是,有大量可用的在线资源能帮助您学习。您可以在YouTube上观看教程 ExcelIsFunExcel ChandooTutorials PointAshutosh KumarMyOnlineTrainingHub。此外,以下课程将指导您如何充分利用 Excel。

  1. 使用 Excel 进行数据分析简介 Coursera
  2. Excel 用户使用 Python 数据分析 freeCodeCamp 的 YouTube 频道
  3. 商业专业的 Excel 技能 Coursera
  4. 使用 Excel 分析并可视化数据 EdX

请记住,Excel 只是数据分析工具包中的工具之一。但它是您作为数据分析师每天都使用的重要工具。通过掌握 Excel,您将完全有能力处理遇到的任何数据相关的任务。

现在让我们学习下一项技能,这也是您作为数据分析师需要掌握的最重要技能之一。

第五步:熟练使用 SQL 提取数据

SQL(结构化查询语言Structured Query Language)是一个在数据分析中重要的工具。作为一个数据分析师,您的主要责任包括从数据库中提取数据。SQL是帮助您实现该目的的编程语言。

SQL不仅限于执行像SELECT,FROM,和WHERE这样的基本查询。它是一个复杂的编程语言——您能用它以多种方式操纵和转化数据。SQL被用于从多个表格中合并数据,筛选提炼数据,和生成新的表格和视图。

为了成为一个高效的数据分析师,熟练掌握SQL非常重要。您需要能得心应手地查询数据,生成表格,并且理解如何使您的查询高效运行。

幸运的是,有很多帮助您学习SQL的资源。您能从以下平台开始您的学习:可汗学院 SQL、W3Schools、SQLZooSQLboltLuke BarousseAlex the AnalystMicrosoft Power Tools,最后,一些像 SQL island 和 SQL murder 这样的SQL游戏也能帮助您学习。

此外,还有很多现有的网课和书籍能够深入地覆盖SQL。以下是一些可以帮助您入门的例子:

  1. 学习SQL和数据库-初学者完整课程
  2. 来自freeCodeCamp的关系数据库课程
  3. 免费的数据库课程系列

通过熟练掌握SQL,您将能够从数据库中提取有价值的见解,并能操作数据以提供有意义的业务见解。

第六步:针对数据分析学习 Python

我了解有很多对于数据分析师是否需要学习 Python 的怀疑 —— 有人说要学,有人说不要。

对我而言,我更倾向于说这取决于您所在的公司 —— 但通过学习 Python 这种在数据分析中最广泛使用的编程语言以获得一技之长是不错的。Python 因它的简洁性、可读性和多功能性而出名。这使得它成为一个受数据分析师欢迎的选择。

Python 拥有着极为广泛的工具包和函数库。 这些工具使得数据分析变得容易,比如说用于操纵和分析数据的 Pandas,和用于可视化数据的 Matplotlib。Python 也有着自动化任务的能力,这使数据分析变得更加简洁高效。

为数据分析学习Python 是一个您在数据分析职业道路上的不错的投资。它不仅让您能使用强大的函数库工作,而且它还能为您提供不少机会,来分析更大的数据集和进行更复杂的分析。

从免费网课到付费的网络和纸质教程,有很多帮助您学习 Python 的资源。这些资源包括freeCodeCamp、DataCamp、CodeBasisProgramming with MoshMicrosoft Learn

通过学习 Python,您可以进行更复杂的数据分析,使任务自动化,和分析更多的数据库,使得您成为任何一个重视数据的公司所需要的人才。

第七步:精通一个数据可视化的工具

作为一个数据分析师,能用简洁清晰的方式来展现您的发现是至关重要的。您能用数据可视化来达到这点。像 PowerBI 和 Tableau 这样的数据可视化工具可以使得别人更容易理解您的发现。我们待会会进一步讨论它们。

您可以看看这个针对数据科学和数据可视化的 Tableau 教程

虽然 SQL 能够很好地查询和操作数据,它不能让这些数据获得生机。在这数据可视化工具就派上了用场。这些工具让您能将您的数据转化为一些有见地并且易于理解的形象。它们可以被分享给您的股东们。

您可以通过 freeCodeCamp 的 YouTube 频道来在这个深入且免费的课程中学习数据可视化基础

PowerBI 是一个对于数据可视化的极佳选择,因为它学习过程简单,并且能和其他微软产品相结合。对于使用 Microsoft Office 的企业而言,这点使 PowerBI 成为了一个理想的工具。Tableau 也是个流行的选择,它有着有凝聚力的用户社群和广泛的功能。

通过学习像 PowerBI 或 Tableau 这样的数据可视化工具,您能够创造些令人信服的可视化:它们能帮助您更好地理解自己的数据,更好地向大家分享自己的发现。有很多网课和教程能够帮到您学习这些工具,比如说官方的微软 PowerBI 训练Tableau's 自己的教学课程

通过熟练掌握一个数据可视化的工具,您能够创造可互动且吸引人的可视化。它们能够帮助您更好地理解您的数据和向大家交流您的数据。这也使得您成为任何一个重视数据的公司所需要的人才。

您也可以更深入地了解其他的热门数据可视化工具,比如说 D3.js —— 这是个能帮助您学习它的课程

第八步:和其他数据分析师和开发者建立联系

对于任何职业而言,建立人际网都是特别重要的,对于数据分析也不例外。通过和别的数据分析师和开发者建立联系,您能够从他们的经历中学习,得到关于最新行业趋势和技术的洞见,并且可能找到工作机会。

以下是和该领域从业者建立联系的几种方法:

  1. 参加行业活动:寻找会议、见面会和其他和数据分析相关的项目,然后参加它们。这个方法能很好地帮助您遇见该行业其他的从业者并了解更多最新发展和科技。
    2.加入网上的社群:有很多关于数据分析师和开发者的网络社群,比如说讨论平台、LinkedIn 小组,和社交媒体小组。可以加入这些社群并参与讨论,从而和该领域的其他人产生联系。
    3.与别人沟通:不要害怕和别的数据分析师和开发者沟通,不管是通过社交媒体,邮件,还是线下见面。向他们介绍自己,询问一些建议,然后建立关系。

记住,建立人际网是双向的。我们也要愿意帮忙和向别人提供建议。通过在数据分析领域里建立一个好的联系网络,您可以增加您的职场机会,并且了解当下的产业趋势和技术。

第九步:不要忘了软技能

在成为一个出色的数据分析师之前,我能想到的最后一个需要练习的技能是您的软技能。它包括您的交流和解决问题等能力。

分析师

当所有这些完成之后,练习再练习,然后建立项目。

结论

成为一个数据分析师,我们需要投入、努力、和对数据分析的热爱。通过在这份指南里列出的步骤,我们可以得到成为一个成功的数据分析师所需的技能和知识。

从理解数据分析师的工作,到熟练掌握SQL和Python,再到和其他的开发者建立联系,其中每一步对于在数据分析领域取得成功而言都至关重要。

要记得保持好奇心、从不停止学习,也要记得一直愿意去接受新的科技和方法。带着决心和坚持,您能成为一个熟练的数据分析师,并解锁更多令人激动的职业机会。