数据科学资源

这些资源是我们社区推荐的。虽然我们还没有亲自审核所有内容, 我们希望您能找到对他们有用的指南,以帮助您在Dataquest学习过程中获得更多帮助。

数据科学博客

  • 走向数据科学 —迈向数据科学是有关数据科学和机器学习(包括教程,新闻和职业提示)的书面内容的中级内容聚合器。
  • 数据查询Blog —我们的数据科学博客提供了有关数据科学,数据分析和数据工程领域的有用技巧,教程和其他资源。
  • Data.world博客 — Data.world是用户提供的数据集的绝佳来源,但是该站点上还有一个有用的博客,其中包含对行业人物,技巧和其他精彩内容的采访。
  • 五十八 — FiveThirtyEight使用统计分析(硬数字)来讲述有关选举,政治,体育,科学,经济学和生活方式的引人入胜的故事。如果您想看一下真正引人注目的数据故事是什么样子,那么这是一个很好的资源。
  • 价格经济学 — 价格经济学使用业务数据讲故事,这是任何专业数据科学家或数据分析师所需的技能。该博客提供了很多灵感。
  • 信息很美 “信息就是美丽”是一个博客,致力于以图表和信息图表的形式发布设计精良的数据可视化。如果您想提高自己的数据可视化技能,那么他们的工作绝对值得研究。
  • 博客作者 —来自Web的大量R内容的聚合器/合成器。
  • R周刊 -每周精选的与R相关的重要内容

实践& Competitions

  • 黑客等级 —练习您的编码技能,以准备技术面试。
  • 黑客地球 —参与编程挑战,并提高您的编程技能。我们目前正在运行一个HackerEarth挑战,您可以注册 就在这儿.
  • 卡格勒 —参加数据科学挑战,以磨练您的数据科学技能并不断提高它们。

数据科学入门课程

付费课程

职业资源

  • 数据科学职业指南 —导航数据科学工作的详尽指南,共分为七个部分,从如何开始搜索一直到如何协商高薪。
  • 缪斯 —必须发布有关主题的职业建议文章,从设计简历和求职信到寻找适合您技能的最佳职位。
  • 玻璃门 — 玻璃门使您可以查看过去和现在的员工如何查看公司,查询公司的薪水数据以及潜在的面试问题。
  • 确实 —确实是一个庞大的工作委员会,但他们也拥有与职业相关的主题(如薪水)的可搜索数据资源。例如,这是一个查找地方的好地方,例如,数据科学家在您所在城市中的平均收入。
  • G2人群 —对许多数据科学学习平台以及数据科学软件解决方案的人群评论。他们还有 学习中心 其中包含一些良好的职业建议。

数据科学聚会

数据科学活动

  • 派康 — 派康每年在多个国家/地区举办几次Python会议。
  • PyData — PyData是NumFOCUS的教育计划,NumFOCUS是一个非营利性慈善机构,致力于促进在科学技术中使用可访问和可复制的计算。

数据科学训练营

学习数据科学的书籍

  • 最佳学习数据科学的免费书籍 —由我们撰写的博客文章,汇总了最好的免费书籍来学习数据科学。
  • 深度学习 —本教科书旨在帮助机器学习从业人员熟悉深度学习。
  • Python中的自然语言处理 —如果您对NLP感兴趣,强烈建议您阅读这本书。编写本书是为了给您提供NLTK库的概述。
  • 统计简介 —本书旨在为您提供传统的大学统计学入门。
  • 动手学习机器 —对机器学习感兴趣,并希望采用一种更“动手”的方法?如果您是机器学习的新手,或者只是想复习一下,这本书是很好的介绍。
  • 思维统计 —这本书将引导您逐步了解在使用Python或R进行编程时如何考虑统计信息。

数据通讯

  • 7最佳数据科学通讯 —如果您对数据科学感兴趣,我们肯定会建议您订阅七个新闻通讯。
  • 数据文摘 —每个星期五,您都会收到一份发人深省的新闻通讯,其中包含热门搜索,数据资料以及data.world团队可以找到的其他内容。
  • 五十八 -每周,您都会获得FiveThirthyEight本周的热门新闻。这是数据叙事灵感的重要来源。

数据分析工具

  • 水蟒 — 水蟒是最受欢迎的数据科学平台,也是现代机器学习的基础。
  • RStudio — RStudio是用于R编程语言的IDE。这是一个开源应用程序,用户可以在其中创建R Notebooks,以共享可视化效果,故事,想法和代码。
  • Jupyter笔记本/实验室 — Jupyter Notebook / Lab是一个开源Web应用程序,允许用户共享可视化效果,故事,想法和代码。
  • VSCode — VSCode是可自定义的通用IDE,可与您想到的任何语言一起使用。
  • Windows Linux子系统 —适用于Linux的Windows子系统旨在在Windows上运行,因此您可以运行Linux发行版并可以访问UNIX终端。
  • 吉特·巴什 — 吉特·巴什设计为在Windows上运行,因此您可以在Windows PC上使用Git命令。

有用的图书馆/文献

  • 开发文档 — DevDocs在快速,有条理和可搜索的界面中结合了多个API文档。 
  • TensorFlow文档 — TensorFlow库的文档,TensorFlow库是可用的许多开源深度学习库之一。
  • Keras文档 — Keras库的文档,Keras库是可用的许多开源深度学习库之一。
  • 5个Genius Python深度学习库 — Elite Data Science的博客文章,概述了前五名深度学习库。如果您对深度学习感兴趣,我们强烈建议您检查一下。
  • NLTK — NLTK库的文档,NLTK库是Python的开源自然语言处理(NLP)库之一。
  • 空间 — 空间库的文档,这是另一个用于Python的开源NLP库。
  • Scikit学习 — Scikit学习库的文档,该库是Python的开源机器学习库之一。
  • 脾气暴躁的 — NumPy库的文档,该库是Python的许多开源数据分析库之一。
  • 大熊猫 — 大熊猫库的文档,Pandas库是Python的另一个开源数据分析库。
  • 科学 — 科学库的文档,SciPy库是另一个流行的Python数据分析库。
  • 象征 — 象征库的文档,SymPy库是Python的数值计算库之一。
  • 散景 — 散景库的文档,Bokeh库是Python的许多开源数据可视化库之一。
  • Matplotlib — Matplotlib库的文档,这是另一个用于Python的开源数据可视化库。
  • 密谋 — 密谋库的文档,这是另外一个Python开源数据可视化库。
  • dplyr —一种快速,一致的工具,用于处理内存中和内存外的数据帧(如对象)。 
  • rr — R的完整而有用的功能工具包。
  • 阅读器 —  提供一种快速友好的方式来读取矩形数据。
  • ggplot2 —提供了一种在R中创建图形的方法。
  • DBI —用于R和关系数据库管理系统之间通信的数据库接口。
  • RSQLite的 —在R中嵌入SQLite数据库引擎。

支持资源

  • 堆栈溢出 — Google的编程问题。专业和发烧友程序员的问答网站。它涵盖了计算机编程中的广泛主题。
  • 数据查询话语社区 —无论您是该领域的新手,还是想进军职业生涯,我们都可以帮助您与世界各地其他热情的学习者建立联系。
  • Quora — Quora是一个问答网站,Internet用户以意见的形式提出,回答和编辑问题。