数据科学资源
这些资源是我们社区推荐的。虽然我们还没有亲自审核所有内容, 我们希望您能找到对他们有用的指南,以帮助您在Dataquest学习过程中获得更多帮助。
数据科学博客
- 走向数据科学 —迈向数据科学是有关数据科学和机器学习(包括教程,新闻和职业提示)的书面内容的中级内容聚合器。
- 数据查询Blog —我们的数据科学博客提供了有关数据科学,数据分析和数据工程领域的有用技巧,教程和其他资源。
- Data.world博客 — Data.world是用户提供的数据集的绝佳来源,但是该站点上还有一个有用的博客,其中包含对行业人物,技巧和其他精彩内容的采访。
- 五十八 — FiveThirtyEight使用统计分析(硬数字)来讲述有关选举,政治,体育,科学,经济学和生活方式的引人入胜的故事。如果您想看一下真正引人注目的数据故事是什么样子,那么这是一个很好的资源。
- 价格经济学 — 价格经济学使用业务数据讲故事,这是任何专业数据科学家或数据分析师所需的技能。该博客提供了很多灵感。
- 信息很美 “信息就是美丽”是一个博客,致力于以图表和信息图表的形式发布设计精良的数据可视化。如果您想提高自己的数据可视化技能,那么他们的工作绝对值得研究。
- 博客作者 —来自Web的大量R内容的聚合器/合成器。
- R周刊 -每周精选的与R相关的重要内容
实践& Competitions
- 黑客等级 —练习您的编码技能,以准备技术面试。
- 黑客地球 —参与编程挑战,并提高您的编程技能。我们目前正在运行一个HackerEarth挑战,您可以注册 就在这儿.
- 卡格勒 —参加数据科学挑战,以磨练您的数据科学技能并不断提高它们。
数据科学入门课程
- Python for Data Science:基础知识 —了解Python编程和数据科学的基础知识。
- Python for Data Science:中级 —更深入地研究Python编程并提高您的数据技能。
- R编程简介 — 了解R的基础知识,R是用于数据分析和数据科学的流行编程语言。
- 中级R编程 —增强您在R中的数据分析技能。
- 吴安德的机器学习 -向Stanford Ng教授学习机器学习的基础知识。这是一门很棒的机器学习入门课程。
- FreeCodeCamp的数据可视化课程 — FreeCodeCamp是一个非盈利性学习网站,可教授Web开发技能,但它们也为数据专业人士提供了一门很棒的课程:该类使用JavaScript库D3进行数据可视化。
付费课程
- 用于数据分析和数据科学家的SQL — 本指导课程将使绝对的初学者了解SQL基础知识,并能够自信地编写查询
- SQL数据科学基础 —了解使用SQL数据库进行数据科学的基础知识。
- SQL数据科学中级 —学习使用多表数据库,并使用SQL回答业务问题。
- 深度学习基础 —学习深度神经网络的基础知识。包括图形表示,激活功能,多个隐藏层和图像分类。
- 数据科学课程 —浏览其余的交互式数据科学课程产品。
职业资源
- 数据科学职业指南 —导航数据科学工作的详尽指南,共分为七个部分,从如何开始搜索一直到如何协商高薪。
- 缪斯 —必须发布有关主题的职业建议文章,从设计简历和求职信到寻找适合您技能的最佳职位。
- 玻璃门 — 玻璃门使您可以查看过去和现在的员工如何查看公司,查询公司的薪水数据以及潜在的面试问题。
- 确实 —确实是一个庞大的工作委员会,但他们也拥有与职业相关的主题(如薪水)的可搜索数据资源。例如,这是一个查找地方的好地方,例如,数据科学家在您所在城市中的平均收入。
- G2人群 —对许多数据科学学习平台以及数据科学软件解决方案的人群评论。他们还有 学习中心 其中包含一些良好的职业建议。
数据科学聚会
- 数据科学聚会 —查找您附近的数据科学聚会,并开始联网。
- Python重点聚会 —与您附近的Python开发人员联系并交流想法。
数据科学活动
- 派康 — 派康每年在多个国家/地区举办几次Python会议。
- PyData — PyData是NumFOCUS的教育计划,NumFOCUS是一个非营利性慈善机构,致力于促进在科学技术中使用可访问和可复制的计算。
数据科学训练营
- 贝尔格雷夫谷(英国伦敦) — Belgrave Valley是为期2个月的数据分析训练营,旨在为您提供获得数据分析工作所需的技能和经验。
学习数据科学的书籍
- 最佳学习数据科学的免费书籍 —由我们撰写的博客文章,汇总了最好的免费书籍来学习数据科学。
- 深度学习 —本教科书旨在帮助机器学习从业人员熟悉深度学习。
- Python中的自然语言处理 —如果您对NLP感兴趣,强烈建议您阅读这本书。编写本书是为了给您提供NLTK库的概述。
- 统计简介 —本书旨在为您提供传统的大学统计学入门。
- 动手学习机器 —对机器学习感兴趣,并希望采用一种更“动手”的方法?如果您是机器学习的新手,或者只是想复习一下,这本书是很好的介绍。
- 思维统计 —这本书将引导您逐步了解在使用Python或R进行编程时如何考虑统计信息。
数据通讯
- 7最佳数据科学通讯 —如果您对数据科学感兴趣,我们肯定会建议您订阅七个新闻通讯。
- 数据文摘 —每个星期五,您都会收到一份发人深省的新闻通讯,其中包含热门搜索,数据资料以及data.world团队可以找到的其他内容。
- 五十八 -每周,您都会获得FiveThirthyEight本周的热门新闻。这是数据叙事灵感的重要来源。
数据分析工具
- 水蟒 — 水蟒是最受欢迎的数据科学平台,也是现代机器学习的基础。
- RStudio — RStudio是用于R编程语言的IDE。这是一个开源应用程序,用户可以在其中创建R Notebooks,以共享可视化效果,故事,想法和代码。
- Jupyter笔记本/实验室 — Jupyter Notebook / Lab是一个开源Web应用程序,允许用户共享可视化效果,故事,想法和代码。
- VSCode — VSCode是可自定义的通用IDE,可与您想到的任何语言一起使用。
- Windows Linux子系统 —适用于Linux的Windows子系统旨在在Windows上运行,因此您可以运行Linux发行版并可以访问UNIX终端。
- 吉特·巴什 — 吉特·巴什设计为在Windows上运行,因此您可以在Windows PC上使用Git命令。
有用的图书馆/文献
- 开发文档 — DevDocs在快速,有条理和可搜索的界面中结合了多个API文档。
- TensorFlow文档 — TensorFlow库的文档,TensorFlow库是可用的许多开源深度学习库之一。
- Keras文档 — Keras库的文档,Keras库是可用的许多开源深度学习库之一。
- 5个Genius Python深度学习库 — Elite Data Science的博客文章,概述了前五名深度学习库。如果您对深度学习感兴趣,我们强烈建议您检查一下。
- NLTK — NLTK库的文档,NLTK库是Python的开源自然语言处理(NLP)库之一。
- 空间 — 空间库的文档,这是另一个用于Python的开源NLP库。
- Scikit学习 — Scikit学习库的文档,该库是Python的开源机器学习库之一。
- 脾气暴躁的 — NumPy库的文档,该库是Python的许多开源数据分析库之一。
- 大熊猫 — 大熊猫库的文档,Pandas库是Python的另一个开源数据分析库。
- 科学 — 科学库的文档,SciPy库是另一个流行的Python数据分析库。
- 象征 — 象征库的文档,SymPy库是Python的数值计算库之一。
- 散景 — 散景库的文档,Bokeh库是Python的许多开源数据可视化库之一。
- Matplotlib — Matplotlib库的文档,这是另一个用于Python的开源数据可视化库。
- 密谋 — 密谋库的文档,这是另外一个Python开源数据可视化库。
- dplyr —一种快速,一致的工具,用于处理内存中和内存外的数据帧(如对象)。
- rr — R的完整而有用的功能工具包。
- 阅读器 — 提供一种快速友好的方式来读取矩形数据。
- ggplot2 —提供了一种在R中创建图形的方法。
- DBI —用于R和关系数据库管理系统之间通信的数据库接口。
- RSQLite的 —在R中嵌入SQLite数据库引擎。