Web爬网课程:Python中的爬网和API

开始收集您自己的数据! 在此互动式网络抓取课程中,了解如何使用Python和Beautiful Soup抓取网络并从API下载数据。

为什么要学习网页抓取?

数据分析师或数据科学家并不总是将数据以CSV格式或通过易于访问的数据库传递给他们。有时候,你必须出去 得到 您需要的数据。

收集独特数据集的能力确实可以使您与众不同,并且能够访问API并在网上刮取新数据故事是获取其他人无法使用的数据的最佳方法。

注册免费帐户,开始与众不同 立即进入我们的API和Web爬网课程.


网络抓取课程python

这门课在我们的 Python中的数据分析师 and Python数据科学家 career paths.

它需要使用Python的一些先验经验。如果您想从头开始学习Python,请尝试我们的 Python课程.

通过编码学习!

立即开始。

创建帐户即表示您同意接受我们的 使用条款 and 隐私政策.

  • 涵盖了什么?

  • 有先决条件吗?

  • 这需要多长时间?

  • 为什么选择Dataquest?

此API和网络抓取课程有什么内容?

本课程从有关如何访问和使用API​​数据的几课开始。除其他外,您还将学习使用Python进行以下操作:

  • 创建和处理API请求
  • 使用Python和pandas处理JSON格式的数据
  • 分页处理
  • 处理更高级的请求,例如POST请求,PUT / PATCH请求,DELETE请求等 

您将通过与reddit API一起使用来进行一些现实世界的数据分析,从而将新的API技能应用于挑战。 

从那里开始,该课程开始使用Python和 美丽的汤要求 图书馆。除其他外,您将学习如何:

  • 请求并下载网站的HTML内容
  • 使用Beautiful Soup从页面中检索特定元素
  • 使用“查找全部”,ID和类来提取页面的特定部分
  • 使用CSS选择器,包括嵌套CSS选择器

虽然每个API和每个网页都有自己独特的怪癖,但是到本课程结束时,您将可以轻松地通过API或通过网络抓取来提取数据。

学习者对我们的Python课程怎么说?

97%

推荐Dataquest来改善职业

十分之八

说与Dataquest一起学习改善了他们的生活

2.5M+

数据查询学习者完成的总任务

有关我们的学习者对Dataquest的看法的更多信息,请查看我们的 学生成绩.

此API和网络抓取课程中的课程:

使用API

通过查找国际空间站的位置来学习使用简单的API。

中间API

了解如何使用涉及身份验证和POST请求的更复杂的API。

挑战:使用Reddit API

练习向需要身份验证的API发出请求。

网页抓取

了解如何从网页提取数据。

关于此网络抓取课程的常见问题:

这课程要多久?

在Dataquest上,您可以按自己的进度学习。您无需担心设定的课程表。

不同的学习者以不同的节奏工作,但是典型的学习者可能会在几周到一个月的时间内完成本课程,这取决于他们能够投入多少时间。


视频在哪里?

我们不提供视频教学。我们认为学习编程的最好方法是 实际写代码,不要看着别人写代码。

进一步了解 动手学习方法背后的科学.

我可以免费试用吗?

是的,你应该! 注册一个免费帐户 并立即在您的浏览器中开始!


此网络抓取课程对什么有用?

那里有大量数据,但是大多数数据在易于分析的CSV文件中不可用。

能够通过使用BeautifulSoup从网站上抓取数据或通过API下载数据来收集自己的数据,将为世界带来新的分析可能性。 

大多数数据位置将要求您能够使用API​​,而某些数据位置也可能需要抓取Web。这些技术对 得到 一项工作-使用Web抓取来获取唯一的数据集进行分析,确实可以使工作应用程序脱颖而出。


免费开始!

注册并开始使用!

创建帐户即表示您同意接受我们的 使用条款 and 隐私政策.