본문으로 바로가기

파일의 IT 블로그

  1. Home
  2. 웹/Node.js
  3. [Node.js] node-fetch와 cheerio 이용해서 웹 크롤링 하기

[Node.js] node-fetch와 cheerio 이용해서 웹 크롤링 하기

· 댓글개 · KRFile

https://www.scrapingbee.com/blog/node-fetch/

 

Web Scraping with node-fetch

In this tutorial we will see how to use the node-fetch package for web scraping. We will learn what the fetch API is and the different ways to use the package.

www.scrapingbee.com

이번에 JS 의 비동기를 이용해서 빠르게 크롤링을 해보고 싶어졌습니다.

 

파이썬으로 크롤링 하는건 수도 없이 보이는데 Node.js 에서 웹 크롤링을 하는 예제가 많이 보이지 않아서 관련 링크를 첨부합니다.

Node.js 에는 기본적으로 fetch() 가 없어서 동일하게 이용 가능한 node-fetch 패키지를 설치해야 하고, 이를 이용해서 HTML 응답값을 받아낼 수 있습니다.

 

이렇게 HTML 응답값을 문자열로 받아내고 cheerio로 그 text를 HTML로 해석해서 파싱이 가능합니다.

파이썬으로 따지면 requests 로 요청하고 (==fetch), bs4로 파싱하는 것(==cheerio)입니다.

SNS 공유하기
💬 댓글 개
이모티콘창 닫기
울음
안녕
감사해요
당황
피폐

이모티콘을 클릭하면 댓글창에 입력됩니다.