https://www.scrapingbee.com/blog/node-fetch/
이번에 JS 의 비동기를 이용해서 빠르게 크롤링을 해보고 싶어졌습니다.
파이썬으로 크롤링 하는건 수도 없이 보이는데 Node.js 에서 웹 크롤링을 하는 예제가 많이 보이지 않아서 관련 링크를 첨부합니다.
Node.js 에는 기본적으로 fetch() 가 없어서 동일하게 이용 가능한 node-fetch 패키지를 설치해야 하고, 이를 이용해서 HTML 응답값을 받아낼 수 있습니다.
이렇게 HTML 응답값을 문자열로 받아내고 cheerio로 그 text를 HTML로 해석해서 파싱이 가능합니다.
파이썬으로 따지면 requests 로 요청하고 (==fetch), bs4로 파싱하는 것(==cheerio)입니다.
'웹 > Node.js' 카테고리의 다른 글
[Node.js] 간편하게 URL 인코딩 & 디코딩 하기 (0) | 2022.10.11 |
---|---|
[Node.js] 시놀로지 Docker + Node.js 서버 [Error: ENOENT: no such file or directory, open '***'] 오류 해결 (2) | 2022.08.21 |
[Node.js] winston custom level 추가하기 (0) | 2022.08.06 |
[Node.js] 스팀 API 사용하기 (0) | 2020.10.19 |