내용 보기

작성자

관리자 (IP : 172.17.0.1)

날짜

2020-07-24 03:30

제목

[Node.js] cheerio 모듈에서 html() 반환 인코딩 처리


node.js 크롤링 모듈중 cheerio를 사용(npm install cheerio)해서 html()함수로 html태그 원문을 반환 받을 경우
&#xC5B4;&#xC81C;&#xBCF4;&#xB2E4; 1 &#xB0;&#xB0AE;&#xC544;&#xC694;<br>&#xBE44;
식으로 인코딩이 잘못 설정 되는 경우가 있다.
(* text()함수로 한글 또는 영문은 정상적으로 반환된다.)

위 현상시 cheerio load시 decodeEntities속성을 사용해서 해결 할 수 있다.

decodeEntities속성 false처리

let contents = cheerio.load(body, { decodeEntities: false });
cs


출처1

출처2