WEB/PHP

RSS 크롤링시 닫힘태그가 아닌 태그의 요소 파싱하기

Ezcode 2021. 8. 31. 11:26

특정 사이트의 RSS를 가져오려다가

 

<media:content type="image/jpg" url="링크주소"/>

 

위와 같이 태그 안의 내용이 아닌 단일 태그형태의 요소를 가져와야 하는 상황

 

php 코드

 

$url = "RSS 경로";

$xml = simplexml_load_file($url);

 

foreach($xml->channel->item as $item) {

     echo $item->title."\n";

     echo $item->children("media", true)->content->attributes()['type']."\n";

     echo $item->children("media", true)->content->attributes()['url']."\n";

}

 

children으로 태그를 찾고 그 안의 요소를 찾을수가 있다.

늘 그렇듯이 나중에 또 쓰게 될거 같아서 기록