티스토리 뷰
//------------------------------------------------
// 추출
//------------------------------------------------
// a태그 관련 추출하기
preg_match_all("|<a[^>]+>(.*)</a>|U",$str,$out1, PREG_PATTERN_ORDER);
preg_match_all("|<a[^>]+>.*</a>|U",$str,$out2, PREG_PATTERN_ORDER);
preg_match_all("^<a.*<\/a>^U", $str, $out3);
// http로 시작하는 것 추출
preg_match_all("((http)://[a-z0-9-]+.[][a-zA-Z0-9:&#@=_~%;?/.+-]+)",$str,$out4, PREG_PATTERN_ORDER);
// 이미지 추출
preg_match_all("/<img[^>]*src=[\"']?([^>\"']+)[\"']?[^>]*>/i", $str, $out5);
//------------------------------------------------
// 처음 나온는 이미지 추출(jpg,gif,png)
//------------------------------------------------
$photo = getImg($str);
//print_r ($photo);
function getImg($content) {
$img = "";
preg_match("<img [^<>]*>", $content, $imgTag);
if($imgTag[0]){
if( stristr($imgTag[0], "http://") ) {
preg_match("/http:\/\/.*\.(jp[e]?g|gif|png)/Ui", $imgTag[0], $imgName);
$img = $imgName[0];
} else {
preg_match("/.*\.(jp[e]?g|gif|png)/Ui", $imgTag[0], $imgName);
$img = $imgName[0];
}
}
return $img;
}
//------------------------------------------------
// 특정 웹페이지를 읽어 그 페이지에 있는 이미지 추출
//------------------------------------------------
$startPage = "1"; // 시작 페이지
$endPage = "2"; // 마지막 페이지
for($i=$startPage; $endPage+1 > $i;$i++)
{
$data = ""; // 초기화
$datafile = "http://xxxx.com/photo.html?page=$i"; // 리스트 페이지
$fp = @fopen($datafile, "r");
while (!feof ($fp))
{
$data .= fgets($fp);
}
fclose($fp);
preg_match_all("/<img[^>]*src=[\"']?([^>\"']+)[\"']?[^>]*>/i",$data, $matches);
foreach($matches as $key => $value)
{
foreach($value as $key_2 => $value_2)
{
echo $value_2."<br />";
}
break;
}
}
'PHP Tip' 카테고리의 다른 글
웹에디터에 확장자 없는 이미지 복사해서 넣을 경우 새로고침시 이미지 깨지는 문제 (0) | 2012.08.29 |
---|---|
php파일 php백그라운드로 실행하기 (0) | 2011.08.01 |
웹에디터로 이미지 등록시 이미지 태그 추출하여 활용하기 (0) | 2011.03.08 |