10 Ağustos 2016 Çarşamba

CURL METODU İLE SAHIBINDEN VERI CEKME

curl ile sahibinden.com sitesine baglanıp oradan telefon numaralarını ve linkleri nasıl çekebileceginizi size anlatacağım. Kodları istediğiniz gibi değiştirebilirsiniz.
REKLAM ALANI
1. Adım) Bağlantı fonksiyonumuz
function baglan($url){
$curl=curl_init();
curl_setopt($curl,CURLOPT_URL,$url);
curl_setopt($curl,CURLOPT_HEADER,1);
curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
$icerik=curl_exec($curl);
curl_close($curl);
return $icerik;
}
2. Adım) Siteye Bağlanıyoruz ve sayfa sayısını belirliyoruz.

$site=baglan("https://www.sahibinden.com/otomobil?pagingSize=50");
preg_match_all('#Toplam (.*?) sayfa#Ssie',$site,$ilansayisi);
echo $ilansayisi=str_replace(".","",$ilansayisi[1][0]);
if($ilansayisi<1000)
{$sayfasayisi=ceil($ilansayisi/50);}
else
{$sayfasayisi=20;}
3. adım) Sayfa içerisinde detaylara girecek ve pregmatch ile dataları temizleyecek. 

for($s=0 ; $s<$sayfasayisi;$s++){//sayfalari Dolasacak
echo "sayfa".$s."<br>";
preg_match_all('#<a class="classifiedTitle" href="(.*?)">(.*?)</a>#Ssie',$site,$liste);
$listesay=count($liste[1]);
for($i=0 ; $i<$listesay;$i++){//Sayfa Detaylarına Tektek bak
echo"https://www.sahibinden.com".$liste[1][$i];
$detay=baglan("https://www.sahibinden.com".$liste[1][$i]);
preg_match_all('#<span class="pretty-phone-part">(.*?)</span>#Ssie',$detay,$tlf);
$tlfsay=count($tlf[1]);
echo "Telefon:".$tlf[1][0];
echo "<br>";
}

}
Çok fazla sorgu kullanırsanız eğer proxy kullanmanız gerekecek proxy kullanımını bir önceki yazımda belirtmiştim. 


Hiç yorum yok:

Yorum Gönder