curl ile sahibinden.com sitesine baglanıp oradan telefon numaralarını ve linkleri nasıl çekebileceginizi size anlatacağım. Kodları istediğiniz gibi değiştirebilirsiniz.
REKLAM ALANI
1. Adım) Bağlantı fonksiyonumuz
function baglan($url){
$curl=curl_init();
curl_setopt($curl,CURLOPT_URL,$url);
curl_setopt($curl,CURLOPT_HEADER,1);
curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);
$icerik=curl_exec($curl);
curl_close($curl);
return $icerik;
}
2. Adım) Siteye Bağlanıyoruz ve sayfa sayısını belirliyoruz.
$site=baglan("https://www.sahibinden.com/otomobil?pagingSize=50");preg_match_all('#Toplam (.*?) sayfa#Ssie',$site,$ilansayisi);
echo $ilansayisi=str_replace(".","",$ilansayisi[1][0]);
if($ilansayisi<1000)
{$sayfasayisi=ceil($ilansayisi/50);}
else
{$sayfasayisi=20;}
3. adım) Sayfa içerisinde detaylara girecek ve pregmatch ile dataları temizleyecek.
for($s=0 ; $s<$sayfasayisi;$s++){//sayfalari Dolasacak
echo "sayfa".$s."<br>";
preg_match_all('#<a class="classifiedTitle" href="(.*?)">(.*?)</a>#Ssie',$site,$liste);
$listesay=count($liste[1]);
for($i=0 ; $i<$listesay;$i++){//Sayfa Detaylarına Tektek bak
echo"https://www.sahibinden.com".$liste[1][$i];
$detay=baglan("https://www.sahibinden.com".$liste[1][$i]);
preg_match_all('#<span class="pretty-phone-part">(.*?)</span>#Ssie',$detay,$tlf);
$tlfsay=count($tlf[1]);echo "Telefon:".$tlf[1][0];echo "<br>";
}
}
Çok fazla sorgu kullanırsanız eğer proxy kullanmanız gerekecek proxy kullanımını bir önceki yazımda belirtmiştim.
Hiç yorum yok:
Yorum Gönder