Парсер Гугл Картинок по списку запросов
Пару дней назад мне потребовалось напарсить список урлов картинок по запросам. Я уже когда-то писал скрипт, но там было сохранения картинок на комп. Мне это не нужно было и думал что сейчас найду и кое что подредактирую. Но поскоку я скрипты пишу почти каждый день то у меня их дофига и найти в той куче я его не смог (а может я его вообще удалил). Думаю ладно пофиг щас найду какой-нить халявный. Нашел только платные проги. Ага прям розбежался за такую фигню платить=)) сел за минут 10 написал скрипт который парсит урлы, напарсил 4000 урлов (я не засекал, но довольно быстро напарсило) потом удалил на дубли (прогой KeyWordKeeper) и все=)
Настроек минимум. В начале скрипта выставить задержку между парсингом и глубину парсинга. Потом зайти через браузер и вставить в форму список запросов и ждать пока начнет появляться урлы в браузере. Вот и все=)
Вот скрипт
<form method=”POST”>
<center><textarea cols=40 rows=10 name=”zap”></textarea><br>
<input type=submit value=”НАчать РАботать!!!”></center>
</form>
<?php
set_time_limit(0);
$zapros = $_POST['zap'];
$sleep = 3;//Задержка между парсингом (сек)
$glub = 100;//Глубина парсинга (скоко картинок парсить по запросу)
if(!$zapros)exit;
$zapros = explode(”\r\n”, $zapros);
$count = count($zapros);
for($a=0; $a<$count; $a++)
{
for($b=0;$b<=$glub;)
{
$result = file_get_contents(’http://images.google.com/images?hl=ru&q=’.urlencode($zapros[$a]).’&sa=N&start=’.$b.’&ndsp=20′);
preg_match_all(”#imgurl(.*)x26#iU”,$result,$ssilki);
for($c=0;$c<count($ssilki[1]);$c++)
{
$ssilka = $ssilki[1][$c];
$ssilka = str_replace(”\\x3d”,”,$ssilka);
$ssilka = str_replace(”\\”,”,$ssilka);
echo $ssilka.’<br>’;
}
flush();
$b=$b+10;
sleep($sleep);
}
}
?>
В скрипте есть пару лишних строк, но я непонял почему регулярке на парсила, пришлось так выкрутиться. Но главное что скрипт работает=)



Прокомментировать
Понедельник, Февраль 15 11:30
А вот за этот скрипт отдельное спасибо, может ссылками обменяемся?
Понедельник, Февраль 15 19:28
можна=) если не забуду то завтра напишу тебе тебе=)
Воскресенье, Январь 23 22:09
А как сделать сам скрипт. Т.е. какие файлы создать?
Суббота, Октябрь 8 14:13
Большое спасибо!!!!!!!
Написать отзыв