这篇文章主要为大家详细介绍了php数据采集的简单示例,具有一定的参考价值,可以用来参考一下。
感兴趣的小伙伴,下面一起跟随四海网的小玲来看看吧!
这里介绍两个php采集能用到的好工具。一个是Snoopy,一个是simple_html_dom。采集还有很多方式(其实本质就2-3种,其他的都是衍生的),php自带了几个方法也能直接进行采集。但是,出于把懒惰进行到底的精神。我们还是可以通过这两个工具,让采集变得更简单。代码如下:
include "Snoopy.class.php";
$snoopy = new Snoopy;
$snoopy->proxy_host = "www.7767.cn";
$snoopy->proxy_port = "8080";
$snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)";
$snoopy->referer = "http://www.7767.cn/";
$snoopy->cookies["SessionID"] = 238472834723489l;
$snoopy->cookies["favoriteColor"] = "RED";
$snoopy->rawheaders["Pragma"] = "no-cache";
$snoopy->maxredirs = 2;
$snoopy->offsiteok = false;
$snoopy->expandlinks = false;
$snoopy->user = "joe";
$snoopy->pass = "bloe";
if($snoopy->fetchtext("http://www.7767.cn"))
{
echo "<PRE>".htmlspecialchars($snoopy->results)."</PRE>\n";
}
else
echo "error fetching document: ".$snoopy->error."\n";
array $e->getAllAttributes () |
array $e->attr |
string $e->getAttribute ( $name ) |
string $e->attribute |
void $e->setAttribute ( $name, $value ) |
void $value = $e->attribute |
bool $e->hasAttribute ( $name ) |
bool isset($e->attribute ) |
void $e->removeAttribute ( $name ) |
void $e->attribute = null |
element $e->getElementById ( $id ) |
mixed $e->find ( "#$id", 0 ) |
mixed $e->getElementsById ( $id [,$index] ) |
mixed $e->find ( "#$id" [, int $index] ) |
element $e->getElementByTagName ($name ) |
mixed $e->find ( $name, 0 ) |
mixed $e->getElementsByTagName ( $name [, $index] ) |
mixed $e->find ( $name [, int $index] ) |
element $e->parentNode () |
element $e->parent () |
mixed $e->childNodes ( [$index] ) |
mixed $e->children ( [int $index] ) |
element $e->firstChild () |
element $e->first_child () |
element $e->lastChild () |
element $e->last_child () |
element $e->nextSibling () |
element $e->next_sibling () |
element $e->previousSibling () |
element $e->prev_sibling () |
本文来自:http://www.q1010.com/173/15663-0.html
注:关于php数据采集的简单示例的内容就先介绍到这里,更多相关文章的可以留意四海网的其他信息。
关键词:
四海网收集整理一些常用的php代码,JS代码,数据库mysql等技术文章。