以下是一个简单的PHP搜索蜘蛛实例,它能够抓取网站页面并搜索其中的关键词。我们将使用PHP内置的函数和简单的HTML解析器。
实例步骤
| 步骤 | 说明 |
|---|---|
| 1 | 创建一个PHP文件,命名为`search_spider.php` |
| 2 | 编写代码来设置蜘蛛的起始URL和搜索关键词 |
| 3 | 使用`file_get_contents()`函数获取页面内容 |
| 4 | 使用简单的HTML解析器提取页面中的文本内容 |
| 5 | 使用`stristr()`函数搜索关键词 |
| 6 | 将搜索结果输出到页面上 |
代码示例
```php

// 设置蜘蛛的起始URL和搜索关键词
$base_url = 'http://example.com';
$search_keyword = 'PHP';
// 获取页面内容
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $base_url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$pages = curl_exec($ch);
curl_close($ch);
// 简单的HTML解析器
function extractText($html) {
$dom = new DOMDocument();
@$dom->loadHTML($html);
$content = '';
foreach ($dom->getElementsByTagName('p') as $p) {
$content .= $p->nodeValue . ' ';
}
return $content;
}
// 搜索关键词
function searchKeyword($content, $keyword) {
$position = strpos($content, $keyword);
if ($position !== false) {
return true;
}
return false;
}
// 输出搜索结果
function displayResults($pages, $keyword) {
$html_content = extractText($pages);
if (searchKeyword($html_content, $keyword)) {
echo "







