首页 > 编程知识 正文

php定时抓取html的简单介绍

时间:2023-12-27 22:27:15 阅读:325756 作者:UMHW

本文目录一览:

PHP获取远程页面html

file_get_contents()比file()慢?

如果抓取别人的页面还是用file_get_contents()比较好~

file()取回的是数组

而file_get_contents()取回的是字符串

你是想取回个数组再把它们连起来方便?还是直接把他们取回来方便?

另外

file_get_contents(String,int)

有个可选参数设定读取的长度

在PHP手册中说:

file_get_contents() 函数是用来将文件的内容读入到一个字符串中的首选方法。如果操作系统支持还会使用内存映射技术来增强性能。

php怎么抓取 淘宝搜索页面的Html内容

发送http头信息试试,另外想要做蜘蛛程序的话,还是python比较好用,有丰富了web类库

php新手在线等答案:用php如何让提取html表单中输入的数据???

在form中,的属性method=get

或者post方法,

在php中获取表单数据如下:

$_get[表单名]

$_post[表单名]

这样就可以获取到html中表单里面的数据信息

php读取html

preg_match('/p align="center"bigstrong(.*?)/strong/big/p/',$str,$result);

$str就是上面的html里面的内容,$result就是匹配到的字符串,你可以print_r($result);看看里面就有你要的结果,或者直接echo $result[1];就是

“在LINUX下配置MYSQL、PHP和JSP”这几个字符了

请采纳。

php正则表达来获取html中的部分内容

1、几种函数的简单说明:

(1)preg_grep -- 返回与模式匹配的数组单元

preg_grep 返回一个input 数组中与给定的 pattern 模式相匹配的单元所组成的数组。

(2)preg_match -- 进行正则表达式匹配

说明:int preg_match ( string pattern, string subject [, array matches [, int flags]] )在 subject 字符串中搜索与 pattern 给出的正则表达式相匹配的内容。 返回值0或1。

(3)preg_replace -- 执行正则表达式的搜索和替换

(4)preg_split -- 用正则表达式分割字符串

2. 一般来说,如果用正则来获取匹配内容,一般使用 preg_match/ preg_match_all 函数。

补充回答:

正则表达式如下:

'%div class="wap2"span功能/span(.*?)/div%si'

以下是代码,经测试,运行正常:

?php

$str = 'div class="wap2"span功能/span这里面是要获取的内容,不能确定什么字符,可能是数字(123456…)字母(babaidn…),特殊浮等(o_O(^o^)/…)/div';

$pa = '%div class="wap2"span功能/span(.*?)/div%si';

preg_match($pa,$str,$r);

echo $r[1];

?

php定时抓html内容和保存读取

?php

@header ( 'Content-type: text/html;charset=UTF-8' );

$name = "AA";

$seconds = 60;

$url = "./";

$html = $url . $name . ".html";

$file = $name . ".dat";

set_time_limit ( 0 );

while ( file_exists ( $file ) ) {

$info = file_get_contents ( $html );

$info = iconv ( "UTF-8", "GBK", $info );

echo $info;

if (preg_match ( "/!--开始--((?:(?!!--结束--)[sS])*)!--结束--/", $info, $m )) {

$fh = fopen ( $file, "w" );

fwrite ( $fh, $m [1] );

fclose ( $fh );

}

sleep ( $seconds );

}

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。