加入收藏 | 设为首页 | 会员中心 | 我要投稿 银川站长网 (https://www.0951zz.com/)- 云通信、基础存储、云上网络、机器学习、视觉智能!
当前位置: 首页 > 站长学院 > Asp教程 > 正文

用asp+xmlhttp编辑web采集程序

发布时间:2023-06-07 12:47:25 所属栏目:Asp教程 来源:
导读:web采集程序?网页抓取程序?小倫程序?不管怎么叫,这种程序应用倒是蛮广的。本文不讨论这种使用这种程序引起的版权或道德问题,只谈这种程序在ASP+VBScript环境下的实现 :-)预备知识:除了一般的ASP+VBScript的知识

web采集程序?网页抓取程序?小倫程序?不管怎么叫,这种程序应用倒是蛮广的。本文不讨论这种使用这种程序引起的版权或道德问题,只谈这种程序在ASP+VBScript环境下的实现 :-)

预备知识:除了一般的ASP+VBScript的知识外,你还需要了解xmlhttp对象和正则表达式对象。xmlhttp对象是时下风头正劲的Ajax的主角;而学好了正则表达式,你再也不用为处理复杂的字符串犯愁。

在编写和调试正则表达式时,RegEx 这个小工具非常有用。 

抓取一个远程网页并保存到本地 

改进:处理乱码 

同时下载远程网页的图片(和其它文件) 

改进:探测真实URL 

改进:避免重复下载 

实战举例(以****为例) 

分析列表页 

内容页的技巧 

分析内容页中的上一页,下一页 

高级主题:UTF-8和GB2312的转换 

更多高级主题:登陆后抓取,客户端伪造 

己有的采集程序 

1.抓取一个远程网页并保存到本地

'用于调试的过程,后面会多次调用检查中间结果

Dim inDebug:inDebug=True 

Sub D(Str)

    If inDebug = False Then Exit Sub

    Response.Write("<div style='color:#003399; border: solid 1px #003399; background: #EEF7FF; margin: 1px; font-size: 12px; padding: 4px;'>")

    Response.Write(Str &"</div>")

    Response.Flush()

End Sub

'过程: Save2File

'功能: 把文本或字节流保存为文件

'参数: sContent    要保存的内容

'       sFile       保存到文件,形如"files/abc.htm"

'       bText       是否是文本

'       bOverWrite  是否覆盖己存在文件

Sub Save2File(sContent,sFile,bText,bOverWrite)

    Call D("Save2File:"+sFile+" *是否文本:"&bText)

    Dim SaveOption,TypeOption

    If (bOverWrite = True) Then SaveOption=2 Else SaveOption=1

    If (bText = True) Then TypeOption=2 Else TypeOption=1

    Set Ads = Server.CreateObject("Adodb.Stream")

    With Ads

        .Type = TypeOption 

        .Open

        If (bText = True) Then .WriteText sContent Else .Write sContent

(编辑:银川站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章