晨彦电脑科技 Belong to oneself's sky
RSS
Nov 26

VB网页采集方法 不指定

雪糕先生 2009/11/26 不指定 13:28
一个VB网页元素采集的实例,下面是代码:
引用
Private Sub Form_Load()
Dim tempstr As String, astr As String, website As String
website = Inet1.OpenURL("http://btoss.com") '下载此网页
astr = Trim(website) '定义astr内容为网页内容

'首先,我们要取这个网页的新闻标题.打开网页,查看源代码,我们可以发现<h3>至</h3>代码中间,就是我们所需要的新闻标题,而且在整个网页代码中,<h3>是唯一的,相当方便.所以我们开始下面的代码.

tempstr = "<title>" '定义取值范围开始
pos = InStr(astr, tempstr) ''取tempstr后面的内容
astr = Mid(astr, pos + 7) '取pos开始数至第7位的内容(<title>就是7个值,<h3>就是4个值)
tempstr = "</title>" '定义结束
pos = InStr(astr, tempstr) '重新获取
Text1.Text = Trim(Left(astr, pos - 1)) '好了,我们要得到的新闻标题出来了.

'现在开始要取简介了,不详细讲了,和上面一样的道理.

tempstr = "<ul><li>" '定义取值范围开始
pos = InStr(astr, tempstr) ''取tempstr后面的内容
astr = Mid(astr, pos + 8) '取pos开始数至第7位的内容(<title>就是7个值,<h3>就是4个值)
tempstr = "</li></ul>" '定义结束
pos = InStr(astr, tempstr) '重新获取
Text2.Text = Trim(Left(astr, pos - 1))

'现在开始要取内容了,不详细讲了,和上面一样的道理.

tempstr = "</TBODY></TABLE></CENTER>" '定义取值范围开始"
pos = InStr(astr, tempstr) ''取tempstr后面的内容
astr = Mid(astr, pos + 25) '取pos开始数至第7位的内容(<title>就是7个值,<h3>就是4个值)
tempstr = "<a" '定义结束
pos = InStr(astr, tempstr) '重新获取
Text3.Text = Trim(Left(astr, pos - 1))

End Sub
Actions
Tags:
 
VB VB.NET , 评论(0) , 引用(0) , 阅读(5902) , Via 本站原创
发表评论

昵称

网址

电邮

打开HTML 打开UBB 打开表情 隐藏 记住我 [登入] [注册]