使用HTMLAgility进行屏幕抓取,请提供帮助
技术问答
275 人阅读
|
0 人回复
|
2023-09-12
|
昨晚,当我问屏幕捕获问题时,我得到了一个优秀的文章链接,让我明白了这一点。我有几个问题。我将在下面发布我的代码html来源。我试图在数据表之间获取数据,然后将数据发送到sql表格。我发现成功的捕获描述。Widget3.5 ect …最后由乔修改,但因为1st 2 / tr还包含img src = / ......“ alt =”
) [* B% p- R' G* ~00721408,所以我不会抓取数字。我被困在如何更改代码以捕获表中的所有数据中;第二,下一步需要做什么,以便准备发送数据sql表。我的代码如下:% g- m" G8 M6 k+ J1 C; H2 Y
using System; using System.Collections.Generic; using System.Linq; using System.Text; using HtmlAgilityPack; using System.Windows.Forms; namespace ConsoleApplication class Program static void Main(string[] args) // Load the html document var webGet = new HtmlWeb(); var doc = webGet.Load("http://localhost"); Get all tables in the document HtmlNodeCollection tables = doc.DocumentNode.SelectNodes("//table"); Iterate all rows in the first table HtmlNodeCollection rows = tables[0].SelectNodes(".//tr"); for (int i = 0; i </strong>
x6 j( W; V5 v- P- t& y9 O6 j 解决方案: |
|
|
|
|
|