用Replace Pioneer能做到,不用编程。
以下是经分析你的网页后得到的详细步骤:
1. 假设以上地址已经保存到一个文件addr1.txt里
2. 点击ctrl-h打开Replace窗口
* 在Search for pattern输入:
"(FRAME|IMG)\s*(http[^\n]*jpg)"(不带双引号)
* 在Replace with pattern输入:
"\2"(不带双引号)
* 去掉Print Unmatch Unit选项
* 在右下角把Output File左边的“>”号选择为“>> Append”
3. 点击Batch打开Batch Runner窗口
(1) 点击Import List打开准备好的addr1.txt
(2) http列表导入系统后,双击其中的第一行地址,"File Name Editor"窗口弹出,把Download As一行选为links,然后选中右边的Apply to All,然后点击OK。
(3) 选中Set output filename选项,把右边的${FILENAME}改为addr2.txt
(4) 选中Change output folder选项,把右边的目录改为C:\
4. 点击Batch Replace按钮,系统提示正在一条条处理,结果存在C:\addr2.txt
完成以上步骤后,生成一个C:\addr2.txt,包含所有带php?....jpg的地址列表。观察addr2.txt是否符合要求。
再重复以上2-4步,把addr2.txt转换成addr3.txt,即:
* 在第3(1)步不用addr1.txt,而是用addr2.txt作为源地址
* 在第3(3)步不用addr2.txt,而是用addr3.txt作为输出地址
完成后addr3.txt即为最后的地址。
注意
1. 以上每步都是必做的,否则得不到正确的结果。
2. 先用少量地址做实验,成功后再用大量地址做。
3. 每次试验后要把addr2.txt, addr3.txt删掉,否则下次的处理结果会加到一起。
几万行你还用鼠标点?
要死人的
估计只有用程序了
用inputstream得到网页内容
然后用htmlparser解析就OK了
不会编程的话,
这个有点抽象...
这个很简单,你用一个java里的URLConnection创建Io流,把网页的源代码下载下来,再用正则匹配 ";把里面的src给提取出来就可以了,几行代码就可以了
。。。。。。你真坏
PS:两种情况
1。如果是所谓的三级域名是文件的映射,那么可以发起一个http的头查询,服务器会返回真实文件的URL。
2.如果是动态的按名映射,那么恭喜你,人家的设计就是不想你直接知道图片的URL,放弃吧
可以结包看看http头就知道了
右键——属性——地址
选中你要的图片 单击鼠标右键——选择属性选项——上面有你要的地址——将它复制就ok