服务热线

xxxxxxxx

工作时间

7*9 小时

9:00-21:00

假期有值班

微信咨询

范例1:后端采集 - 从某网址提取静态图片

运行效果

 

完整代码

 

using System;
using System.Collections.Generic;
using System.Collections;
using System.Windows.Forms;
using System.Text.RegularExpressions;

//命名空间,一般不需要修改
namespace Ploverinfo.Download.Album
{
    //类名,取个跟其他类不重复且达意的,必须从csharpSite继承
    public class Sample01Site : csharpSite
    {

//构造函数
public Sample01Site ()
{
}

//创建类实例
public Sample01Site createInstance()
{
    return new Sample01Site ();
}

//在啄木鸟下载器中点开始按钮后会被调用
override public bool detach_tasks()
{
    //比如输入:https://www.qq.com/

    //三层分级
    // Site->Set->Item
    // 网站   集合  单项(图片、文件等)

    //创建集合实例
    Core.Set set = new Core.Set();
    
    //StartUrl对应啄木鸟下载器中起始地址
    set.Url = StartUrl;
    
    //直接将集合添加到需要下载的队列
    SelectedSets.Add(set);
 
     //true 继续下载,false 终止下载
    return true;
}

//detach_tasks为true的话,会逐个执行detach_items,参数为set
override public void detach_items(Core.Set set)
{
    //webRequest为后台网络请求类
    //getStringData为请求字符数据:set.Url为网址、cc为Cookie(本范例先跳过)、"utf-8"为字符集、1为如果请求失败的重试次数、conten为返回内容
    string content = webRequest.getStringData(set.Url, cc, "utf-8", 1);
    
    //CommonLib.App.Global.logs.AddDebug主要用于调试输出内容
    //在啄木鸟下载器主界面按Ctrl+Shift+U调出全局变量设置对话框,勾选开启调试模式、记录Debug信息,然后关掉软件重新打开,左侧最下方会出现运行日志,点击就切换到日志栏,可以查看输出
    //CommonLib.App.Global.logs.AddDebug(content);
    
    //提取并设置目录名
    set.Name = CommonLib.Util.RegexHelper.MatchOnceSingleLine(content, "(?<=<title>).*?(?=</title>)");
    //应用系统设置重新生成目录名(如ID、Index、时间等)
     set.GenerateName(set.Name);

    //1. 提取所有img标签中的图片
    //CommonLib.Util.RegexHelper.MatchStringSingleLine为从content提取符合"<img.*?>"正则表达式的所有内容
    List<string> img_blocks = CommonLib.Util.RegexHelper.MatchStringSingleLine(content, "<img.*?>");
    foreach (string img_block in img_blocks)
    {
        //CommonLib.App.Global.logs.AddDebug(img_block);
        
        //CommonLib.Util.RegexHelper.MatchOnceMultiLine为从img_block获取符合(?<=src=\").*?(?=\")的第一项内容
        string url = CommonLib.Util.RegexHelper.MatchOnceMultiLine(img_block, "(?<=src=\").*?(?=\")");
        
        int index = set.Photos.Count+1;
        string id = "";
        string name = index.ToString();
        
        //Core.Item为一个文件项
        //Core.Item.createPhoto根据id、index、url、name创建一个文件项
        Core.Item item = Core.Item.createPhoto(set, id, index, url, name);
        //将文件项加入到set中,软件会自动开始下载
        set.AddPhoto(item);
    }
}
             

}
}

2025/3/16
回复列表
内容回复
标题:
作者: