java爬虫忽略ssl证书

作者:青山常在人不老   阅读 (1498)  |  收藏 (0)  |  点赞 (0)

摘要

本文讲解使用java爬取网页内容时如何忽略SSL证书。


原文链接:java爬虫忽略ssl证书

很多网站使用了基于Https的SSL证书,导致Java爬取时得考虑SSL证书的问题,本文就如何忽略SSL证书做了代码的分析,需要的朋友们可以参考下。

废话不多说,直接上代码。

package com.againfly;
 
import java.security.cert.CertificateException;  
import java.security.cert.X509Certificate;  
   
import javax.net.ssl.HostnameVerifier;  
import javax.net.ssl.HttpsURLConnection;  
import javax.net.ssl.SSLContext;  
import javax.net.ssl.SSLSession;  
import javax.net.ssl.TrustManager;  
import javax.net.ssl.X509TrustManager;  
  
public class SslUtils {private static void trustAllHttpsCertificates() throws Exception {  
    TrustManager[] trustAllCerts = new TrustManager[1];  
    TrustManager tm = new miTM();  
    trustAllCerts[0] = tm;  
    SSLContext sc = SSLContext.getInstance("SSL");  
    sc.init(null, trustAllCerts, null);  
    HttpsURLConnection.setDefaultSSLSocketFactory(sc.getSocketFactory());  
}  
  
static class miTM implements TrustManager,X509TrustManager {  
    public X509Certificate[] getAcceptedIssuers() {  
        return null;  
    }  
  
    public boolean isServerTrusted(X509Certificate[] certs) {  
        return true;  
    }  
  
    public boolean isClientTrusted(X509Certificate[] certs) {  
        return true;  
    }  
  
    public void checkServerTrusted(X509Certificate[] certs, String authType)  
            throws CertificateException {  
        return;  
    }  
  
    public void checkClientTrusted(X509Certificate[] certs, String authType)  
            throws CertificateException {  
        return;  
    }  
}  
   
/** 
 * 忽略HTTPS请求的SSL证书,必须在openConnection之前调用 
 * @throws Exception 
 */  
public static void ignoreSsl() throws Exception{  
    HostnameVerifier hv = new HostnameVerifier() {  
        public boolean verify(String urlHostName, SSLSession session) {  
            System.out.println("Warning: URL Host: " + urlHostName + " vs. " + session.getPeerHost());  
            return true;  
        }  
    };  
    trustAllHttpsCertificates();  
    HttpsURLConnection.setDefaultHostnameVerifier(hv);  
}  
  
}
分类   默认分组
字数   1939

博客标签    Java   java 爬取网页   忽略ssl证书  

评论