中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

如何抓取域名完整WHOIS信息

2021-03-07    分類: 網(wǎng)站建設

域名注冊信息(whois),即域名所有人信息,登記著域名歸屬人信息。既然是信息,就有他的價值所在。域名注冊信息對很有些人來說非常重要,比如玩域名的米農們,還有一些公司的銷售們,他們通過獲取域名的注冊信息來聯(lián)系到域名的所有人,可以和他們洽談收購域名事宜?亦或者問問你注冊了域名要不要找我們做個網(wǎng)站?哈~反正由于騷擾量太大,所以現(xiàn)在很多人注冊域名都不留真實的聯(lián)系方式了。因為域名注冊信息這塊,注冊商是不做信息有效性審核的,隨便你填,只要格式正確就可以了。

但我不關心他的信息真實性,既然有人要這信息,我們就要想辦法爬??!網(wǎng)上有很多查詢whois信息的軟件,但都不太適合我們的軟件調用和數(shù)據(jù)分析。所以我們最好還是自己直接抓取比較方便。

首先我們要了解域名注冊信息的存儲方式,我個人的理解是,全求有各大域名whois根服務器(有點像DNS根服務器)例如com的whois根服務器就是:whois.verisign-grs.com 這個服務器上存儲這域名的基本信息,包括創(chuàng)建時間,注冊時間,到期時間等等,比如我們查詢下今日頭條的域名toutiao.com的域名信息,具體信息如下圖

每個后綴的域名的根whois服務器是固定的,但這里的信息太少,不是我們想要的。那哪里才能查到我們想要的具體信息呢,上圖中,大家注意到?jīng)],其中有條信息叫whois Server,指向了域名注冊商的whois服務器:whois.ename.com(易名中國),這個服務器存儲著域名更詳細的信息,其中就包括了我們想要的域名注冊人,聯(lián)系方式,郵箱等數(shù)據(jù)。

到這里,我們的任務完成了一半了!知道了信息的獲取途徑,下面我們就用程序的方法去獲取吧!

百度下whois協(xié)議,我們知道了whois協(xié)議通信是用的服務器43端口。這樣我們利用C#(亦或其他程序)中的SOCKET類去和服務器進行通信,協(xié)議方式就是連上43端口后,發(fā)送域名的ASCII編碼,以 (回車換行符)結束。成功的話服務器就會返回對應域名的信息,C#的通信代碼如下:

///

/// 查詢域名的 whois 信息

///

/// 要查詢的域名

/// whois 服務器地址

/// whois 服務器端口

///

/// 執(zhí)行成功: 返回詳細的whois信息

/// 執(zhí)行失敗:返回相就的異?;蚴清e誤信息

///

public static string Tcpwhois(string domain, string server, int port)

{

//domain = FunctionServices.getDomain(domain);

// 連接域名 whois 查詢服務器

TcpClient tcp = new TcpClient();

tcp.SendTimeout = 10;

//return string

string returnstr = "String Error";

try

{

tcp.Connect(server, port);

}

catch (SocketException)

{

returnstr = "查詢錯誤:連接 whois 服務器[" + server + "]失敗";

return returnstr;

}

// 向域名 whois 查詢服務器發(fā)送查詢的域名

try

{

//構造發(fā)送的字符串

domain += " ";

Byte[] DomainBytes = System.Text.Encoding.ASCII.GetBytes(domain.ToCharArray());

// 將域名發(fā)送到域名 whois 查詢服務器

Stream whoisStream = tcp.GetStream();

whoisStream.Write(DomainBytes, 0, domain.Length);

//返回流

StreamReader whoisStreamReader = new StreamReader(whoisStream, System.Text.Encoding.UTF8);

StringBuilder whoisInfo = new StringBuilder();

string whoisLine = null;

while (null != (whoisLine = whoisStreamReader.ReadLine()))

{

whoisInfo.Append(whoisLine + " ");

}

returnstr = whoisInfo.ToString();

}

catch (Exception)

{

returnstr = "查詢錯誤:網(wǎng)絡無響應,或者是您的域名輸入有誤";

}

finally

{

tcp.Close();

}

return returnstr;

}

我們就用toutiao.com舉例,通過這個代碼,我們可以先連接到com域名的根whois服務器:whois.verisign-grs.com 來獲取基本信息,然后對信息分析,提取想要的信息,如到期時間等。同時我們要提取關鍵的whois SERVER的信息,獲取到結果:whois.ename.com,同樣的方式,我們再連一次這個whois服務器,發(fā)送域名,得到域名具體的注冊信息。至此,我們就獲取到了一個完整的域名注冊信息了。

獲取域名注冊信息需要注意的以下幾點:

  1. 每個根服務器返回的信息格式有的時候并不一樣,這個就要靠我們人工新分析了。但同個服務器返回的信息格式是一樣的。所以針對不同的服務器返回,我們要區(qū)別對待。

  2. 域名未注冊時,查詢的信息返回是未找到,每個根服務器返回的也不一樣。有的是“does not exist”,有的是“Not found”,也有的是“No match for”,這個也挺讓人難受的。對于這樣的問題,我們只有針對不同的服務器,去做不同的判斷。主要做一些主流域名.com,.net,.cn的判斷基本就差不多了。

  3. 大多數(shù)域名服務器的請求頻率是有限制的。所以這里并不推薦多線程大批量獲取域名信息,為了穩(wěn)定,還是單線程設置個延時,慢慢的抓吧。

這里提供一下幾個主流域名的whois根服務器供大家測試,測試方式是用Telnet 軟件去連接whois服務器的43端口,連接上之后就可以輸入域名,然后回車,就可以得到域名注冊信息了。

域名后綴 whois服務器
.com whois.verisign-grs.net
.net whois.verisign-grs.net
.cn whois.cnnic.net.cn"
.org whois.pir.org
.top whois.nic.top
.cc whois.nic.cc
.gov whois.internic.net
也許大家會問我,為什么不去站長直接這類網(wǎng)站獲取WOHIS信息呢?他們不是提供WEB查詢接口查詢么?要知道,起始他們也是最終到whois服務器去抓取的信息,他們只是緩存下來給大家查而已。我不想過于依賴別人,所以我們還是直接去whois服務器爬去實時的域名注冊

信息吧。

當前文章:如何抓取域名完整WHOIS信息
轉載注明:http://www.rwnh.cn/news5/104705.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供響應式網(wǎng)站、網(wǎng)站營銷搜索引擎優(yōu)化、建站公司、定制網(wǎng)站用戶體驗

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運營
孝义市| 云南省| 玛曲县| 鄢陵县| 奉节县| 彭阳县| 土默特右旗| 启东市| 临江市| 紫阳县| 麻江县| 博兴县| 彰化市| 冕宁县| 麻江县| 慈溪市| 福州市| 台湾省| 苏州市| 乌兰县| 称多县| 南城县| 宜章县| 北京市| 舟曲县| 泽普县| 保德县| 南华县| 石棉县| 横峰县| 二连浩特市| 大庆市| 社旗县| 咸丰县| 深水埗区| 连南| 当雄县| 建瓯市| 文登市| 新田县| 清镇市|