一、高精準IP地址定位
IP地址定位技術,是通過設備的IP地址來確定其地理位置。近年來,IP地址定位技術受到越來越多的關註,隨著互聯網日新月異的發展,市場中的IP地址定位產品存在數據陳舊、定位顆粒度粗糙(僅能達到城市級別)等問題。即使近年來市場中出現瞭相比城市級別精度有所提升的IP地址定位產品,但仍無法充分滿足市場中用戶的需求。目前在互聯網行業基於位置的服務已經成為趨勢,基於地理位置的網絡應用層出不窮,IP地址定位已廣泛應用於網絡安全、在線廣告投放、在線安全支付、大數據分析、反欺詐風控、大數據征信等領域。高精準IP地址定位技術在互聯網領域中越來越重要。許多研究機構和學者已圍繞如何提升IP地址定位技術的定位精度、應用場景等不同問題進行瞭系統的研究。
1、基於數據挖掘的方式
- 基於DNS. Davis等人提出瞭一種基於DNS的方法。這種方法在資源記錄(Resource Record)中增加位置字段。然而,這種方式實施起來仍有一定難度。這是因為管理員對於修改或者更新資源記錄缺乏動力。此外,研究人員表明DNS的錯誤命名是具有普遍性的,這種錯誤有可能將互聯網的拓撲映射毀掉。
- 基於Whois. Moore等人指出,地理位置定位也可以通過挖掘Whois數據庫獲得。然而,正如作者自己指出的那樣,大型的機構可以把它們的機器分散在不同地點,但是卻把這些機器的地理位置註冊在公司的總部位置。舉一個例子,許多現有使用此方法的IP地址定位數據庫都把Google分佈在世界各地的服務器錯誤的定位到瞭Mountain View,加州,美國。
- 基於主機. 路由器的主機名有時可以暗示出機器的地理信息。Padmanabhan和 Subramanian的GeoTrack首先找到離被探測目標最近的路由器,然後從這個路由器的主機名上來判斷出該接入路由器的位置。最終,GeoTrack認為路由器的位置信息即是被探測目標的位置信息。然而,這種方法受到多種因素的影響。第一,並不是所有的機器名稱中都包含地理位置信息。其次,管理員可以非常有創意地來命名他們的機器,因此,從技術上來說,解析全部命名格式是十分困難的。再次,由於最後一跳路由器可能和目標主機相差很遠,因此用最後一跳路由器的位置來替代目標主機的位置可能帶來很大的錯誤。
- 基於Web. Guo等人的Structon,從Web網頁中挖掘地理位置信息。尤其是Structon建立瞭一個地理定位表,並在一個非常大的數據集的每個網頁頁面上使用正則表達式提取地理位置信息。由於Structon不把他們發掘的基準點與延遲測量向結合,它隻實現瞭較粗顆粒度的定位精度,如城市級別。他們從網頁上提取所有與地理位置有關的信息,而不僅僅是郵政地址信息,而且對於一個網站,他們考慮這個網站域名下的所有網頁所提供的地理位置信息。事實上,這種辦法很容易出錯。此外,把一個/24的IP段都考慮為同一個城市忽略瞭在這一個網段中IP地址的更細顆粒度的特點。由於Hosting即數據中心、網頁地址不正確、traceroute經過的路由未知等因素,會有很大一部分IP地址無法定位或者定位錯誤,該方法要達到一個較高的精準度是很困難的。
- 其他來源. Padmanabhan和Subramanian的GeoCluster使用在BGP路由表中IP地址的前綴把IP地址首先聚成集群。此外,通過一些私有的資源,GeoCluster找到集群中部分IP地址的地理位置信息。這些私有資源有很多種,其中一個例子是用戶在使用Hotmail服務時,登記自己的地理位置信息。最終,根據這些部分IP地址的地理位置信息,GeoCluster推導出整個群集的所有IP地址的地理位置信息。該方法的正確性高度取決於用戶的輸入。並且這些私有的位置信息一般情況下是不公開的。
2、基於延遲測量
- GeoPing. Padmanabhan和Subramanian設計瞭GeoPing。它假設,如果兩臺機器的延遲向量越是類似的話,那麼他們之間越有可能靠的近一些。GeoPing需要使用一組可以發送探測包的探測點。很明顯,這種辦法取決於可以發送探測包的探測點的數量,而通常這個數量是很少的。
- CBG. 之前的研究工作的輸出結果多是一些單一的離散的地理位置。Gueye等人提出瞭基於約束的地理定位方法(Constraint based Geolocation, CBG)。這種方法使用三角測量的方法,提供瞭一片連續的地理空間范圍。特別是,CBG測量從所有基準點到被探測目標點的延遲。然後,它把延遲轉化成從基準點到被探測目標點之間的地理距離。最後,它使用三角測量的方法得到一片連續的地理范圍。
值得一提的是,CBG使用最優值(bestline)的限制來彌補互聯網中路由的繞路和膨脹問題。然而,由於很難預測從一個探測點到目標節點路由是否繞路,通常情況下,隻有在被探測節點離探測點很近時,CBG才行之有效。雖然CBG可以很有效地限制目的地區,但由於它測量的不準確性,因此,從本質上來說,要想實現非常精細的地理位置定位是十分困難的。
- TBG. 根據靠近被探測目標的路由器更容易被精確地地理定位這一事實, Katz-Bassett等人提出瞭基於拓撲結構的地理定位系統(Topology based Geolocation, TBG)。這種方法地理定位目標和到目標的路徑中的路由器。TBG的關鍵貢獻在於,它證實瞭網絡的拓撲結構是可以被用來實現更高的地理定位精度。尤其是TBG首先定位到達被探測目標IP路徑上路由器的地理位置,然後用這些路由器作為基準點來進一步得到探測目標IP的地理位置。除瞭使用網絡的拓撲信息,一個TBG的變種也使用瞭一些被動的基準點。當然,這些基準點的位置都是已知的。然而,這樣的做法的效果是十分有限的,這是因為這種方法受到基準點個數的限制。
- Octant. Wong等人提出瞭Octant,它也首先定位瞭到達被探測節點路徑上的路由器的地理位置,然後以這些路由器作為基準點來進一步得到探測節點的地理位置。此外,Octant還考慮瞭一些正約束信息,如從被探測目標到基準點的最大距離,和一些負約束信息,如從被探測目標到基準點的最小距離。除瞭延遲的制約,Octant還在其系統中使用瞭一些其他的正約束和負約束限制。例如,從地理和人口統計數據中獲得的負約束(海洋和無法居住的地區)。為瞭達到更高的精準度,Octant(與TBG方法一樣)也首先定位瞭到達被探測節點路徑上的路由器的地理位置,然後用這些路由器作為基準點來進一步得到探測節點的地理位置。
IP地址定位這個領域,已經有瞭數十年的研究工作。盡管近年來取得瞭顯著改善,但在商業領域中的IP地址定位產品的定位精度及信息完整度仍無法滿足市場需求。之前最好的研究結果是Octant系統。該系統的中值誤差距離是35公裡。雖然這已經是一個很好的結果,但是正如我們看到的,Octant系統仍不足以滿足市場的要求。一個高度精確的、無需硬件支持的IP地址定位系統已經變得對互聯網越來越重要。
為瞭滿足市場需求,埃文科技的創始人王永提出瞭無需硬件支持的、街道級別的IP地理位置定位系統——《Towards Street-Level Client Independent IP Geolocation》(2011年在國際頂級互聯網會議NSDI上發表,王永是第一位以第一作者身份在NSDI上發表論文的中國大陸學者)。該系統首次提出利用數據挖掘和網絡測量相結合的方式,對IP地址進行定位;同時提出瞭一個三層的IP地址定位系統,並通過實驗說明該系統的定位精準度,比定位效果最好的“Octant”提高瞭50倍。
二、高精準IP地址定位互聯網的影響
雖然精確到城市級別或者區縣級別的IP地址定位產品能夠在某些領域滿足用戶需求。但一個更高精確度、更加可靠的IP地址定位產品已被確定為是互聯網產業發展的重要需求。
例如,互聯網在線廣告行業已經廣泛地使用IP地址定位服務,高精準IP地址定位服務能更大程度的提升有效性。根據研究分析,基於位置的營銷比無位置的營銷轉化率能夠提升30~300%,並提升30%~50%的溢價。同樣,高精準IP地址定位在網絡安全、在線廣告投放、在線安全支付、大數據分析、反欺詐風控、大數據征信等領域能提升產品性能和增加收益,為互聯網行業發展做出貢獻。它不僅能改善現有的應用程序的性能,同時將為基於位置服務提供新的支撐,也使以固定網絡接入互聯網的用戶享受更精準的位置服務成為可能。
埃文科技–全球高精準IP地址定位技術領航者
作為專業從事位置服務的大數據技術科研互聯網公司,自2012年成立至今,埃文科技持續推進IP地址定位領域的技術水準。公司專註於網絡設備與地理空間位置映射系統的產品研發,擁有12項軟件著作權及8項發明專利。
“全球IP地址定位的領航者,為用戶提供更加精準的IP地址定位服務”
瞭解更多請訪問:更精準的全球IP地址定位平臺_IP問問 -埃文科技(ipplus360.com)