大數據淺觀臺風氣候

上個月,1909號臺風‘利奇馬’給我國東部帶來較為嚴重的風雨影響。之後,‘白鹿’、‘楊柳’、‘劍魚’先後影響我國華南,選擇北漂的‘玲玲’則直奔東北而去。

臺風生成源地廣袤,在不同的海-氣背景條件下,每個臺風的路徑及強度變化各不相同,僅僅依靠個例分析難以勾勒出臺風群體的氣候特點。

好在我國臺風數據收集起步較早,數據完整,內容豐富。本篇小渣將通過分析帶大傢初步認識西太平洋臺風(下文簡稱西太臺風)的總體面貌。


一、數據介紹

數據說明

中國氣象局熱帶氣旋資料中心臺風最佳路徑數據集。包含1949以來年西北太平洋(含南海,赤道以北,東經180°以西)

海域熱帶氣旋每6小時的位置和強度。一年一個文件,逐年增加,(詳見http://tcdata.typhoon.org.cn,doi: 10.1175/JTECH-D-12-00119.1)

由於2017年後對登陸臺風施行加密觀測,為瞭數據處理方便偷懶,小渣所用數據的時間段為1949年至2016年。

數據處理

最佳路徑數據集以文本形式保存,由頭記錄和數據記錄組成,(格式如下,上文網頁中有具體說明)。

利用頭記錄標識符'66666',將其與數據記錄進行區分,分別存放在兩個DataFrame中,頭記錄共2291行,對應臺風個數;數據記錄則有66223行。(處理代碼如下)。

import pandas as pd
import numpy as np

year=range(1949,2017)
data1=[];data2=[]
for y in year:
print(y)
f=open('E:/Data/typhoon/CMABSTdata/CH'+str(y)+'BST.txt', 'r')
templine=f.readlines()
for i in range(len(templine)):
if templine[i].replace('n',' ').split()[0]=='66666':
tempdata=templine[i].replace('n',' ').split()
tempdata.insert(0,y)
data1.append(tempdata)
if templine[i].replace('n',' ').split()[0]!='66666':
tempdata2=templine[i].replace('n',' ').split()
tempdata2.insert(0,y)
tempdata2.insert(1,tempdata[4])
data2.append(tempdata2)
data1=pd.DataFrame(data1);data2=pd.DataFrame(data2)

赞(0)