來源計量經濟學服務中心綜合整理 爲避免僞迴歸,消除異方差,在不改變時間序列的性質及相關性的前提下,爲獲得平穩數據,通常會對時間序列取自然對數。對數據進行平穩性檢驗是研究中不可或缺的步驟,因爲時間序列分析法只適用於平穩的數據。 一、取對數情形? 第一,關於對數的問題,若是自己選取的變量數據,裏面有部分小於0,或者負數,需要重新考量下,看是否數據或者其他問題,此時肯定是沒法取對數; 第二,針對CD 等生產函數等類型的數據分析,由於建模需要,一般需要取對數,此類情況一般會在柯佈道格拉斯函數基礎上,引入新的變量,包括但不侷限於資本和勞動等變量; 第三,平時在一些數據處理中,經常會把原始數據取對數後進一步處理。之所以這樣做是基於對數函數在其定義域內是單調增函數,取對數後不會改變數據的相對關係 第四,取對數作用主要有:縮小數據的絕對數值,方便計算。例如,每個數據項的值都很大,許多這樣的值進行計算可能對超過常用數據類型的取值範圍,這時取對數,就把數值縮小了,例如TF-IDF計算時,由於在大規模語料庫中,很多詞的頻率是非常大的數字。取對數後,可以將乘法計算轉換稱加法計算。某些情況下,在數據的整個值域中的在不同區間的差異帶來的影響不同。也就是說,對數值小的部分差異的敏感程度比數值大的部分的差異敏感程度更高。這取對數之後不會改變數據的性質和相關關係,但壓縮了變量的尺度,數據更加平穩,也消弱了模型的共線性、異方差性等。例如在會計或者金融等變量的實證研究中,引入變量資產規模等變量,一般會取對數,因爲不同行業或者國有、民營等公司的資產規模差距很大,取對數,會縮小差距,使得實證研究更具有針對性。 二、五種情況 另外,山大大學陳強老師往年在計量經濟學及stata應用公衆號中彙總出如下五種情況: 第一,如果理論模型中的變量爲對數形式,則應取對數。比如,在勞動經濟學中研究教育投資回報率的決定因素,通常以工資對數爲被解釋變量,因爲這是從Mincer模型推導出來的。 第二,如果變量有指數增長趨勢(exponential growth),比如 GDP,則一般取對數,使得 lnGDP 變爲線性增長趨勢(linear growth)。 第三,如果取對數可改進迴歸模型的擬合優度(比如 R2 或顯著性),可考慮取對數。 第四,如果希望將回歸係數解釋爲彈性或半彈性(即百分比變化),可將變量取對數。 第五,如果無法確定是否該取對數,可對兩種情形都進行估計,作爲穩健性檢驗(robustnesscheck)。若二者的迴歸結果類似,則說明結果是穩健的。 在經濟學中,常取自然對數再做迴歸,這時迴歸方程爲 lnY=a lnX+b ,兩邊同對X求導,1/Y*(DY/DX)=a*1/X,b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 這正好是彈性的定義。 告訴你如何取對數quick generate series 輸入新變量,比如 r=log( ),r就是取完對數後的序列。 三、對數模型優點 對數線性模型的優點: 1、對數線性模型的係數度量了一個變量(Y)對另一個變量(X)的彈性 2、斜率係數與變量X、Y的測量單位無關,其結果與X、Y的測量單位也無關 3、取對數後會縮小變量的取值範圍,使得估計值對被解釋變量或解釋變量不會很敏感; 4、對於大於0的變量,其條件分佈通常具有異方差和偏態性,因爲取對數可以減弱這兩方面的問題 四、對數模型經驗法則 對數線性模型的經驗法則 1、使用對數時,變量不能取0或者負值;2,對於大於0的數值變量,通常均可以取對數,例如需求量、價格、工資;3、以年度量的單位,通常以原有形式出現,例如年齡、工資、教育年數等;4、以比例或者百分比度量的變量,通常也可以取對數。 五、宏觀經濟變量取對數情形 通常建立計量經濟模型,對宏觀經濟變量都是採用取對數的方式進行分析有4點好處。 第一,可以消除原宏觀經濟變量可能存在的遞増型異方差; 第二,若原經濟變量之間是指數函數關係,那麼,取對數後,可以把原指數關係轉化爲線性關係進行研究,模型變簡單了; 第三,對數變量下得到的迴歸係數的經濟含義是彈性係數。 第四,一旦對經濟變量需要取差分進行研究,那麼對數變量差分的實際含義是近似增長率。 六、來源 綜合整理自計量經濟學及stata應用、計量經濟學(張曉峒2017年著)等。 查看原文 >>
时间序列——取对数做差分的经济含义——弹性由于很多经济数据呈指数增长,对各数据取对数之后不会改变数据的性质和关系,可以把数据压扁,易缓解/消除异方差问题; 对取对数以后的数据进行线性回归,其前面的参数表示的就是百分比变化率(dlnx=dx/x),△Inx=△x/x ,即弹性, 变化率 具体查看知乎:
处理时间序列数据时,经常需要对数据进行预处理,然后在使用复杂模型处理数据。其中,常用的一种方法就是对数据取log,进行log变形。那么什么样的时间序列数据需要进行取log呢?查阅资料发现,如果数据满足如下两点,就比较适合take log。
以一个具体的例子来看: 原始数据: take log后的数据: take log之后,可以更清晰的排除增加量带来的影响,更清晰地看出数据变化的规律。
11-28 399 04-26 3915 11-28 219 09-26 1234 09-07 4003 08-06 584 10-02 525 01-13 2660 12-19 723 03-29 3万+ 08-21 1万+ 08-02 69 06-14 4001 12-08 1975 02-22 1万+ 07-30 3538 02-27 2037 01-12 3051 03-01 9854 “相关推荐”对你有帮助么?
©️2022 CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页 |