登錄

虛擬變量

百科 > 虛擬變量

1.什么是虛擬變量[1]

虛擬變量又稱虛設變量、名義變量或啞變量,用以反映質的屬性的一個人工變量,是量化了的質變量,通常取值為0或1。引入啞變量可使線形回歸模型變得更復雜,但對問題描述更簡明,一個方程能達到倆個方程的作用,而且接近現(xiàn)實。

例如,反映文程度的虛擬變量可取為:1:本科學歷;0:非本科學歷

一般地,在虛擬變量的設置中:基礎類型、肯定類型取值為1;比較類型,否定類型取值為0。

2.模型中引入虛擬變量的作用[2]

1、分離異常因素的影響,例如分析我國GDP的時間序列,必須考慮“文革”因素對國民經濟的破壞性影響,剔除不可比的“文革”因素。

2、檢驗不同屬性類型對因變量的作用,例如工資模型中的文化程度、季節(jié)對銷售額的影響。

3、提高模型的精度,相當與將不同屬性的樣本合并,擴大了樣本容量(增加了誤差自由度,從而降低了誤差方差

3.虛擬變量設置的原則[2]

在模型中引入多個虛擬變量時,虛擬變量的個數(shù)應按下列原則確定:

如果有m種互斥的屬性類型,在模型中引入(m-1)個虛擬變量。

例如,性別有2個互斥的屬性,引用2-1=1個虛擬變量;再如,文化程度分小學、初中、高中、大學、研究生5類,引用4個虛擬變量。

評論  |   0條評論