1 问题的提出
自1990年代以后,随着
表1 中国fdi分布的基本特征
tab.1 the basic characteristics of fdi distribution in china 年份 fdi(us)百万 区域分布/% 广州、福建及其他省所占比例%
东部 中部 西部 广东 福建 其他省份
1986-1991平均 3 104.5 91 5 4 43 8 49
1992 11 007 91 7 2 34 13 53
1993 27 515 87 9 4 28 11 62
1994 33 767 88 8 4 28 11 60
1995 37 521 88 9 3 28 11 62
1996 41 726 88 10 2 28 10 62
1997 45 257 87 11 3 27 9 64
1998 45 463 88 10 2 30 10 61
1999 40 319 88 9 3 29 10 61
2000 40 715 88 9 2 28 9 63
2001 46 878 88 9 3 26 8 66
2002 52 471 87 10 3 22 7 71
注:资料来源于各年中国统计年鉴及相关计算。
依据空间相互作用理论,运用空间计量经济学(spatial econometrics)模型进行研究。首先综合国内外相关研究成果,选择了经济总量、劳动成本、基础设施、市场化程度、信息成本、累积的fdi、开放程度七项区位因素指标,对影响fdi区域分布的主要因素进行了经验分析,证明了空间依存性的存在并估计了地理溢出程度(空间自相关系数);然后确定影响fdi区域分布的关键因素;最后依据模型结论,为中国特别是中、西部地区引进更多的fdi提供了政策建议。
本项研究在借鉴现有研究成果的基础上,与现有的同类研究相比有两大显著特点:①使用了最新的fdi数据,特别是中国加入wto以后的数据;②在标准回归的基础上,运用了空间计量模型,融入区域间的相互影响,对fdi的地理溢出程度进行了估计。
2 文献综述
2.1 fdi区域分布理论文献综述
在解释fdi区域分布理论中,最早研究角度主要从企业或跨国公司出发,hymer(1960)认为跨国公司是一个寡头行为,fdi被认为是公司在全球竞争下所作的一种追求利润最大化的投资决定;dunning(1977)的国际生产折中理论详细解释了所有权、国际化和区位优势对跨国公司行为的影响,用交易费用来解释企业的内部化,强调fdi的目的是资产的获得;brainard(1997)则认为跨国公司fdi是其为获得规模经济所采取的接近客户或集中生产的一种交替选择,fdi与贸易出口之间存在着交替的关系;传统企业选址理论用交通成本、工资和基础设施解释fdi的地理分布;现代工业选址理论则强调盈利的外部性或与需求和供应链相联系的聚集程度(krugman,1991);新经济增长理论也强调工业内或企业之间的知识溢出形成的聚集效应(romer,1986;sala-i-martin,1990);一个新的理论信息成本方法认为跨国公司的管理和分支公司的设置是经济代理人针对信息成本存在理性反应的结果(casson,1994)。
2.2 fdi区域分布实证文献综述
在对美国的fdi地点选择研究中,coughlin(1991)从公司利润最大化的角度认为区域面积、人均收入、产业聚集、劳动市场条件(工资率和失业情况等)、交通网络、税收、政府吸引fdi的消费等都是各州吸引fdi的决定因素;friedman(1996)发现市场潜力、工资、技术劳动力(人均科学家和工程师的比例)、工程费用、主要港口、吸引fdi的补贴等对外国跨国公司在美国的选址有重要影响;mody和srinivasan(1998)进一步证明吸引美国和日本跨国公司相似的区域条件是低工资、低风险、完善的基础设施和丰富的技术人才。
对中国的fdi地点选择研究中,wei等(1999)研究表明国内贸易额、工资率、gdp增长率、r&d人员、基础设施、聚集程度、信息成本和投资刺激等因素对吸引fdi具有显著影响;qian sun等(2002)实证研究表明区域内市场规模、聚集程度、基础设施、工业化水平、累积fdi、劳动力质量、劳动成本、科研水平、开放程度、政策风险和fdi替代物(外国证券投资)等因素在不同阶段对fdi的区域选择作用有所差别;孙俊(2002)从另外一个角度考察了fdi地点选择的因素,认为除了基础设施、劳动力质量、工资、开放程度和市场化程度等变量外,一个地区的产业结构对该地区吸引fdi水平有着重大作用。
这些经验研究的共同点是使用标准回归模型对平行数据(panel data)进行分析,但这些分析没有结合空间数据的典型特征,参数估计是有偏的,推论的有效性值得怀疑。空间数据观察值的位置是一个极其重要的变量,因为相邻区域可能相互影响, 许多因素都可以导致所谓的空间依存性。对于fdi,聚集效应通过地理溢出区域边界可以导致相邻区域的fdi水平提高,另一方面空间依存性使区域内资源成本上升,相邻区域变得更具有吸引力。本文设置空间计量模型对中国fdi区域分布进行分析,并对空间依存性进行检验和估计。
3 中国fdi区域分布的区位条件分析
影响外商在一个地区投资的区位因素很多,集中到一点上是投资项目的成本和收益。一个地区完善的基础设施、便捷的出口通道、高度聚集发达的产业群、便宜的要素投入、丰富低廉成本的劳动力资源、潜在的巨大规模市场和相对低的信息成本等因素都会对吸引fdi产生直接的影响。另外,各地区对吸引fdi有无税收等优惠政策、正常的市场活动是否会受到来自政府的干预、有无来自政府支持国有企业的不平等竞争、有无稳定连续的政策环境、需不需要额外的寻租成本等宏观投资环境也会左右外商的投资决策。综上所述,考虑到数据资料的可得性,选择了经济总量、劳动成本、基础设施、市场化程度、信息成本、累积的fdi、开放程度七个区位因素变量。
3.1 经济总量(gdp)
gdp从总体上反映一个国家或地区的经济发展水平,也反映了一个地区潜在的市场需求。市场需求越大,该地区对fdi越有吸引力。然而,市场越大,竞争者越多,竞争也越激烈,有些投资者也会投资到市场相对较小,竞争力较弱的地区,此时,市场的大小与fdi成反向关系。gdp对fdi具体作用及方向有待模型检验。我们用各省市或自治区2001年的gdp作为经济总量或市场需求的代理变量。
3.2 劳动成本(waip)
劳动成本一般用工资来度量。大多数人认为工资与fdi呈反向关系,但由于国有企业的职工工资不包括住房补贴和医疗保险等隐形收入,这使得工资指标的解释力大打折扣。另一方面,随着近几年经济快速发展,中国吸引fdi并不主要是靠低廉的劳动成本(branstetter & feenstra,1999)。在中国的跨国公司倾向于付给其工人一定的工资外津贴,因为他们想雇佣高质量的工人。高工资也许反映较高的劳动质量。因此,在有些省份高工资会吸引较多的fdi。在这里我们用2001年劳动生产率调整工资率(人均工资除以人均劳动生产率,即效益工资率)来反映劳动成本。理论上,该项指标越低,吸引的fdi越多。
3.3 基础设施(infr)
一个地区基础设施的完善程度是外商投资者首先要考虑的重要因素。然而,基础设施包含的范围极其广泛,从公路到铁路、航空再到通讯系统,甚至包括中介组织。因此,对基础设施的度量非常困难。我们用各地区2001年公路密度(公路里程除以各地面积)作为基础设施的代理变量。
3.4 市场化程度(mak)
各地区市场化水平对吸引fdi具有重要意义。经济活动是否规范、是否有法律法规体系保障、是否有地方保护、是否有红顶商人和腐败、寻租现象等因素都直接或间接影响到外资流入的信息成本和投资风险。市场化程度是一个高度综合的指标,涉及到产权制度、竞争性价格制度、市场环境、政府行为和经济主体行为的独立性等多方面因素,要完整地度量一个地区的市场化程度相当困难,我们借用樊纲、王小鲁(2001)所测度的各地区1999与2000年市场化指数平均值作为市场化指标的代理变量。
3.5 信息成本(ic)
与国内投资者相比,外国投资者饱受信息不对称之苦,外国投资者在某个地区投资是针对信息成本存在理性反应的结果(casson,1994)。信息成本的度量包括与区域中心的距离、首个fdi投资年限、世界前500强的表现和相邻效应(地理上相邻或文化相近)等。对于我国来说,沿海地区就是低信息成本区域,原因在于:①这些地区是传统的工商业中心;②这些地区最先对外开放,也是吸引fdi的重点区域,享有广泛的优惠政策;③世界前500强在这一区域的投资远远超过了内地;④这些沿海地区和香港、澳门、台湾等地区除了地理上相邻外,在血缘关系和文化上有千丝万缕的联系。对于信息成本我们设置了虚拟变量(或称沿海地区哑变量),沿海12个地区为1,其他地区为0。
3.6 累积的fdi(cfdi)
累积的fdi对于其他fdi具有“羊群效应(herding effect)”。在这里我们用各地区累积的fdi除以其累积的国内投资作为代理变量。在回归分析中,如果这个变量呈现负相关关系,则表示累积fdi对于吸引新的fdi具有挤出效应,也就是说广大中、西部地区通过改善投资环境能吸引更多的fdi;如果这个变量呈现正相关关系,则表明累积fdi对于吸引新的fdi具有吸引功能,集聚效应大于其扩散效应。这个变量采用的是1986年到2001年各地区累积的fdi的数据。
3.7 开放程度(open)
开放程度从本质上降低了信息成本,促进fdi的涌入。同时开放程度也决定了一个地区当地居民和政府对外资的接受程度、有无通畅的外销渠道、管理水平能否与国际接轨、有无大量的一流人才等。开放程度综合概括了这些因素,因此开放程度提高伴随着对外资吸引力的增加。我们用2001年各地区的外贸依存度来衡量开放程度指标。
4 空间计量经济模型及其估计
4.1 中国fdi区域分布区位条件及地理溢出的空间计量模型
4.1.1 空间计量经济学理论模型。
不同学者得出的结论由于研究方法不同而各异,但有关fdi区域分布的研究中,区域总是被当成一个独立的个体进行分析,区域间潜在的相互影响往往被忽略。毫无疑问,任何一个地区的经济都不可能独立存在,它总是与其它经济体存在着千丝万缕的联系。当外生冲击对一个地区的经济造成影响时,往往也会波及到邻近地区或者更远。空间依存性是区域经济研究的重点内容,空间依存性可以表述为tobler(1979)地理第一定理:“地理物体是互相关联的,空间接近的地物间关联程度高”。依据空间计量经济学,空间依存性可以设置成两种形式基本的模型结构,即空间自回归模型(spatial autoregressive model,即sar)和空间误差构成(spatial error components model,即sea)模型两类。
空间自回归模型(sar):
y=ρwy+xβ+ε (1)
式中:y是n×1列的决策变量观察值向量;w是n×n的空间权数矩阵,n个机构或地区之间相互关系网络结构的一个矩阵,w[,y]为空间一阶滞后因变量;ρ是空间自回归参数,其取值在-1到1之间,表明相邻区域之间的影响程度;x是k个外生变量观察值的n×k阶矩阵;β是k×1阶回归系数向量;ε是随机误差序列向量。
另一种是空间误差模型,机构或地区间的相互关系通过误差项来体现。当机构或地区之间的相互作用因所处的相对位置不同而存在差异时,则采用这种模型。空间误差构成(sea)基本模型为:
y=xβ+ε (2)其中,
ε=λwψ+ξ (3)
式中:ψ是n×1列溢出成分误差,ξ是n×1列的区域内随机扰动项;假定ψ和ξ是服从独立同分布(i.i.d)且互不相关;λ是空间自相关系数,λ的取值在-1、1之间,表明一个区域变量变化对相邻区域的溢出程度;其他字母如(1)式所设。可见,(2)和(3)两式构成的sea模型其本质就是在线形模型的误差结构中融入了一个区域间溢出成分。
4.1.2 理论模型估计及检验
空间依存性模型的估计比时间序列要复杂得多。空间自回归模型由于自变量的内生性,ols估计是有偏的(biased)和不一致(inconsistent)的。需要通过工具变量法、极大似然法或广义最小二乘估计等其他方法来进行估计。判断地区间的空间相关存在与否,一般通过包括moran’s i检验、最大似然lm-error检验及最大似然lm-lag检验等一系列空间效应检验来进行(anselin 1988)。鉴于空间经济计量估计中一系列问题有待进一步解决,目前一般空间计量模型都局限于一阶滞后、一阶自回归模型。本研究也仅限于讨论一阶模型。
4.1.3 中国fdi区域分布区位条件及地理溢出的空间计量模型
本项研究设置的空间计量模型包括空间自回归模型(sar)和空间误差构成(sea),然后对此进行检验,甄别出最适合中国fdi区域分布的模型形式。对于空间计量模型,空间权数矩阵w是一个至关重要的范畴。权数确定的标准一般依据“距离”而定,最常用的是“空间距离”和“经济距离”?(anselin 1988)。本研究依据地理相邻设定权数,该空间权数矩阵w是一个n×n稀疏的0-1矩阵,相邻区域的元素为1,其他为0,对角线元素也为0。这是一个29×29稀疏的0-1矩阵。对于sar模型(1)或sea模型(2)、(3),为了避免内生性对模型解释力的影响,所有的自变量滞后一期,如sar模型:
y[,t]=ρwy[,t]+x[,t-1]β+ε (4)
式中:y[,t]是中国2002年29个省、直辖市或自治区(海南省、西藏和重庆除外)实际吸引的fdi值取对数(即lnfdi[,t],单位:美元),w是地理相邻权数矩阵。自变量矩阵为2001年的影响因素的值取对数:
x[,t-1]=( lngdp[,t-1],lnwaip[,t-1],lninfr[,t-1],lnmak[,t-1],lncfdi[,t-1],lnopen[,t-1],ic) (5)
其他字母如(1)式所述。sea模型(2)、(3)的设置与上类似。
4.2 实证分析
模型使用的数据来自1980—2003年的中国统计年鉴和新中国五十年统计资料汇编。作者运用guass light 6.0软件(林光平,2003),依据极大似然估计原理,编写了相应的空间计量模型计算估计程序(表2)。
表2 相关回归结果
tab.2 the result of the regression 变量 模型1 模型2
回归系数(概率) 回归系数(概率)
ols sea ols sea
c -5.819405(0.0017) -6.023757(0.0008) -6.288888(0.0002) -6.422313(0.0000)
lngdp[,t-1] 0.726925(0.0025) 0.746824(0.0011) 0.714412(0.0011) 0.742548(0.0005)
lnwaip[,t-1] -0.734435(0.1042) -0.695832(0.0845) -0.747168(0.0947) -0.784224(0.0421)
lninfr[,t-1] 0.089272(0.8093) 0.122654(0.562493)
lnmak[,t-1] 2.49843(0.0177) 2.658563(0.0076) 2.682820(0.0028) 2.744256(0.0012)
lncfdi[,t-1] 0.339636(0.0195) 0.376985(0.0146) 0.334120(0.0117) 0.352256(0.0054)
lnopen[,t-1] 0.225370(0.1482) 0.2364322(0.0951) 0.243067(0.0970) 0.223285(0.0623)
ic 0.135986(0.7657) 0.1436552(0.4265)
λ 0.14(0.0079) 0.12(0.0163)
检验值(概率)
kiefer-salmon 2.86(0.25) 2.78(0.27)
breusch-pagan 8.12(0.26) 7.56(0.16)
lmerr 2.83(0.08) 2.61(0.09)
lmlag 0.38(0.54) 0.18(0.69)
adjusted r[2] 0.88 0.89
log likelihood -21.9860 -20.1865 -22.0816 -20.6987
sample size 29 29 29 29
注:括号内标注的是统计量的显著性水平。
4.2.1 模型的空间特性检验
两个拉格朗日多项式lmerr和lmlag都可看出空间依存性的存在。因为lmerr的概率是0.08而lmlag的概率是0.54,所以空间误差构成模型(sea)更适合解释