为什么2005年美国大豆单产特别高(孙斌)
【2006.09.27 15:54】 来源:和讯特约
1160
每年的夏秋之际,交易大豆期货的投资者都会关心美国大豆主产区的天气情况,都会关注美国农业部每周公布的大豆生长优良率情况。因为,天气的好坏会直接影响大豆生长优良率的高低,生长优良率的高低又将影响大豆单产水平的高低,进而影响大豆的供求关系,决定大豆现货和期货价格的涨跌。尤其是应用计量经济模型预测大豆价格的投资者,大豆生长优良率是预测模型的重要参数。
一般认为,大豆生长优良率与大豆单产水平一定存在良好的线性关系,优良率高,单产肯定高;优良率低,单产肯定低。但是,倘若观察下列两组数据后,迷惑、疑虑就会油然而生。2004年美国大豆生长优良率为66%,单产水平为42.2蒲式耳/英亩;2005年美国大豆生长优良率为55%,优良率较2004年低11个百分点,在美国历史上属中等水平,单产却达到了创记录的43.3蒲式耳/英亩。显而易见,大豆生长优良率与大豆单产水平的内在联系并非人们想象中的那么简单,优良率高则单产高;优良率低则单产低的常识过于粗糙,以此来预测行情会犯大错误。大豆生长优良率与大豆单产水平究竟存在怎样的内在联系,需要作深入的探索。
一、大豆生长优良率与单产水平内在联系的数量特征
1.生长优良率的确定。美国农业部从6月中旬至10月中旬每周公布一次大豆生长优良率,取什么时间的生长优良率作为本文的研究对象?一方面时间不能太早,实际生产中,苗情好而欠收;苗情差而丰收的情况经常发生。同时经测算,大豆生长优良率与单产水平在8月中旬前的相关系数较低,一般只能达到35%左右,显示大豆优良率在8月中旬前的变化较频繁,与最终单产水平关系不密切。另一方面,时间也不能太迟,因为研究大豆生长优良率与大豆单产水平相互关系的目的是为了作前瞻性预测分析,太迟的话就失去了研究的意义,况且美国大豆生长优良率一般到9月下旬后就比较稳定,与最终的生长优良率至多相差2、3个百分点,不影响本文要论述的观点,故本文选取每年九月最后一周的生长优良率作为研究对象。
2.1999年至2004年大豆生长优良率与大豆单产水平相关系数的计算。将大豆生长优良率设为X,大豆单产水平设为Y,相关系数设为R,其时间序列及相应的计算如表一所示:
表一:
序号 年份 X Y X2 Y2 XY R
1 1999 44 36.6 1936 1339.56 1610.4
2 2000 53 36.6 2809 1339.56 1939.8
3 2001 55 38.1 3025 1451.61 2095.5
4 2002 43 39.6 1849 1568.16 1702.8
5 2003 39 33.4 1521 1115.56 1302.6
6 2004 66 42.2 4356 1780.84 2785.2
∑ 300 226.5 15496 8595.29 11436.3
3.大豆优良率与单产水平的线性回归方程YC=a+bx
1999年至2004年大豆生长平均优良率 平均单产 ,列表二计算如下参数:
表二:
序号 2
2
1 36 1.3225 6.9
2 9 1.3225 -3.45
3 25 0.125 1.75
4 49 3.4225 -12.95
5 121 18.9225 47.85
6 256 19.8025 71.2
∑ 496 44.9175 111.3
yc=26.53+0.2244X
4.估计标准误差及区间估计
yc (1.94 1.823)即yc 3.5
在95%的置信度下,查T分布表中T值为2.45,估计区间为:
yc (2.45 1.823)即yc 4.5
5.1999年至2005年大豆生长优良率与单产水平的关系图
二、关于数量特征及关系图的解读
第一,1999年至2004年,美国大豆生长优良率与单产水平的相关系数为75%,表面上看,75%的相关系数属于中等强度的相关性,虽与人们期望值有一定的差距,但还算说得过去。但分析具体数据,大豆生长优良率与大豆单产实际上相关性极差,甚至可以说是不相关的。比如2001年的生长优良率为55%,大豆单产为38.1,2002年的生长优良率为43%,大豆单产为39.6。再比如,同一年度内,美国农业部2004年7月中旬报告的大豆生长优良率为68%,预估单产为39.9,到8月中旬,生长优良率提高至73%,预估单产反而下调至39.1。在正相关的线性回归方程中,应变量必定随自变量的增长而增长,但美国大豆单产水平并不一定随着大豆生长优良率提高而提高,排除极好与极差的极端情况,美国大豆单产水平在正常年景下与生长优良率的关系处于随机波动的游离状态,两者之间是不相关的。
得出上述结论,似乎有点好笑,不仅很难被市场所接受,也不是本文想要得到的最终研究结果,毕竟在生长优良率相差较大的情况下,单产水平存在显著的高低之分,说明单产水平与生长优良率还是有关系的。再则,如果将生长优良率和单产水平的原始数据作适当的统计学处理,生长优良率分成一定级别的组,一定组内的单产水平进行平均化,相信两者的相关性会很完美。由于资料所限,本文无法对此深入研究,有待以后探讨。
为什么美国大豆生长优良率与单产水平在正常年景下是随机波动的,一个合理的解释就是生长优良率在各个主产州的组合不同。美国大豆的主产地区包括伊利诺斯等十八个州,这十八州在正常的年景下的单产水平有很大的差异,某些州的单产可达每英亩六、七十蒲式耳,某些州即使气候状况最好,生长优良率最高,单产也只能达三、四十蒲式耳,各个州的优良率在全国总优良率中的权数是相等的,但各个州的单产水平在全国平均单产水平的权数是不同的。因此,由于灾害天气对大豆单产的损害,是发生在高产的州,还是发生在低产的州,全国平均下来的单产水平就会相差很大。
第二,2005年43.3蒲式耳/英亩的单产水平显著地超过了YC=26.53+0.2244x在90%时的置信区间上限,恰好落在95%的置信区间上限上,其余年份的单产水平则落在90%的置信区间内,这说明2005年的单产水平与其他年份的单产水平相比还是有特别之处。为了说明这一观点,可以用各年份的实际单产水平相对于YC=26.53+0.2244x趋势单产水平的离散程度来验证。表三是实际单产水平相对于趋势单产水平离散程度的计算表,2005年的实际单产水平相对于趋势单产偏离了11.39%,比2002年9.46%的偏离幅度还增加了20.4%,实际值与趋势值的偏差相当于1999年至2004年预测标准误差S的2.43倍(4.428÷1.823)。如果将各年份的实际单产水平与平均单产水平进行比较,同样可得2005年的比值最大。
年份 X Y YC
与趋势单产的离差
1999 44 36.6 36.4036 0.1964 0.54
2000 53 36.6 38.4232 1.8232 -4.75
2001 55 38.1 38.872 0.772 1.99
2002 43 39.6 36.1792 3.4208 9.46
2003 39 33.4 35.2816 1.8816 -5.33
2004 66 42.2 41.3404 0.8596 2.08
2005 55 43.3 38.872 4.428 11.39
由于在YC=26.53+0.2244x的趋势单产水平预测模型中已经涵盖了主产州不同组合的因素,故排除主产州组合的非正常的极端情况,排除人为压低2005年生长优良率的情况,是否出现了以前年度所没有的系统性因素,从而造成了2005年大豆单产特别高的现象。本文的基本假设是美国大豆生产技术有了新的突破,这一生长技术的突破有可能是大豆转基因技术有了新的发展,也可能是种植密植度等耕作技术水平的提高,或者是肥料、植物生长素等新技术成果的应用。如果这一基本假设成立,意味着美国大豆的单产水平进入了一个新的增长周期,意味着美国大豆的平均单产水平将跨上一个台阶。
三、结论
通过以上探讨研究,可以得到以下初步结论,对今后的大豆行情分析预测有一定的指导意义。
(1)在正常年景下,大豆生长优良率与大豆单产水平的联系并不密切。认为美国大豆生长优良率降低,单产就会降低;大豆生长优良率提高,单产就会提高的认识过于简单粗糙,这样的认识除非在天气极度恶劣;大豆生长优良率急剧下降到历史较低水平时才正确,在大多数的正常年景下是不正确的,所以,没有必要对美国大豆生长优良率的非持续的升降过于敏感。
(2)应当跟踪了解美国大豆重点主产区的生长优良率变化情况。美国大豆总的单产水平主要由种植面积比较大单产水平又比较高的重点主产区的大豆生长情况所决定。美国农业部目前每周公布十八个主产州的大豆生长情况,应当在这十八个州中再选择重点主产州,积累数据资料,建立分析预测模型,以重点主产州的生长优良率来推断美国大豆总的单产水平要远远优于目前以总体生长优良率推断总体单产水平的效果。
(3)要对2005年美国大豆单产特别高的现象充分重视,观察其是否演变成趋势。用历史的数量关系、数量特征不能解释2005年美国大豆单产特别高的现象,本文给出的基本假设是美国大豆生长技术有了新的突破,但这一假设需要连续三年(含2005年)的观察才能确认是否成立。之所以要重视这一现象,是因为一旦假设成立,必然会改变大豆与其它主要农产品的比价关系,在剔除其它影响因素的条件下,也必然会改变全球大豆的价值区域。
四、不足之处和有待进一步研究的问题
由于资料所限,本文仅采用了从1999年至2005年的美国大豆生长优良率与大豆单产水平的原始数据,样本数量太少,某些结论的可靠性需要更多的样本数据来支持。例如,2005年实际单产水平较趋势单产水平的偏离程度在历史上究竟算不算高?如果出现很大的负偏离值又当如何解释?分级别(分组)的生长优良率与相对应的平均单产水平的相关性及其对行情分析预测的意义如何?这些问题都有待于今后作进一步的研究。另外,本文在确定T值时没有考虑n-1,的自由度问题,理由是研究对象并未出现数列基数丢失的现象,所以也就不必n-1,这在数理统计学原理上还有待证明。
(大连商品交易所)
每年的夏秋之际,交易大豆期货的投资者都会关心美国大豆主产区的天气情况,都会关注美国农业部每周公布的大豆生长优良率情况。因为,天气的好坏会直接影响大豆生长优良率的高低,生长优良率的高低又将影响大豆单产水平的高低,进而影响大豆的供求关系,决定大豆现货和期货价格的涨跌。尤其是应用计量经济模型预测大豆价格的投资者,大豆生长优良率是预测模型的重要参数。
一般认为,大豆生长优良率与大豆单产水平一定存在良好的线性关系,优良率高,单产肯定高;优良率低,单产肯定低。但是,倘若观察下列两组数据后,迷惑、疑虑就会油然而生。2004年美国大豆生长优良率为66%,单产水平为42.2蒲式耳/英亩;2005年美国大豆生长优良率为55%,优良率较2004年低11个百分点,在美国历史上属中等水平,单产却达到了创记录的43.3蒲式耳/英亩。显而易见,大豆生长优良率与大豆单产水平的内在联系并非人们想象中的那么简单,优良率高则单产高;优良率低则单产低的常识过于粗糙,以此来预测行情会犯大错误。大豆生长优良率与大豆单产水平究竟存在怎样的内在联系,需要作深入的探索。
一、大豆生长优良率与单产水平内在联系的数量特征
1.生长优良率的确定。美国农业部从6月中旬至10月中旬每周公布一次大豆生长优良率,取什么时间的生长优良率作为本文的研究对象?一方面时间不能太早,实际生产中,苗情好而欠收;苗情差而丰收的情况经常发生。同时经测算,大豆生长优良率与单产水平在8月中旬前的相关系数较低,一般只能达到35%左右,显示大豆优良率在8月中旬前的变化较频繁,与最终单产水平关系不密切。另一方面,时间也不能太迟,因为研究大豆生长优良率与大豆单产水平相互关系的目的是为了作前瞻性预测分析,太迟的话就失去了研究的意义,况且美国大豆生长优良率一般到9月下旬后就比较稳定,与最终的生长优良率至多相差2、3个百分点,不影响本文要论述的观点,故本文选取每年九月最后一周的生长优良率作为研究对象。
2.1999年至2004年大豆生长优良率与大豆单产水平相关系数的计算。将大豆生长优良率设为X,大豆单产水平设为Y,相关系数设为R,其时间序列及相应的计算如表一所示:
表一:
序号 年份 X Y X2 Y2 XY R
1 1999 44 36.6 1936 1339.56 1610.4
2 2000 53 36.6 2809 1339.56 1939.8
3 2001 55 38.1 3025 1451.61 2095.5
4 2002 43 39.6 1849 1568.16 1702.8
5 2003 39 33.4 1521 1115.56 1302.6
6 2004 66 42.2 4356 1780.84 2785.2
∑ 300 226.5 15496 8595.29 11436.3
3.大豆优良率与单产水平的线性回归方程YC=a+bx
1999年至2004年大豆生长平均优良率 平均单产 ,列表二计算如下参数:
表二:
序号 2
2
1 36 1.3225 6.9
2 9 1.3225 -3.45
3 25 0.125 1.75
4 49 3.4225 -12.95
5 121 18.9225 47.85
6 256 19.8025 71.2
∑ 496 44.9175 111.3
4.估计标准误差及区间估计
在95%的置信度下,查T分布表中T值为2.45,估计区间为:
yc (2.45 1.823)即yc 4.5
5.1999年至2005年大豆生长优良率与单产水平的关系图
第一,1999年至2004年,美国大豆生长优良率与单产水平的相关系数为75%,表面上看,75%的相关系数属于中等强度的相关性,虽与人们期望值有一定的差距,但还算说得过去。但分析具体数据,大豆生长优良率与大豆单产实际上相关性极差,甚至可以说是不相关的。比如2001年的生长优良率为55%,大豆单产为38.1,2002年的生长优良率为43%,大豆单产为39.6。再比如,同一年度内,美国农业部2004年7月中旬报告的大豆生长优良率为68%,预估单产为39.9,到8月中旬,生长优良率提高至73%,预估单产反而下调至39.1。在正相关的线性回归方程中,应变量必定随自变量的增长而增长,但美国大豆单产水平并不一定随着大豆生长优良率提高而提高,排除极好与极差的极端情况,美国大豆单产水平在正常年景下与生长优良率的关系处于随机波动的游离状态,两者之间是不相关的。
得出上述结论,似乎有点好笑,不仅很难被市场所接受,也不是本文想要得到的最终研究结果,毕竟在生长优良率相差较大的情况下,单产水平存在显著的高低之分,说明单产水平与生长优良率还是有关系的。再则,如果将生长优良率和单产水平的原始数据作适当的统计学处理,生长优良率分成一定级别的组,一定组内的单产水平进行平均化,相信两者的相关性会很完美。由于资料所限,本文无法对此深入研究,有待以后探讨。
为什么美国大豆生长优良率与单产水平在正常年景下是随机波动的,一个合理的解释就是生长优良率在各个主产州的组合不同。美国大豆的主产地区包括伊利诺斯等十八个州,这十八州在正常的年景下的单产水平有很大的差异,某些州的单产可达每英亩六、七十蒲式耳,某些州即使气候状况最好,生长优良率最高,单产也只能达三、四十蒲式耳,各个州的优良率在全国总优良率中的权数是相等的,但各个州的单产水平在全国平均单产水平的权数是不同的。因此,由于灾害天气对大豆单产的损害,是发生在高产的州,还是发生在低产的州,全国平均下来的单产水平就会相差很大。
第二,2005年43.3蒲式耳/英亩的单产水平显著地超过了YC=26.53+0.2244x在90%时的置信区间上限,恰好落在95%的置信区间上限上,其余年份的单产水平则落在90%的置信区间内,这说明2005年的单产水平与其他年份的单产水平相比还是有特别之处。为了说明这一观点,可以用各年份的实际单产水平相对于YC=26.53+0.2244x趋势单产水平的离散程度来验证。表三是实际单产水平相对于趋势单产水平离散程度的计算表,2005年的实际单产水平相对于趋势单产偏离了11.39%,比2002年9.46%的偏离幅度还增加了20.4%,实际值与趋势值的偏差相当于1999年至2004年预测标准误差S的2.43倍(4.428÷1.823)。如果将各年份的实际单产水平与平均单产水平进行比较,同样可得2005年的比值最大。
年份 X Y YC
与趋势单产的离差
1999 44 36.6 36.4036 0.1964 0.54
2000 53 36.6 38.4232 1.8232 -4.75
2001 55 38.1 38.872 0.772 1.99
2002 43 39.6 36.1792 3.4208 9.46
2003 39 33.4 35.2816 1.8816 -5.33
2004 66 42.2 41.3404 0.8596 2.08
2005 55 43.3 38.872 4.428 11.39
由于在YC=26.53+0.2244x的趋势单产水平预测模型中已经涵盖了主产州不同组合的因素,故排除主产州组合的非正常的极端情况,排除人为压低2005年生长优良率的情况,是否出现了以前年度所没有的系统性因素,从而造成了2005年大豆单产特别高的现象。本文的基本假设是美国大豆生产技术有了新的突破,这一生长技术的突破有可能是大豆转基因技术有了新的发展,也可能是种植密植度等耕作技术水平的提高,或者是肥料、植物生长素等新技术成果的应用。如果这一基本假设成立,意味着美国大豆的单产水平进入了一个新的增长周期,意味着美国大豆的平均单产水平将跨上一个台阶。
三、结论
通过以上探讨研究,可以得到以下初步结论,对今后的大豆行情分析预测有一定的指导意义。
(1)在正常年景下,大豆生长优良率与大豆单产水平的联系并不密切。认为美国大豆生长优良率降低,单产就会降低;大豆生长优良率提高,单产就会提高的认识过于简单粗糙,这样的认识除非在天气极度恶劣;大豆生长优良率急剧下降到历史较低水平时才正确,在大多数的正常年景下是不正确的,所以,没有必要对美国大豆生长优良率的非持续的升降过于敏感。
(2)应当跟踪了解美国大豆重点主产区的生长优良率变化情况。美国大豆总的单产水平主要由种植面积比较大单产水平又比较高的重点主产区的大豆生长情况所决定。美国农业部目前每周公布十八个主产州的大豆生长情况,应当在这十八个州中再选择重点主产州,积累数据资料,建立分析预测模型,以重点主产州的生长优良率来推断美国大豆总的单产水平要远远优于目前以总体生长优良率推断总体单产水平的效果。
(3)要对2005年美国大豆单产特别高的现象充分重视,观察其是否演变成趋势。用历史的数量关系、数量特征不能解释2005年美国大豆单产特别高的现象,本文给出的基本假设是美国大豆生长技术有了新的突破,但这一假设需要连续三年(含2005年)的观察才能确认是否成立。之所以要重视这一现象,是因为一旦假设成立,必然会改变大豆与其它主要农产品的比价关系,在剔除其它影响因素的条件下,也必然会改变全球大豆的价值区域。
四、不足之处和有待进一步研究的问题
由于资料所限,本文仅采用了从1999年至2005年的美国大豆生长优良率与大豆单产水平的原始数据,样本数量太少,某些结论的可靠性需要更多的样本数据来支持。例如,2005年实际单产水平较趋势单产水平的偏离程度在历史上究竟算不算高?如果出现很大的负偏离值又当如何解释?分级别(分组)的生长优良率与相对应的平均单产水平的相关性及其对行情分析预测的意义如何?这些问题都有待于今后作进一步的研究。另外,本文在确定T值时没有考虑n-1,的自由度问题,理由是研究对象并未出现数列基数丢失的现象,所以也就不必n-1,这在数理统计学原理上还有待证明。
(大连商品交易所)
[发起辩论] [发表评论] [复制链接] [收藏此文] [我要提问] [打印]
相关新闻/评论
进入期货学院吧
看过此页的网友也看过了
热门推荐
热点新闻
|
热门评论
|
理财产品




