**123区,青青操久久,久久情侣视频,中文字幕亚洲免费,国产精品久久久久免费,精品福利视频在线观看

返回
頂部

重磅!Stata 16 正式發(fā)布:Stata 在大數(shù)據(jù)時(shí)代的華麗轉(zhuǎn)身




大數(shù)據(jù)時(shí)代的華麗轉(zhuǎn)身+深耕計(jì)量經(jīng)濟(jì)學(xué)的經(jīng)典與前沿方法



  • Lasso
  • Nonparametric Series Regression
  • Multiple Datasets in Memory
  • Choice Models
  • Python Integration
  • Panel-data ERMs
  • Do-file Editor--Autocompletion and More Syntax Highlighting
  • New in Bayesian Analysis
  • Meta-Analysis
  • Nonlinear DSGE Models
  • Reporting
  • xtheckman
  • Import Data from SAS and SPSS
  • 重磅來(lái)襲,Stata 16全新版本正式發(fā)布!!!


    或許廣大的Stata用戶(hù)們還沒(méi)把 Stata 15捂熱,而 Stata 16已經(jīng)悄然襲來(lái)。大數(shù)據(jù)時(shí)代,知識(shí)加速迭代,Stata 公司加快了步伐,從V15版本令人激動(dòng)的重大升級(jí)到中文版暖心發(fā)布,讓全世界用戶(hù)盡享Stata軟件之美好,正值第三屆Stata中國(guó)用戶(hù)大會(huì)開(kāi)幕之際,屆時(shí)StataCorp LLC 彭華博士將帶您一起探索Stata V16新功能亮點(diǎn),敬請(qǐng)期待!!!
    總結(jié)起來(lái),Stata 16 主要有以下兩方面的重大升級(jí)。首先,Stata 在大數(shù)據(jù)時(shí)代的華麗轉(zhuǎn)身,與大數(shù)據(jù)相關(guān)的功能突飛猛進(jìn)。其次,Stata 繼續(xù)深耕計(jì)量經(jīng)濟(jì)學(xué)的經(jīng)典與前沿方法。讓我們一起來(lái)看看吧。

    Stata 16 在大數(shù)據(jù)時(shí)代的華麗轉(zhuǎn)身

    眾所周知,大數(shù)據(jù)(big data)的特點(diǎn)可用4V來(lái)概括,即數(shù)據(jù)規(guī)模龐大(Volume)、數(shù)據(jù)更新頻繁(Velocity)、數(shù)據(jù)類(lèi)型多樣(Variety)和數(shù)據(jù)價(jià)值巨大(Value)。Stata 16的以下新模塊與功能更新均與此4V有關(guān)。

    Lasso

    作為大數(shù)據(jù)Volume的一種重要形式,“高維數(shù)據(jù)”(high-dimensional data)在經(jīng)管與社科中也越來(lái)越多地出現(xiàn),即解釋變量很多,甚至超過(guò)樣本容量的情形。Lasso (Least Absolute Shrinkage and Selection Operator,也稱(chēng)“套索估計(jì)量”)及其衍生的系列估計(jì)量正是進(jìn)行高維回歸的主要工具。
    為此,Stata 16及時(shí)地推出了Lasso系列的官方命令,包括lasso, elasticnet(彈性網(wǎng))與 sqrtlasso(平方根Lasso),可估計(jì)線(xiàn)性回歸模型(比如 lasso linear)、二值選擇模型(比如,lasso logit 與 lasso probit)、計(jì)數(shù)模型(比如,lasso poisson)等。
    Lasso 系列的估計(jì)量通常使用懲罰回歸(penalized regressions)來(lái)處理高維數(shù)據(jù),以避免“過(guò)擬合”(overfit)與“方差爆炸”(variance explosion),并進(jìn)行“變量選擇”(variable selection)。這些懲罰回歸對(duì)于回歸系數(shù)過(guò)大的懲罰力度則一般由調(diào)節(jié)參數(shù)(tuning parameter)或 L1范數(shù)(L1 norm)來(lái)控制。
    使用 Stata 16的Lasso命令,可以很方便地計(jì)算回歸系數(shù)的整個(gè)路徑(coefficient paths),作為調(diào)節(jié)參數(shù) 或 L1范數(shù)的函數(shù);并根據(jù)“交叉驗(yàn)證”(cross-validation)選擇最優(yōu)的調(diào)節(jié)參數(shù) ,參見(jiàn)下圖。




    不僅如此,Stata 16 官方命令還提供了 Lasso 系列相應(yīng)的統(tǒng)計(jì)推斷方法,比如計(jì)算標(biāo)準(zhǔn)誤、置信區(qū)間,或進(jìn)行假設(shè)檢驗(yàn)。這些統(tǒng)計(jì)推斷方法包括“double-selection lasso”(比如,dsregress,dslogit,dspoisson),“partialling-out lasso”(比如,poregress,pologit,popoisson),以及“cross-fit partialing out lasso”(比如,xporegress,xpologit,xpopoisson)。


    Multiple Datasets in Memory

    在大數(shù)據(jù)時(shí)代,學(xué)界與業(yè)界越來(lái)越需要在內(nèi)存中同時(shí)處理多個(gè)數(shù)據(jù)集。在此前的 Stata 版本中,Stata 內(nèi)存只能有一個(gè)數(shù)據(jù)集。這種設(shè)置雖簡(jiǎn)便易行,在小數(shù)據(jù)時(shí)代也基本夠用,但在大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)的來(lái)源 Variety 多樣,已成為應(yīng)用的瓶頸。
    因此,Stata 16 適時(shí)地推出在內(nèi)存內(nèi)同時(shí)調(diào)用多達(dá)100個(gè)數(shù)據(jù)集的重要功能。比如,你可以很方便地根據(jù)內(nèi)存中多個(gè)數(shù)據(jù)集的信息來(lái)定義一個(gè)新的變量。


    Python Integration

    隨著機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué)的興起,Python 無(wú)疑是最炙手可熱的編程語(yǔ)言之一。為此,Stata 16 專(zhuān)門(mén)提供了一個(gè)與 Python 的接口,讓用戶(hù)可以在熟悉的 Stata 界面下調(diào)用 Python,并在 Stata 中顯示運(yùn)行結(jié)果。
    比如,此前的 Stata 版本無(wú)法畫(huà)三維立體圖,而在Stata 16中,通過(guò)調(diào)用Python 的 Matplotlib 則不難實(shí)現(xiàn)(參見(jiàn)下圖)。


    這也意味著,你可以在 Stata 中,通過(guò) Python 接口,使用 Python 所擅長(zhǎng)的各種機(jī)器學(xué)習(xí)方法,包括隨機(jī)森林、梯度提升、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等!


    Do-file Editor -- Autocompletion and More Syntax Highlighting

    在大數(shù)據(jù)時(shí)代,編程越來(lái)越成為一種基本技能,而不再是“碼農(nóng)”專(zhuān)屬。在 Stata 中編程,無(wú)疑需要一個(gè)很好的 do 文件編輯器(Do-file Editor)。 讓人驚喜的是,Stata 16 的 do 文件編輯器的性能也有了大幅提升,包括 Stata 命令的自動(dòng)填寫(xiě)完成(autocompletion),以及更多語(yǔ)法高亮顯示(syntax highlighting),這無(wú)疑將為 Stata 編程提供很大便利。


    Meta-Analysis

    隨著大數(shù)據(jù)時(shí)代的數(shù)據(jù)來(lái)源 Variety 越來(lái)越多,使得我們時(shí)常需要將不同來(lái)源的樣本數(shù)據(jù)之研究結(jié)果整合在一起,即所謂“元分析”(Meta-Analysis)。為此,Stata 16 提供了全新的 Meta-Analysis 模塊,使得元分析變得十分方便、快捷而高效,并輔之以強(qiáng)大的可視化功能(參見(jiàn)下圖)。


    Reporting

    由于大數(shù)據(jù)的更新頻繁特點(diǎn)(Velocity),使得數(shù)據(jù)分析經(jīng)常需要重復(fù)進(jìn)行,使用更新的數(shù)據(jù)。此時(shí),研究報(bào)告的可重復(fù)性(Reproducibility)就變得日益重要,即保證任何人只要運(yùn)行你的 Stata 程序即可得到完全一樣的研究報(bào)告。這些研究報(bào)告的格式可以是 Word,PDF,Excel 或 HTML(參見(jiàn)下圖)。


    而且,當(dāng)你的數(shù)據(jù)集更新之后,再運(yùn)行一遍你的 Stata,則你的研究報(bào)告也會(huì)相應(yīng)地自動(dòng)更新!Stata 16 新引入或完善的相關(guān)命令包括 dyndoc,markdown,putdocx,html2docx,doc2pdf。

    小貼士:還在發(fā)愁如何將 Word 文件轉(zhuǎn)化為 PDF 格式?Stata 16 的 doc2pdf 命令就能幫你搞定!

    Import Data from SAS and SPSS

    如果你有數(shù)據(jù)在 SAS 或 SPSS 中,想要導(dǎo)入 Stata 以利用其強(qiáng)大的統(tǒng)計(jì)與計(jì)量功能,Stata 16 貼心地提供了專(zhuān)門(mén)的新命令 import sas 與 import spss,使得這種數(shù)據(jù)遷移變得十分方便與快捷,參見(jiàn)下圖。




    Stata 16 深耕計(jì)量經(jīng)濟(jì)學(xué)的經(jīng)典與前沿方法

    Nonparametric Series Regression

    序列回歸(series regression)是非參數(shù)回歸(nonparametric regression)的一種重要方法。它使用多項(xiàng)式(polynomials)、B-樣條(B-splines)或樣條(splines)所構(gòu)成的序列來(lái)近似逼近任意的未知回歸函數(shù)。

    Stata 16 全新推出的命令 npregress series 填補(bǔ)了 Stata 在非參數(shù)回歸領(lǐng)域的又一空白,使得非參數(shù)序列回歸變得方便而高效;比如,計(jì)算平均邊際效應(yīng)(average marginal effects)。命令 npregress series 甚至可以估計(jì)“半?yún)?shù)模型”(semi-parametric model),即同時(shí)包含參數(shù)與非參數(shù)部分的模型。

    Choice Models

    對(duì)于微觀計(jì)量中常用的“離散選擇模型”(discrete choice models),Stata 16 專(zhuān)門(mén)設(shè)立了一個(gè)“選擇模型”(Choice Models)的模塊。在估計(jì)選擇模型之前,你先通過(guò)命令 cmset 來(lái)宣布你的數(shù)據(jù)為選擇模型,然后可用命令 cmsummarize,cmchoiceset,cmtab 或 cmsample 來(lái)考察你的選擇模型。
    估計(jì)選擇模型的相應(yīng) Stata 命令也統(tǒng)一帶上了 cm 的前綴,比如
    cmclogit:conditional logit model
    cmmixlogit:mixed logit model
    cmxtmixlogit:panel-data mixed logitmodel
    cmmprobit:multinomial probitmodel
    cmroprobit:rank-ordered probitmodel
    cmrologit:rank-ordered logitmodel
    其中,cmxtmixlogit 是 Stata 16的全新命令,用于估計(jì)面板數(shù)據(jù)的混合邏輯模型(mixed logit models for panel data)。

    Panel-data ERMs

    Stata 15 推出了 ERM(Extended Regression Models)模塊,可以處理同時(shí)出現(xiàn)“內(nèi)生性”(endogeneity)、“樣本選擇”(sample selection)與“處理效應(yīng)”(treatment)這三種并發(fā)癥的情形,或三者的任意組合,非常靈活實(shí)用。Stata 16 則將ERMs 推廣到了面板數(shù)據(jù)中,新引入了xtegress,xteintreg,xteprobit,xteoprobit 等強(qiáng)大命令。

    New in Bayesian Analysis

    Stata 16 的“貝葉斯分析”(Bayesian Analysis)模塊也有了不少新功能。比如,可使用多個(gè)馬爾科夫鏈(multiple chains)來(lái)檢驗(yàn)現(xiàn)代貝葉斯分析所依賴(lài)的馬爾科夫鏈蒙特卡洛(Markov China Monte Carlo)是否收斂;以及使用后驗(yàn)分布(posterior distribution)進(jìn)行“貝葉斯預(yù)測(cè)”(Bayesian predictions),參見(jiàn)下圖。


    Nonlinear DSGE Models

    繼 Stata 15 推出估計(jì)線(xiàn)性 DSGE 模型的命令 dsge 之后,Stata 16 更上一層樓,可以通過(guò)命令 dsgenl 來(lái)估計(jì)非線(xiàn)性 DSGE 模型。 使用命令dsgenl,無(wú)須再手工將 DSGE 模型線(xiàn)性化,直接輸入非線(xiàn)性的 DSGE 模型,Stata 即會(huì)自動(dòng)地對(duì)它進(jìn)行線(xiàn)性化與估計(jì)。這無(wú)疑是宏觀經(jīng)濟(jì)學(xué)者的福音啊!

    xtheckman

    Stata 16新推出的命令 xtheckman,使得 Heckman 的樣本選擇模型(sample model)也可以在面板數(shù)據(jù)中估計(jì)啦!


    總之,Stata 16 是一次很令人激動(dòng)的重大升級(jí)。Stata 16 的及時(shí)推出,意味著 Stata 在大數(shù)據(jù)時(shí)代的華麗轉(zhuǎn)身,而同時(shí)又繼續(xù)深耕計(jì)量經(jīng)濟(jì)學(xué)的經(jīng)典與前沿方法。在可預(yù)見(jiàn)的將來(lái),Stata 依然會(huì)是經(jīng)濟(jì)學(xué)家最常用的計(jì)量與統(tǒng)計(jì)軟件。


    Stata16新版已經(jīng)發(fā)布,如需申請(qǐng)新版采購(gòu)及老版本更新升級(jí)請(qǐng)聯(lián)系我們,另外凡采購(gòu)一套以上者,就可以享受折上折優(yōu)惠。感謝您的支持與關(guān)注。聯(lián)系方式:徐經(jīng)理 Tel/WeChat: 18610597626 Email: crystal@uone-tech.cn。







    第三屆Stata中國(guó)用戶(hù)大會(huì),進(jìn)入大會(huì)主頁(yè)


    2019 Stata夏季訓(xùn)練營(yíng)-陳強(qiáng)老師專(zhuān)場(chǎng)-火熱報(bào)名中....


    2019 Stata夏季訓(xùn)練營(yíng)-王群勇老師專(zhuān)場(chǎng)-火熱報(bào)名中....




    相關(guān)鏈接