視頻介紹 Stata安裝手冊 獲取報價 軟件試用 官網(wǎng)授權(quán)
Stata 是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專業(yè)圖表的完整及整合性統(tǒng)計軟件。它功能非常強大,包含異質(zhì)性DID、中介效應(yīng)、多向聚類標準誤、野聚類自助法、工具變量分位數(shù)回歸、貝葉斯模型平均、描述性統(tǒng)計制表等功能。用 Stata 繪制的統(tǒng)計圖形相當精美。Stata 具有操作靈活、簡單、易學易用、運行速度極快等優(yōu)點。
2025年4月8日,Stata19重磅發(fā)布!Stata 19以前瞻性的視野與卓越的技術(shù)實力,勇敢地超越了傳統(tǒng)數(shù)據(jù)分析工具的局限,以革新者的姿態(tài)引領(lǐng)著數(shù)據(jù)科學的新潮流。它不僅集成了最新一代的算法模型與智能分析技術(shù),更在數(shù)據(jù)處理速度、分析維度拓展以及結(jié)果精準度上實現(xiàn)了質(zhì)的飛躍,讓數(shù)據(jù)分析過程更加流暢高效,仿佛為研究者們配備了一把銳利的智慧之劍,輕松斬斷復雜數(shù)據(jù)背后的重重迷霧,讓每一個分析結(jié)果都如同經(jīng)過精密雕琢的藝術(shù)品,精準無誤地揭示出數(shù)據(jù)背后的深層規(guī)律與價值,為決策制定提供了堅實而可靠的依據(jù)。
[->Stata 校園版來啦!可滿足全校使用的授權(quán),點擊了解詳情]
Stata 19 重磅發(fā)布??!
>>【直播課程】Stata數(shù)據(jù)清理技巧—宏擴展函數(shù)及其應(yīng)用
機器學習與Stata、R應(yīng)用研討會-陳強教授主講
>>熱烈祝賀“2025年第十四屆數(shù)量經(jīng)濟學國際學術(shù)會議”“數(shù)量經(jīng)濟學國際講習班暨第九屆Stata中國用戶大會”系列活動取得圓滿成功!
>>從教學到科研:友萬科技助力中國社會科學院大學全面部署Stata校園版!
>>南開大學經(jīng)濟學院正式啟用Stata/MP8 V18.5正版軟件 助力科研教學高質(zhì)量發(fā)展!
>> 2024 Stata夏季訓練營“面板數(shù)據(jù)的因果推斷及Stata應(yīng)用研討會”圓滿結(jié)束!
>> 2024 Stata夏季訓練營“計量經(jīng)濟實證方法與論文寫作研討會”圓滿結(jié)束!
>> 友萬快訊:友萬科技深入喀什大學開展Stata和IBM SPSS軟件內(nèi)訓及服務(wù)解決方案
Stata實驗室建設(shè)計劃,優(yōu)化人才培養(yǎng),助力社會前行!
Stata 19 現(xiàn)已發(fā)布!您可以在我們的網(wǎng)站上看到所有新功能。 表格、圖形、框架和 “Do-file 編輯器”(Do-file Editor)都有許多改進,將簡化您的工作流程。 許多令人興奮的新統(tǒng)計功能包括:
Stata19版本官方命令引入另一類常用的機器學習方法,即基于決策樹(decision trees)的集成學習方法(ensemble learning),包括隨機森林(random forest)與梯度提升法(gradient boosting machine)
Stata 19提供了一套新的h2oml命令,可輕松地接入開源的大數(shù)據(jù)機器學習平臺H2O,針對回歸(regression)或分類(classification)問題使用隨機森林或梯度提升法。H2O使得機器學習變得更加容易,有時稱為AutoML。
h20.png
畫變量重要性圖(variable importance plot):
Stata 19引入了有關(guān)面板數(shù)據(jù)的若干新命令或選擇項,包括高維固定效應(yīng)(high dimensional FE)、相關(guān)隨機效應(yīng)(correlated random effects)、面板向量自回歸(panel VAR),給用戶帶來了強大的新功能與便利。
這次Stata 19將其相應(yīng)功能納入了官方命令(無須額外命令,僅新增了一個選擇項),使得操作更為簡便可靠!
例如,在估計面板固定效應(yīng)模型時,假設(shè)我們還想額外地控制三個分類變量(categorical variables)z1, z2與z3,只要在常規(guī)命令加上absorb()的選擇項即可,類似地,我們在進行二階段最小二乘法(2SLS)估計時,也可以使用absorb()的選擇項。
靜態(tài)面板的兩個常用模型為隨機效應(yīng)(random effects,簡記RE)與固定效應(yīng)(fixed effects,簡記FE)。然而,二者均有缺點。隨機效應(yīng)模型不夠穩(wěn)健,如果解釋變量與個體效應(yīng)相關(guān),則得不到一致估計。另一方面,雖然固定效應(yīng)模型較為穩(wěn)健,但無法估計非時變(time-invariant)變量的系數(shù)。為此,Stata 19推出了“相關(guān)隨機效應(yīng)”(correlated random effects,簡記CRE),可以兼顧二者的優(yōu)點。
CRE模型允許解釋變量與個體效應(yīng)相關(guān),且時變(time-varying)變量的系數(shù)估計值與FE完全相同,故本質(zhì)上為FE模型。在算法上,CRE估計量將時變變量的組平均值加入混合回歸中,故可視為一種控制函數(shù)法(通過時變變量的組平均值來控制遺漏變量)。由于CRE未做組內(nèi)離差變換,故也可以估計出非時變變量的系數(shù),這是CRE的最大優(yōu)點。
向量自回歸(vector autoregressoin,簡記VAR)是常見的時間序列模型,但由于VAR模型的待估參數(shù)較多,故一般需要較長的時間維度。面板向量自回歸(panel vector autogression,簡記Panel VAR)將VAR模型推廣到面板數(shù)據(jù)中。面板VAR模型既包含個體固定效應(yīng),也包括被解釋變量的滯后項,故可視為動態(tài)面板模型(dynamic panel-data model)與VAR模型的結(jié)合。相應(yīng)地,面板VAR模型的估計方法類似于動態(tài)面板,主要使用廣義矩估計(generalized method of moment,簡記GMM)。其漸近理論要求橫截面單位的數(shù)量趨向無窮大,故適用于時間維度較短的短面板。
因果推斷始終是實證研究的核心方法。Stata 19在因果推斷方面的功能也進一步加強,新推出的方法包括條件平均處理效應(yīng)(CATE)以及有關(guān)工具變量法的一些新方法。
因果推斷關(guān)注的對象一般為全樣本的平均處理效應(yīng)(average treatment effect,簡記ATE)或處理組平均處理效應(yīng)(average treatment effect on the treated,簡記ATT或ATET)。然而,不同個體的處理效應(yīng)很可能存在異質(zhì)性,而研究者有時感興趣,異質(zhì)性處理效應(yīng)如何隨著個體特征而變。例如,電商平臺可能關(guān)心價格折扣如何影響消費者行為,而價格折扣的處理效應(yīng)可能依賴于消費者的年齡與收入。
為此,Stata 19推出了全新的cate命令,用于估計“條件平均處理效應(yīng)”(conditional average treatment effect,簡記CATE),即在給定某種個體特征條件下的平均處理效應(yīng)。命令cate可以估計三種不同類型的CATE,包括“個體平均處理效應(yīng)”(individualized average treatment effect),“分組平均處理效應(yīng)”(group?average treatment effect)及“排序分組平均處理效應(yīng)”(sorted group?average treatment effect)。除了估計外,cate系列命令還可進行預測、可視化及統(tǒng)計推斷。
Stata 19的cate命令功能強大、靈活而穩(wěn)健。例如,在對結(jié)果回歸(outcome regression)與處理效應(yīng)模型(treatment models)建模時,可使用參數(shù)模型(parametric models),拉索估計量(lasso)或廣義隨機森林(generalized random forest;有時也稱為“誠實森林”,即honest forest)。該命令提供了兩個穩(wěn)健估計量,即“偏效應(yīng)過濾”(partialling out)與“增強逆概加權(quán)”(augmented inverse probability weighting),其中后者為雙穩(wěn)健估計量(doubly robust estimator);并使用“交叉擬合”(cross-fitting)以避免過擬合(overfitting)。
傳統(tǒng)的工具變量法一般使用二階段最小二乘法(two-stage least squares,簡記2SLS)。2SLS之所以成立,是因為第一階段回歸為線性模型,而線性回歸的OLS估計具有正交性。這也意味著,2SLS一般無法推廣到非線性模型中;例如,當內(nèi)生變量為虛擬變量時,第一階段回歸為Probit模型。
為此,Stata 19新推出了更為靈活的“控制函數(shù)法”(control function approach,簡記CF),不僅可用于線性模型,而且也適用于非線性模型。
使用工具變量法進行因果推斷一般要求強工具變量。在弱工具變量(weak instrument)的情況下,2SLS估計量變得不可靠,即使在大樣本下。這是因為2SLS估計量其實是一個比值(ratio),而在弱工具變量的情況下,該比值的分母接近于0,導致統(tǒng)計推斷失效。
為此,Stata 19推出了安德森-魯賓檢驗(Anderson-Rubin test),不再使用上述比值進行統(tǒng)計推斷,故即使在弱工具變量的情況下依然穩(wěn)健。
Stata 19專門推出了針對時間序列的工具變量法,包括通過工具變量法估計結(jié)構(gòu)VAR模型,以及使用工具變量法估計脈沖響應(yīng)函數(shù)。
Stata 19在貝葉斯計量經(jīng)濟學(Bayesian econometrics)方面的功能繼續(xù)得到加強,新增方法包括貝葉斯變量選擇、分位數(shù)回歸及自助法等。
現(xiàn)在可以使用新的 bayesboot 前綴,通過貝葉斯自助法在小樣本中獲得更精確的參數(shù)估計,并在抽樣時納入先驗信息。它可與官方命令或社區(qū)貢獻命令搭配使用。
使用貝葉斯方法從變量x1-x100中進行變量選擇:
使用貝葉斯方法進行分位數(shù)回歸(quantile regression):
使用貝葉斯自助法(Bayesian bootstrap)估計x的均值:
Stata 19還提供了其他方面的計量新方法,包括久期模型、相關(guān)系數(shù)的元分析、潛類別模型等。
久期模型(duration model)的被解釋變量為某事件存續(xù)的時間,例如失業(yè)持續(xù)時間,病人存活的時長等。在原有久期模型的Stata模塊基礎(chǔ)上(命令均以st開頭),針對存在“區(qū)間刪失”(interval-censored)的多事件數(shù)據(jù)(multiple-events data),Stata 19提供了估計“邊際考克斯比例風險模型”(marginal Cox proportional hazards model)的新命令stmgintcox。
在文獻中,針對同一問題,常常有多項類似的研究,但所得估計結(jié)果不盡相同。如何將這些相似研究的結(jié)果進行整合,以得到統(tǒng)一的結(jié)論,這正是“元分析”(meta-analysis)的目標。在Stata原有的元分析meta命令模塊中,Stata 19新增了對于相關(guān)系數(shù)的元分析功能。相關(guān)系數(shù)無疑是最重要的描述性統(tǒng)計之一。
“潛類別模型”(latent class model)是一種常見的統(tǒng)計模型,它假設(shè)數(shù)據(jù)來自于若干總體(或類別)的混合,故也稱為“有限混合模型”(finite mixture model);例如,三個服從正態(tài)分布的總體按照一定比例的混合。如果知道類別的數(shù)目,則可使用原有的Stata命令gsem(表示generalized structural equation model)進行估計。
Stata 19的Do文件編輯器(Do-file Editor)變得更為強大,新增功能包括:
(1)變量名(variable names)、宏(macros)與存儲結(jié)果(stored results)的自動補全(autocompletion);
(2)方便用戶使用的Do文件編輯器模板(Do-file Editor templates);
(3)對當前詞(current word)在編輯器中的所有出現(xiàn)之處均提供高亮(highlighting),無論大小寫(case-insensitive);并對當前所選內(nèi)容(current selection)在編輯器中的所有出現(xiàn)之處均提供高亮(highlighting),區(qū)分大小寫(case sensitive);
(4)括號高亮(bracket hightlighting),即對包含當前光標的括號(the brackets enclosing the current cursor position)提供高亮;
(5)代碼折疊功能的提升(code folding enhancement),包括新增的菜單欄目(menu items)“Fold all”(折疊全部可折疊代碼), “Unfold all”(展開所有已折疊代碼)與“Fold selection”(折疊所選內(nèi)容)。
Stata 19的畫圖功能也變得更為強大,新增功能包括:
(1)通過新增命令twoway heatmap畫熱圖(heat maps),即在變量(x, y)取值的網(wǎng)格上,以小方塊的顏色變化來表示對應(yīng)變量z的取值高低。
(2)通過新增命令twoway rpspikes畫“刺形”的點圖或范圍圖(plot points and ranges indicated by spikes),例如展示某統(tǒng)計量及其相應(yīng)的置信區(qū)間。
(3)通過新增命令twoway rpcaps畫“帶帽刺形”的點圖或范圍圖(plot points and ranges indicated by?spikes with caps),例如展示某統(tǒng)計量及其相應(yīng)的置信區(qū)間。
(4)在使用命令graph bar畫柱狀圖/條形圖(bar plot)時,可畫樣本均值及其置信區(qū)間,以及在標簽與控制條形分組方面的改進(improved labelling, and control of bar groupings)。
(5)在使用命令graph dot畫點狀圖(dot chart)時,可畫樣本均值及其置信區(qū)間,以及在標簽與控制點狀分組方面的改進(improved labelling, and control of dot groupings)。
(6)在使用命令graph box畫箱形圖(box plot)時,改進了標簽與對箱形分組的控制(improved labelling, and control of box groupings)。
(7)根據(jù)變量上色(colors by variable)的選擇項colorvar(),可適用于更多的twoway plot命令,包括line, connected, tsline, rconnected及tsrline等。
Stata 19的制表功能也得以進一步提升,可更方便地創(chuàng)建與定制表格
(1)Stata的制表命令table新增了增加標題的選擇項title(),增加腳注的選擇項note(),以及將表格導出為指定文件格式(例如Word, LaTex, Excel等)的選擇項export()。
(2)更簡便的方差分析表格(easier ANOVA tables)。
快!精準!易于使用! Stata是一個完整的集成軟件包,可提供您的所有數(shù)據(jù)科學需求 - 數(shù)據(jù)處理,可視化,統(tǒng)計和自動報告。
掌握您的數(shù)據(jù)
廣泛的統(tǒng)計功能
出版質(zhì)量的圖形
自動報告
真正可重復的研究
PyStata — Python 集成
真實文檔
值得信賴
簡單易用
易于掌握
易于自動化
易于擴展
高級編程
自動多核支持
跨平臺兼容
世界一流的技術(shù)支持
Stata的數(shù)據(jù)管理功能如下:
同時管理多個數(shù)據(jù)集
Import, export
JDBC, ODBC, SQL
排序,匹配,合并,加入,追加,創(chuàng)建
內(nèi)置電子表格
unicode
處理文本或二進制數(shù)據(jù)
在本地或在Web上訪問數(shù)據(jù)
收集組間的統(tǒng)計信息
BLOBs -strings可以容納整個文檔
數(shù)十億個觀測值
數(shù)萬個變量數(shù)
生存數(shù)據(jù), 面板數(shù)據(jù), 多級數(shù)據(jù), 調(diào)查數(shù)據(jù), 多重插補數(shù)據(jù), 分類數(shù)據(jù), 時間序列數(shù)據(jù)
更重要的是,支持您的所有數(shù)據(jù)科學需求。
Stata可以輕松生成出版品質(zhì),風格獨特的圖形。
您可以指向并單擊以創(chuàng)建自定義圖形?;蛘?,您可以編寫腳本以可重現(xiàn)的方式生成數(shù)百或數(shù)千個圖形。將圖形導出為EPS或TIFF進行發(fā)布,導出為PNG或SVG進行Web導出,或者導出為PDF進行查看。使用集成的Graph Editor,您可以單擊以更改有關(guān)圖形的任何內(nèi)容或添加標題,注釋,線條,箭頭和文本。
自動報告結(jié)果所需的所有工具 。
動態(tài)Markdown文檔
創(chuàng)建Word文檔
創(chuàng)建PDF文檔
創(chuàng)建Excel文件
可定制的表格
圖形方案
Word,HTML,PDF,SVG,PNG
很多人談?wù)摽芍貜偷难芯俊?
Stata 已經(jīng)致力于它超過40年。
我們不斷添加新功能; 我們甚至從根本上改變了語言元素。不管。Stata 是唯一具有集成版本控制的統(tǒng)計軟件包。如果你在1985年編寫了一個腳本來執(zhí)行分析,那么同樣的腳本仍然可以運行,并且今天仍會產(chǎn)生相同的結(jié)果。您在1985年創(chuàng)建的任何數(shù)據(jù)集,今天都可以閱讀。在2050年也是如此.Stata 將能夠運行你今天所做的任何事情。
以交互方式調(diào)用Python或?qū)ython嵌入到您的Stata代碼中。
從Python調(diào)用Stata并從IPython環(huán)境調(diào)用Stata代碼。
在Jupyter Notebook中使用Stata。
在Stata和Python之間無縫傳遞數(shù)據(jù)和結(jié)果。
從Python內(nèi)部使用Stata分析。
在Stata中使用任何Python包
Matplotlib和Seaborn進行可視化
美麗的湯和Scrapy用于網(wǎng)頁抓取
NumPy和熊貓進行數(shù)值分析
TensorFlow和scikit-learn用于機器學習
以及更多
我們的每個數(shù)據(jù)管理功能都經(jīng)過充分解釋和記錄,并在實際示例中顯示。每個估算器都有完整的文檔記錄,包括幾個關(guān)于實際數(shù)據(jù)的示例,以及如何解釋結(jié)果的真實討論。這些示例為您提供數(shù)據(jù),以便您可以在 Stata 中工作甚至擴展分析。我們?yōu)槟峁┟總€功能的快速入門,展示一些最常見的用途。想要更多細節(jié)?我們的方法和公式部分提供了計算內(nèi)容的具體信息,我們的參考文獻為您提供了更多信息。 Stata 是一個很大的包,所以有很多文檔 - 超過19,000頁,共36卷。但不要擔心,鍵入 help ,Stata 將搜索其關(guān)鍵字,索引,甚至社區(qū)提供的包,為您帶來您需要了解的主題。一切都在Stata內(nèi)可用。
我們不僅編程統(tǒng)計方法,還對它們進行驗證。
您從 Stata 估算器看到的結(jié)果取決于與其他估算器的比較,一致性和覆蓋率的蒙特卡洛模擬以及我們的統(tǒng)計人員進行的廣泛測試。我們運送的每一個Stata都通過了一套認證套件 ,其中包括410萬行測試代碼,可產(chǎn)生600萬行輸出。我們對600萬行輸出中的每個數(shù)字和一段文本進行認證。
Stata 的所有功能都可以通過 菜單,對話框,控制面板,數(shù)據(jù)編輯器,變量管理器,圖形編輯器甚至 SEM 圖形生成器來訪問。您可以通過任何分析指向并單擊您的方式。
如果您不想編寫命令和腳本,則不必這樣做。
即使您指向并單擊,也可以記錄所有結(jié)果,然后將其包含在報告中。您甚至可以保存您的操作創(chuàng)建的命令,并在以后重現(xiàn)您的完整分析。
Stata 執(zhí)行任務(wù)的命令直觀易學。更好的是,您從執(zhí)行任務(wù)中學到的所有知識都可以應(yīng)用于其他任務(wù)。例如,您只需在任何命令中添加“ gender =“ =” female“,即可將分析范圍限制為樣本中的女性。您只需將 vce(robust)添加到任何估計量中,即可獲得對許多常見假設(shè)都具有魯棒性的標準誤差和假設(shè)檢驗。
一致性更加深入。您從數(shù)據(jù)管理命令中學到的知識通常適用于估算命令,反之亦然。還有一整套后估計命令,用于執(zhí)行假設(shè)檢驗,形成線性和非線性組合,進行預測,形成對比,甚至使用交互作用圖執(zhí)行邊際分析。在幾乎每個估算器之后,這些命令都以相同的方式工作。
排序命令以讀取和清除數(shù)據(jù),然后執(zhí)行統(tǒng)計測試和估計,最后報告結(jié)果是可重復研究的核心。Stata 使所有研究人員都可以訪問此過程。
每個人都有他們一直在做的任務(wù) - 創(chuàng)建特定類型的變量,生成特定的表,執(zhí)行一系列統(tǒng)計步驟,計算 RMSE 等??赡苄允菬o窮無盡的。Stata 有數(shù)千個內(nèi)置程序,但可能擁有相對獨特的任務(wù)或者您希望以特定方式完成的任務(wù)。
如果您編寫了一個腳本來執(zhí)行給定數(shù)據(jù)集上的任務(wù),則可以輕松地將該腳本轉(zhuǎn)換為可用于所有數(shù)據(jù)集,任何變量集以及任何觀察集的內(nèi)容。
自動化的一些內(nèi)容可能非常實用。只需一點代碼,就可以將自動化腳本轉(zhuǎn)換為 Stata 命令。支持 Stata 官方命令支持的標準功能的命令。可以與使用官方命令相同的方式使用的命令。
Stata 還包括一種高級編程語言-Mata。
Mata 具有您期望在編程語言中使用的結(jié)構(gòu),指針和類,并為矩陣編程添加了直接支持。
Mata 既是一個用于操作矩陣的交互式環(huán)境,也是一個可以生成編譯和優(yōu)化代碼的完整開發(fā)環(huán)境。它包括處理面板數(shù)據(jù)的特殊功能,對實際或復雜矩陣執(zhí)行操作,為面向?qū)ο缶幊烫峁┤嬷С?,并與 Stata 的各個方面完全集成。
充分利用您的多核計算機。
沒有其他統(tǒng)計軟件可以與之匹敵。
以最快的速度享受 Stata 19的新功能。
Stata 將在 Windows,Mac 和 Linux / Unix 計算機上運行;但是,我們的許可證不是特定于平臺的。
這意味著,如果您有一臺 Mac 筆記本電腦和 Windows 臺式機,則不需要兩個單獨的許可證即可運行Stata。您可以在任何受支持的平臺上安裝 Stata 許可證。Stata 數(shù)據(jù)集,程序和其他數(shù)據(jù)可以在不進行翻譯的情況下跨平臺共享。您還可以快速輕松地從其他統(tǒng)計數(shù)據(jù)包,電子表格和數(shù)據(jù)庫中導入數(shù)據(jù)集。
Stata/MP, Stata/SE, Stata/BE 三個版本
Stata/MP : 最快的 Stata 版本(四核,雙核和多核/多處理器計算機),可以分析最大的數(shù)據(jù)集。
Stata/SE : 標準版; 對于更大的數(shù)據(jù)集。
Stata/BE : 基礎(chǔ)版; 用于中型數(shù)據(jù)集。
Stata/SE 和 Stata/BE 的區(qū)別僅在于每個數(shù)據(jù)集可以分析的數(shù)據(jù)集大小不同。與 Stata/BE(最多798個)相比,Stata/SE(最多10,998個)和 Stata/MP(最多65,532個)可以擬合具有更多自變量的模型。Stata/SE 最多可以分析20億個觀測值。
Stata/BE 允許具有多達2,048個變量和20億個觀測值的數(shù)據(jù)集。一個模型中的 Stata/BE 最多可包含798個獨立變量。
Stata/MP 是最快,最大的 Stata 版本。實際上,當前任何一臺計算機都可以利用 Stata/MP 的高級多處理功能。這包括Intel i3, i5, i7, i9, Xeon, Celeron, and AMD multi-core chips。在雙核芯片上,根據(jù)耗時的估算命令,Stata/MP的總體運行速度提高40%,在重要的位置運行速度提高72%。Stata / MP具有兩個以上的內(nèi)核或處理器,速度甚至更快。
Stata MP,Stata/SE和Stata/BE均可在任何計算機上運行,??但Stata/MP的運行速度更快。您可以購買Stata/MP許可證,最多可獲取計算機上的內(nèi)核數(shù)量(最多64個)。例如,如果您的計算機具有八個核心,則可以為八個核心,四個核心或兩個核心購買Stata/MP許可證。
Stata/MP還可以分析比其他任何版本的Stata更多的數(shù)據(jù)。如果使用當前最大的計算機,Stata/MP可以分析100到200億個觀測值,并且一旦計算機硬件趕上來,就可以分析多達1萬億個觀測值。
在執(zhí)行計算密集型估計程序時,速度通常是最關(guān)鍵的。包括線性回歸在內(nèi)的一些 Stata 估計程序幾乎是完全并行的,這意味著它們在兩個內(nèi)核上的運行速度是原來的兩倍,在四個內(nèi)核上的運行速度是原來的四倍,在八個內(nèi)核上的運行速度是其八倍,等等。一些估計命令可以比其他命令更多地并行化。以中位數(shù)計算,估計命令在 2 核上的運行速度快 1.7 倍,在 4 核上快 2.6 倍,在 8 核上快 3.4 倍。
在管理大型數(shù)據(jù)集時,速度也很重要。添加新變量幾乎可實現(xiàn) 100% 并行計算,而排序時的并行計算可到達 61% 。
Product features |
![]() |
![]() |
![]() |
||||
(Basic Edition) | (Standard Edition) |
|
|||||
|
Up to 2,048 variables | Up to 32,767 variables | Up to 120,000 variables | ||||
|
2.14 billion | 2.14 billion | Up to 20 billion | ||||
|
Fast | Fast |
|
||||
|
20 seconds | 20 seconds |
|
||||
|
798 | 10,998 | 65,532 | ||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
1 GB | 2 GB |
|
||||
|
4 GB | 4 GB |
|
點擊列表鏈接查看視頻功能演示 |
|
Lasso|套索估計量 Reproducible reporting|研究報告的可重復性 Meta-Analysis|元分析 Choice Models|選擇模型 Python Integration|Python集成 Bayes—multiple chains, more|貝葉斯分析新功能 Panel-data ERMs|面板數(shù)據(jù)ERM Import Data from SAS and SPSS |從SAS和SPSS導入數(shù)據(jù) Nonparametric series regression |非參數(shù)序列回歸 Frames — multiple datasets in memory|幀-內(nèi)存中的多個數(shù)據(jù)集 Panel-data mixed logit | 面板數(shù)據(jù) |
Nonlinear DSGE models|非線性 DSGE 模型 Multiple-group IRT | 多組IRT xtheckman|xtheckman新命令 NLMEMs with lags: PK models | PK模型 Heteroskedastic ordered probit | 異方差有序概率 Point sizes for graphics | 圖形 Numerical integration Linear programming | 線性回歸 Mac interface | Mac介面 Do-file Editor autocompletion |do 文件編輯器 Sample-size analysis for CIs |
功能名稱 | 功能介紹 |
線性模型 (Linear models) |
regression ? censored outcomes ? endogenous regressors ? bootstrap, jackknife, and robust and cluster–robust variance ? instrumental variables ? three-stage least squares ? constraints ? quantile regression ? GLS ? DID ? more |
面板/縱向數(shù)據(jù) (Panel/longitudinal data) |
random and fixed effects with robust standard errors ? linear mixed models ? random-effects probit ? GEE ? random- and fixed-effects Poisson ? dynamic panel-data models ? instrumental variables ? DID ? panel unit-root tests ? more |
多級混合效應(yīng)模型 (Multilevel mixed-effects models) |
continuous, binary, count, and survival outcomes ? two-, three-, and higher-level models ? generalized linear models ? nonlinear models ? random intercepts ? random slopes ? crossed random effects ? BLUPs of effects and fitted values ? hierarchical models ? residual error structures ? DDF adjustments ? support for survey data ? more |
二進制、計數(shù)和有限結(jié)果 (Binary, count, and limited outcomes) |
logistic, probit, tobit ? Poisson and negative binomial ? conditional, multinomial, nested, ordered, rank-ordered, and stereotype logistic ? multinomial probit ? zero-inflated and left-truncated models ? selection models ? marginal effects ? more |
選擇模型 (Choice models) |
discrete choice ? rank-ordered alternatives ? conditional logit ? multinomial probit ? nested logit ? mixed logit ? panel data ? case-specific and alternative-specific predictors ? interpret results—expected probabilities, covariate effects, comparisons across alternatives ? more |
擴展回歸模型(ERMs) (Extended regression models (ERMs)) |
endogenous covariates ? sample selection ? nonrandom treatment ? panel data ? account for problems alone or in combination ? continuous, interval-censored, binary, and ordinal outcomes ? more |
廣義線性模型(GLMs) (Generalized linear models (GLMs)) |
ten link functions ? user-defined links ? seven distributions ? ML and IRLS estimation ? nine variance estimators ? seven residuals ? more |
有限混合模型(FMMs) (Finite mixture models (FMMs)) |
fmm: prefix for 17 estimators ? mixtures of a single estimator ? mixtures combining multiple estimators or distributions ? continuous, binary, count, ordinal, categorical, censored, truncated, and survival outcomes ? more |
空間自回歸模型 (Spatial autoregressive models) |
spatial lags of dependent variable, independent variables, and autoregressive errors ? fixed and random effects in panel data ? endogenous covariates ? analyze spillover effects ? more |
方差分析/多變量方差分析 (ANOVA/MANOVA) |
balanced and unbalanced designs ? factorial, nested, and mixed designs ? repeated measures ? marginal means ? contrasts ? more |
精確統(tǒng)計 (Exact statistics) |
standardization of rates ? case–control ? cohort ? matched case–control ? Mantel–Haenszel ? pharmacokinetics ? ROC analysis ? ICD-10 ? more |
流行病學 (Epidemiology) |
standardization of rates ? case–control ? cohort ? matched case–control ? Mantel–Haenszel ? pharmacokinetics ? ROC analysis ? ICD-10 ? more |
動態(tài)隨機一般均衡模型 (DSGE models) |
specify models algebraically ? solve models ? estimate parameters ? identification diagnostics ? policy and transition matrices ? IRFs ? dynamic forecasts ? Bayesian ? more |
測試、預測和結(jié)果 (Tests, predictions, and effects) |
Wald tests ? LR tests ? linear and nonlinear combinations ? predictions and generalized predictions ? marginal means ? least-squares means ? adjusted means ? marginal and partial effects ? forecast models ? Hausman tests ? more |
差異、成對比較和差數(shù) (Contrasts, pairwise comparisons, and margins) |
compare means, intercepts, or slopes ? compare with reference category, adjacent category, grand mean, etc. ? orthogonal polynomials ? multiple-comparison adjustments ? graph estimated means and contrasts ? interaction plots ? more |
再抽樣及模擬方法 (Resampling and simulation methods) |
bootstrap ? jackknife ? Monte Carlo simulation ? permutation tests ? exact p-values ? more |
多變量方法 (Multivariate methods) |
factor analysis ? principal components ? discriminant analysis ? rotation ? multidimensional scaling ? Procrustean analysis ? correspondence analysis ? biplots ? dendrograms ? user-extensible analyses ? more |
時間序列 (Time series) |
ARIMA ? ARFIMA ? ARCH/GARCH ? VAR ? VECM ? multivariate GARCH ? unobserved-components model ? dynamic factors ? state-space models ? Markov-switching models ? business calendars ? tests for structural breaks ? threshold regression ? forecasts ? impulse–response functions ? unit-root tests ? filters and smoothers ? rolling and recursive estimation ? Bayesian ? more |
生存分析 (Survival analysis) |
Kaplan–Meier and Nelson–Aalen estimators, ? Cox regression (frailty) ? parametric models (frailty, random effects) ? competing risks ? hazards ? time-varying covariates ? left-, right-, and interval-censoring ? Weibull, exponential, and Gompertz models ? more |
貝葉斯分析 (Bayesian analysis) |
thousands of built-in models ? univariate and multivariate models ? linear and nonlinear models ? panel data ? multilevel models ? VAR ? DSGE ? continuous, binary, ordinal, and count outcomes ? bayes: prefix for 58 estimation commands ? continuous univariate, multivariate, and discrete priors ? add your own models ? multiple chains ? convergence diagnostics ? posterior summaries ? hypothesis testing ? model fit ? model comparison ? predictions ? dynamic forecast ? impulse-response functions ? more |
元分析 (Meta-analysis) |
effect sizes ? common, fixed, and random effects ? forest, funnel, and more plots ? subgroup, leave-one-out, and cumulative analysis ? meta-regression ? small-study effects ? publication bias ? multivariate ? more |
功效、精度和樣本大小 (Power, precision, and sample size) |
power ? sample size ? effect size ? minimum detectable effect ? CI width ? means ? proportions ? variances ? correlations ? ANOVA ? regression ? cluster randomized designs ? case–control studies ? cohort studies ? contingency tables ? survival analysis ? balanced or unbalanced designs ? results in tables or graphs ? more |
治療效果/因果推斷 (Treatment effects/Causal inference) |
inverse probability weight (IPW) ? doubly robust methods ? propensity-score matching ? regression adjustment ? covariate matching ? DID ? multilevel treatments ? endogenous treatments ? average treatment effects (ATEs) ? ATEs on the treated (ATETs) ? potential-outcome means (POMs) ? continuous, binary, count, fractional, and survival outcomes ? panel data ? lasso ? more |
Lasso回歸模型 (Lasso) |
lasso ? elastic net ? model selection ? prediction ? inference ? continuous, binary, and count outcomes ? cross-validation ? adaptive lasso ? double selection ? partialing out ? cross-fit partialing out ? double machine learning ? endogenous covariates ? treatment effects ? more |
結(jié)構(gòu)方程模型(SEM) (SEM (structural equation modeling)) |
graphical path diagram builder ? standardized and unstandardized estimates ? modification indices ? direct and indirect effects ? continuous, binary, count, ordinal, and survival outcomes ? multilevel models ? random slopes and intercepts ? factor scores, empirical Bayes, and other predictions ? groups and tests of invariance ? goodness of fit ? handles MAR data by FIML ? correlated data ? survey data ? more |
潛伏組分析 (Latent class analysis) |
binary, ordinal, continuous, count, categorical, fractional, and survival items ? add covariates to model class membership ? combine with SEM path models ? expected class proportions ? goodness of fit ? predictions of class membership ? more |
多重估算 (Multiple imputation) |
nine univariate imputation methods ? multivariate normal imputation ? chained equations ? explore pattern of missingness ? manage imputed datasets ? fit model and pool results ? transform parameters ? joint tests of parameter estimates ? predictions ? more |
調(diào)查方法 (Survey methods) |
multistage designs ? bootstrap, BRR, jackknife, linearized, and SDR variance estimation ? poststratification ? raking ? calibration ? DEFF ? predictive margins ? means, proportions, ratios, totals ? summary tables ? almost all estimators supported ? more |
聚類分析 (Cluster analysis) |
hierarchical clustering ? kmeans and kmedian nonhierarchical clustering ? dendrograms ? stopping rules ? user-extensible analyses ? more |
項目反應(yīng)理論(IRT) (IRT (item response theory)) |
binary (1PL, 2PL, 3PL), ordinal, and categorical response models ? item characteristic curves ? test characteristic curves ? item information functions ? test information functions ? multiple-group models ? differential item functioning (DIF) ? more |
網(wǎng)絡(luò)分析 (Network analysis) |
nwcommands: import and manipulate networks ? generate networks ? calculate centrality and dissimilarity measures ? visualize networks ? more |
數(shù)據(jù)[資料]管理 (Data manipulation) |
data transformations ? data frames ? match-merge ? import/export data ? JDBC ? ODBC ? SQL ? Unicode ? by-group processing ? append files ? sort ? row–column transposition ? labeling ? save results ? more |
報表 (Reporting) |
reproducible reports ? customizable tables ? graphical tables builder ? Word ? Excel ? PDF ? HTML ? dynamic documents ? Markdown ? Stata results and graphs ? SVG ? EPS ? PNG ? TIF ? more |
繪圖 (Graphics) |
lines ? bars ? areas ? ranges ? contours ? confidence intervals ? interaction plots ? survival plots ? publication quality ? customize anything ? Graph Editor ? more |
編程特點 (Programming features) |
adding new commands ? scripting ? object-oriented programming ? menu and dialog-box programming ? dynamic documents ? Markdown ? Project Manager ? Python integration ? PyStata ? Jupyter notebook ? Java integration ? Java plugins ? H2O access ? C/C++ plugins ? more |
矩陣編程 Mata—Stata重要編程語言 (Mata—Stata's serious programming language) |
interactive sessions ? large-scale development projects ? optimization ? matrix inversions ? decompositions ? eigenvalues and eigenvectors ? LAPACK engine ? Intel? MKL ? real and complex numbers ? string matrices ? interface to Stata datasets and matrices ? numerical derivatives ? object-oriented programming ? more |
圖形用戶界面 (Graphical user interface) |
menus and dialogs for all features ? Data Editor ? Variables Manager ? Graph Editor ? Project Manager ? Do-file Editor ? multiple preference sets ? more |
參考資料 (Documentation) |
35 manuals ? 18,000+ pages ? seamless navigation ? thousands of worked examples ? quick starts ? methods and formulas ? references ? more |
基本統(tǒng)計 (Basic statistics) |
summaries ? cross-tabulations ? correlations ? z and t tests ? equality-of-variance tests ? tests of proportions ? confidence intervals ? factor variables ? more |
非參數(shù)方法 (Nonparametric methods) |
nonparametric regression ? Wilcoxon–Mann–Whitney, Wilcoxon signed ranks, and Kruskal–Wallis tests ? Cochran–Armitage and other trend tests ? Spearman and Kendall correlations ? Kolmogorov–Smirnov tests ? exact binomial CIs ? survival data ? ROC analysis ? smoothing ? bootstrapping ? more |
GMM與非線性回歸 (GMM and nonlinear regression) |
generalized method of moments (GMM) ? nonlinear regression ? more |
簡單最大概似法 (Simple maximum likelihood) |
specify likelihood using simple expressions ? no programming required ? survey data ? standard, robust, bootstrap, and jackknife SEs ? matrix estimators ? more |
可編程最大概似法 (Programmable maximum likelihood) |
user-specified functions ? NR, DFP, BFGS, BHHH ? OIM, OPG, robust, bootstrap, and jackknife SEs ? Wald tests ? survey data ? numeric or analytic derivatives ? more |
其他統(tǒng)計方法 (Other statistical methods) |
kappa measure of interrater agreement ? Cronbach's alpha ? stepwise regression ? tests of normality ? more |
函數(shù) (Functions) |
statistical ? random-number ? mathematical ? string ? date and time ? regular expressions ? Unicode ? more |
互聯(lián)網(wǎng)功能 (Internet capabilities) |
search and download thousands of community-contributed features (see below) ? web updating ? web file sharing ? latest Stata news ? more |
網(wǎng)絡(luò)社區(qū)功能 (Community-contributed features) |
search and download thousands of free additions ? discover new features in the Stata Journal ? share commands by posting to the SSC ? discuss community-contributed features on Statalist ? more |
嵌入式統(tǒng)計計算 (Embedded statistical computations) |
Numerics by Stata ? more |
安裝驗證 (Installation Qualification) |
IQ report for regulatory agencies such as the FDA ? installation verification ? more |
FDA規(guī)則 (FDA Compliance) |
Adherence to FDA regulatory requirement for statistical software ? more |
無障礙訪問 (Accessibility) |
Section 508 compliance, accessibility for persons with disabilities ? more |
樣本范例 (Sample session) |
A sample session of Stata for Mac, Unix, or Windows. |
1. 表格 (Tables)
用戶一直希望我們提供更完美的表格,現(xiàn)在您可以很容易地創(chuàng)建比較回歸結(jié)果或匯總統(tǒng)計數(shù)據(jù)的表格,您可以創(chuàng)建樣式并將其應(yīng)用于您構(gòu)建的任何表,還可以將表導出到MS Word?, PDF, HTML, LaTeX, MS Excel?, 并將它們插入到報告中。新版本修改了table命令,新的 collective 前綴可以從任意多個命令收集任意多的結(jié)果,生成表格,并將其導出為多種格式等。您還可以使用新的Tables Builder來單擊并創(chuàng)建表格。
2. 貝葉斯計量經(jīng)濟學
Stata能進行計量經(jīng)濟學,也能進行貝葉斯統(tǒng)計,現(xiàn)在Stata能夠進行貝葉斯計量經(jīng)濟學!想要用概率性的陳述來回答經(jīng)濟問題,例如:那些參加職業(yè)培訓項目的人在未來五年里更有可能保持就業(yè)嗎?想把對經(jīng)濟過程的先驗知識結(jié)合起來嗎?Stata新推出的貝葉斯計量經(jīng)濟學功能可以幫到您。適合許多貝葉斯模型,如橫截面模型、面板數(shù)據(jù)模型、多層模型和時間序列模型。使用貝葉斯因子比較模型,獲取更多預測和展望!
在計量經(jīng)濟學建模中使用貝葉斯方法的吸引力之一是將關(guān)于通常在實踐中可用的模型參數(shù)的外部信息納入其中。這些信息可能來自歷史數(shù)據(jù),也可能自然來自經(jīng)濟過程的知識。無論哪種方式,貝葉斯方法都可以使我們將外部信息與我們在當前數(shù)據(jù)中觀察到的信息結(jié)合起來,以形成對感興趣的經(jīng)濟過程的更現(xiàn)實的看法。
Stata 17 在貝葉斯計量經(jīng)濟學領(lǐng)域提供了幾個新功能:
> Bayesian VAR models /貝葉斯VAR模型
> Bayesian IRF and FEVD analysis /貝葉斯IRF和FEVD分析
> Bayesian dynamic forecasting /貝葉斯動態(tài)預測
> Bayesian longitudinal/panel-data models /貝葉斯縱向/面板數(shù)據(jù)模型
> Bayesian linear and nonlinear DSGE models /貝葉斯線性與非線性DSGE模型
3. 更快的Stata
4. 雙重差分(DID)和DDD模型
新的估計命令didregress和xtdidregress具有使用重復測量數(shù)據(jù)擬合雙重差分(DID)模型和三重差分(DDD)模型。 didregress適用于重復橫截面數(shù)據(jù),xtdidregress適用于縱向/面板數(shù)據(jù)。
采用DID和DDD模型,用重復測量數(shù)據(jù)估計平均治療效果(ATET)。 治療效果可以是藥物方案對血壓的影響,也可以是培訓計劃對就業(yè)的影響。 與現(xiàn)有的teffects命令可用的標準橫截面分析不同,DID分析可控制估計ATET時的組和時間效應(yīng),組可在其中識別重復的度量。DDD分析控件可控制其他組效果及其與時間的相互作用——您最多可以指定三個組變量或兩個組變量和一個時間變量。
5. 區(qū)間刪失Cox模型
半?yún)?shù)Cox比例風險回歸模型通常用于分析未刪失和右刪失的事件時間數(shù)據(jù)。 新的估計命令stintcox可使用Cox模型,來估計刪失事件時間數(shù)據(jù)。當未直接觀察到發(fā)生某個事件(例如癌癥復發(fā))的時間,但已知該時間間隔在某個時間間隔內(nèi)時,便會進行時間間隔檢查。例如,可以在定期檢查之間檢測到癌癥的復發(fā),但是無法觀察到確切的復發(fā)時間。我們只知道在先前檢查和當前檢查之間的某個時間復發(fā)了癌癥。忽略區(qū)間刪失可能會導致錯誤的結(jié)果(有偏差的)。
當沒有完全指定基線風險函數(shù)時,對區(qū)間刪失事件時間數(shù)據(jù)進行半?yún)?shù)估計是一項挑戰(zhàn),因為沒有一個事件時間是被精確地觀測到的。
因此,這些數(shù)據(jù)的“半?yún)?shù)”建模通常采用樣條方法或分段指數(shù)模型作為基線風險函數(shù)。直到最近的方法學進展(在stintcox命令中實現(xiàn))之后,才提供真正的區(qū)間刪失事件時間數(shù)據(jù)的半?yún)?shù)建模。
6. 多維元分析
您想分析多項研究的結(jié)果。這些研究報告了多個效應(yīng)量,這些效應(yīng)量很可能在一項研究中相互關(guān)聯(lián)。單獨的meta分析(例如使用現(xiàn)有meta命令的那些meta分析)將忽略相關(guān)性?,F(xiàn)在,您可以使用新的meta mvregress命令執(zhí)行多維元分析,這將解釋相關(guān)性。
7. 貝葉斯VAR模型
貝葉斯前綴現(xiàn)在支持var命令以擬合貝葉斯矢量自回歸(VAR)模型。VAR模型通過將結(jié)果變量的滯后時間作為模型預測變量來研究多個時間序列之間的關(guān)系。已知這些模型具有許多參數(shù):對于K個結(jié)果變量和標記,至少存在p(K ^ 2 + \ nn1)個參數(shù)。對模型參數(shù)的可靠估計可能會遇到挑戰(zhàn),尤其是在使用小型數(shù)據(jù)集的情況下。貝葉斯VAR模型通過整合有關(guān)模型參數(shù)的先驗信息來穩(wěn)定參數(shù)估計,從而克服了這些挑戰(zhàn)。
8. PyStata
Stata 17引入了一個我們稱之為PyStata的概念。PyStata是一個涵蓋了Stata和Python可以交互的所有方式的術(shù)語。
Stata 16具有從Stata調(diào)用Python代碼的功能。Stata 17允許您通過一個新的pystata Python包從一個獨立的Python環(huán)境中調(diào)用Stata,從而極大地擴展了此功能。您可以在基于IPython內(nèi)核的環(huán)境(例如Jupyter Notebook和控制臺以及Jupyter Lab和控制臺)中方便地訪問Stata和Mata。
在其他支持IPython內(nèi)核的環(huán)境中(例如,Spyder IDE和PyCharm IDE);或從命令行訪問Python(例如Windows命令提示符,macOS終端,Unix終端和Python的IDLE)時。
9. Lasso治療效果評估
您可以使用teffects 來估計治療效果。您可以使用Lasso來控制許多協(xié)變量。(當我們說“很多”時,可以理解為成百上千甚至更多?。┈F(xiàn)在,您可以使用telasso來估計治療效果并控制許多協(xié)變量。
10. Galbraith圖
新命令meta galbraithplot生成Galbraith圖以進行元分析。這些圖可用于評估研究的異質(zhì)性和檢測潛在的異常值。當有許多研究時,它們還可以用作森林圖forest plots的替代方案,以總結(jié)元分析結(jié)果。
11. 留一元分析
現(xiàn)在,您可以通過使用meta summarize和meta forestplot的新選項leaoneout來執(zhí)行留一元分析。留一元分析通過在每次分析中排除一項研究來執(zhí)行多種元分析。研究通常會產(chǎn)生夸大的效應(yīng)大小,這可能會扭曲整體結(jié)果。留一元分析可用于研究每項研究對總體效應(yīng)量估計的影響,并確定有影響力的研究。
12. 貝葉斯縱向/面板模型
通過使用xtreg表示連續(xù)結(jié)果,xtlogit或xtprobit表示二進制結(jié)果,xtologit或xtoprobit表示序數(shù)結(jié)果等,可以擬合隨機效應(yīng)面板數(shù)據(jù)模型。在Stata 17中,您可以簡單地通過在它們前面加上Bayes前綴來擬合這些模型的Bayesian版本。
13. 面板多項邏輯模型
Stata的新估計命令xtmlogit可使用面板多項邏輯(MNL)模型,以對隨時間推移觀察到的分類結(jié)果進行分類。假設(shè)我們手機了幾個星期關(guān)于個人對餐館選擇的數(shù)據(jù)。餐館的選擇是沒有自然排序的分類結(jié)果,因此我們可以使用現(xiàn)有的mlogit命令(帶有聚類穩(wěn)健的標準誤)。但是xtmlogit直接對單個特征建模,因此可能會產(chǎn)生更有效的結(jié)果。并且它可以很好地解釋可能與協(xié)變量相關(guān)的特征。
14. 零膨脹排序邏輯模型
新的估計命令ziologit適合零膨脹排序邏輯回歸模型。這個模型是在當數(shù)據(jù)在最低類別中的觀測值比例高于標準有序邏輯模型的預期值時使用的。我們將最低類別中的觀測值稱為零,因為它們通常對應(yīng)于某一行為或特征的缺失。零膨脹是通過假設(shè)零同時來自邏輯模型和有序邏輯模型來解釋的。每個模型可以具有不同的協(xié)變量,并且結(jié)果可以顯示為優(yōu)勢比而不是默認系數(shù)。
15. 貝葉斯多層次模型:非線性、聯(lián)合、類SEM等
您可以使用bayesmh命令的新的精美隨機效果語法來擬合貝葉斯多級模型的廣度。您可以更輕松地擬合單變量線性和非線性多級模型?,F(xiàn)在,您可以擬合多元線性和非線性多級模型!考慮增長線性和非線性多級模型,聯(lián)合縱向和生存時間模型,SEM型模型等等。
16. 貝葉斯動態(tài)預測
在擬合多元時間序列模型(例如向量自回歸(VAR)模型)之外,動態(tài)預測是一種常見的預測工具。擬合經(jīng)典var模型后,可以使用fcast計算動態(tài)預測。 使用bayes:var擬合貝葉斯var模型后,現(xiàn)在可以使用bayesfcast 來計算貝葉斯動態(tài)預測。貝葉斯動態(tài)預測會生成整個預測值樣本,而不是像傳統(tǒng)分析中那樣生成單個預測。該樣本可用于解答各種建模問題,例如,在估計預測不確定性時,在不做出漸近正態(tài)性假設(shè)的前提下,該模型對未來觀測的預測程度如何。這對于可能會出現(xiàn)漸近正態(tài)性假設(shè)的小型數(shù)據(jù)集尤其有吸引力。
17. 貝葉斯IRF與FEVD分析
脈沖響應(yīng)函數(shù)(IRF),動態(tài)乘數(shù)函數(shù)和預測誤差方差分解(FEVD)通常用于描述多元時間序列模型(例如VAR模型)的結(jié)果。VAR模型具有許多參數(shù),可能難以逐個解釋。 IRFs和其他函數(shù)將多個參數(shù)的影響合并為一個摘要(每個時間段)。例如,IRFs測量一個變量對給定結(jié)果變量的沖擊(變化)的影響。貝葉斯IRFs(和其他函數(shù))使用IRFs的“精確”后驗分布產(chǎn)生結(jié)果,這不依賴于漸近正態(tài)性的假設(shè)。它們還可以為小型數(shù)據(jù)集提供更穩(wěn)定的估計,因為它們合并了有關(guān)模型參數(shù)的先驗信息。
18. 使用 BIC 選擇Lasso懲罰參數(shù)
懲罰參數(shù)的選擇是lasso分析的基礎(chǔ)。套用少量的懲罰可能會包含太多變量。套用較大的懲罰可能會忽略潛在的重要變量。lasso估計已經(jīng)提供了幾種懲罰選擇方法,包括交叉驗證,自適應(yīng)和插件?,F(xiàn)在,您可以使用貝葉斯信息準則(BIC)通過指定selection(bic)選項在Lasso進行預測和Lasso進行推理之后選擇懲罰參數(shù)。同樣,在擬合Lasso模型后,新的后估計命令bicplot將BIC值繪制為懲罰參數(shù)的函數(shù)。這為懲罰參數(shù)的值提供了方便的圖形表示形式,從而使BIC功能最小化。
19. lasso聚類數(shù)據(jù)
現(xiàn)在,您可以在Lasso分析中解釋集群數(shù)據(jù)。忽略聚類可能會導致錯誤結(jié)果,因為同一聚類中的觀測值之間存在相關(guān)性。使用Lasso命令進行Lasso和Elasticnet等預測,您可以指定新的cluster({\ it clustvar})選項。使用Lasso命令進行推斷(例如:poregress),您可以指定新的vce(cluster {\ it clustvar})選項。
20. 貝葉斯線性和非線性DSGE模型
現(xiàn)在,可以通過在dsge和dsgenl前面加上前綴Bayes:來擬合貝葉斯線性和非線性動態(tài)隨機一般均衡(DSGE)模型。通過從30多種不同的先驗分布中進行選擇,合并有關(guān)模型參數(shù)范圍的信息。執(zhí)行貝葉斯IRF分析,執(zhí)行區(qū)間假設(shè)檢驗,使用貝葉斯因子比較模型等等。
21. Jupyter Notebook與Stata
Jupyter Notebook是一個功能強大且易于使用的Web應(yīng)用程序,它允許您將在單個文檔(“筆記本”)中將可執(zhí)行代碼、可視化、數(shù)學方程式和公式、敘述文本以及其他富媒體組合在一起,以進行交互式計算和開發(fā)。 它已被研究人員和科學家廣泛使用,以分享他們的想法和成果,進行協(xié)作和創(chuàng)新。
在Stata 17中,作為PyStat的一部分,您可以使用IPython(交互式Python)內(nèi)核從Jupyter Notebook調(diào)用Stata和Mata。這意味著您可以在一個環(huán)境中結(jié)合使用Python和Stata的功能,以使您的工作易于復制和與他人共享。
從Jupyter Notebook調(diào)用Stata是由新的pystata Python軟件包驅(qū)動的。
22. 日期和時間的新功能
Stata 17增加了新的便利功能,用于處理Stata和Mata中的日期和時間。 新功能可以分為三類:
1.Datetime持續(xù)時間:旨在獲取持續(xù)時間的函數(shù)(例如ages)。
2.相對日期:基于其他日期返回日期的函數(shù),例如相對于給定日期的下一個生日。
3.Datetime組件:從日期時間值中提取不同成分的函數(shù)。
新功能將閏年,閏日和閏秒(如果適用的話)考慮在內(nèi)。
閏秒是一秒的調(diào)整,偶爾會應(yīng)用于協(xié)調(diào)世界時(UTC)。
23. Intel數(shù)學內(nèi)核庫(MKL)
Stata 17引入了在兼容硬件(所有基于Intel和AMD的64位計算機)上使用Intel Math Kernel Library(MKL)的方法,并提供了深度優(yōu)化的LAPACK例程。
LAPACK是線性代數(shù)包的縮寫,它是一套用于求解聯(lián)立方程組、特征值問題和奇值問題等的程序。Mata運算符和函數(shù)(如qrd()、lud()和cholesky())在可能的情況下利用LAPACK進行許多數(shù)值操作。
由英特爾MKL支持的LAPACK提供了最新的LAPACK例程,這些例程針對現(xiàn)代Intel和現(xiàn)代AMD處理器使用的64位Intel x86-64指令集進行了優(yōu)化。使用MKL的Mata函數(shù)和運算符在性能方面大有裨益。最重要的是,您無需采取任何措施即可充分利用速度的提高。使用這些Mata函數(shù)和運算符的Stata命令以及Mata函數(shù)和運算符本身,將在兼容硬件上自動使用Intel MKL。
24. Stata on Apple Silicon
Stata 17 for Mac是一款通用應(yīng)用程序,可以在Apple Silicon和Intel處理器的Mac上運行。采用Apple Silicon的Mac電腦包括新款MacBook Air、MacBook Pro和Mac mini,均采用M1處理器。M1芯片承諾有更高的性能和更大的功能效率。這對于我們的Stata-for-Mac用戶來說是值得注意的,他們中的許多人使用Mac筆記本電腦。
雖然第一套M1 mac被認為是入門級的,但我們發(fā)現(xiàn),本機運行Stata的M1 mac比英特爾mac的性能要好30-35%。它們的性能甚至遠遠超過價格超過兩倍的Intel Mac!對于只堅持在其Apple Silicon Mac上使用Apple-Siliconnative軟件的用戶,從安裝程序到應(yīng)用程序本身,Stata 17的任何部分都不需要用到Rosetta 2。
無論您是在M1 Mac上還是在Intel Mac上本地運行Stata,Stata的功能都相同,并且M1 Mac不需要特殊的許可證。英特爾Mac用戶應(yīng)注意,未來幾年,我們將繼續(xù)支持并發(fā)布適用于英特爾處理器的Mac的新版本Stata。
25. JDBC
將Stata與數(shù)據(jù)庫連接變得更加容易了。Stata 17添加了對JDBC(Java數(shù)據(jù)庫連接)的支持。 新的jdbc命令支持JDBC標準,用于與具有矩形數(shù)據(jù)的關(guān)系數(shù)據(jù)庫或非關(guān)系數(shù)據(jù)庫管理系統(tǒng)交換數(shù)據(jù)。您可以從一些最受歡迎的數(shù)據(jù)庫供應(yīng)商中導入數(shù)據(jù),例如Oracle,MySQL,Amazon Redshift,Snowflake,Microsoft SQL Server等。
jdbc的優(yōu)點在于它是一個跨平臺的解決方案,因此我們的JDBC設(shè)置適用于Windows,Mac和Unix系統(tǒng)。如果您的數(shù)據(jù)庫供應(yīng)商提供了JDBC驅(qū)動程序,則可以下載并安裝該驅(qū)動程序,然后通過jdbc在數(shù)據(jù)庫上讀取,寫入和執(zhí)行SQL。 您可以將整個數(shù)據(jù)庫表加載到Stata中,也可以使用SQL SELECT將表中的特定列加載到Stata中。您還可以將所有變量插入數(shù)據(jù)庫表中,或僅插入數(shù)據(jù)集的子集。
26. Java集成
在Stata 17中,您現(xiàn)在可以直接在Stata中嵌入和執(zhí)行Java代碼。您可以在以前的Stata版本中創(chuàng)建和使用Java插件,但這需要您編譯代碼并將其打包到Jar文件中。在do文件中執(zhí)行Java可以讓您自由地執(zhí)行直接與Stata代碼綁定的Java代碼?,F(xiàn)在,您可以在do-file或ado-file中編寫Java代碼,甚至可以從Stata中交互式地調(diào)用Java(如JShell)。
Java的優(yōu)勢之一在于與Java虛擬機打包在一起的廣泛的APIs。還有許多有用的第三方庫。根據(jù)您需要執(zhí)行的操作,您甚至可以編寫并行代碼以利用多核運算。您編寫的Java代碼可以即時編譯,無需使用外部編譯器!此外,還包括Stata函數(shù)接口(SFI)Java軟件包,提供了Stata與Java之間的雙向連接。
SFI包具有訪問Stata當前數(shù)據(jù)集,幀,宏,標量,矩陣,值標簽,特征,全局Mata矩陣,日期和時間值等的類。Stata將Java開發(fā)工具包(JDK)與其安裝捆綁在一起,因此不涉及其他設(shè)置。
27. H2O集成
在Stata 17中,我們一直在嘗試連接H2O,H2O是一種可擴展的分布式開源機器學習和預測分析平臺。您可以在https://docs.h2o.ai/上了解有關(guān)H2O的更多信息。
借助H2O的集成,您可以從Stata上啟動,連接和查詢H2O集群。此外,我們提供了一組命令來處理集群上的數(shù)據(jù)(H2O幀)。例如,您可以通過導入數(shù)據(jù)文件或加載Stata的當前數(shù)據(jù)集來創(chuàng)建新的H2O框架。您還可以在Stata內(nèi)部拆分,組合和查詢H2O幀。盡管對于我們來說,這仍處于試驗階段,但我們希望將其提供給我們的用戶進行試用。
另一方面,由于它是實驗性功能,因此語法和功能可能會發(fā)生變化。使用提供對H2O特定功能的訪問的Stata命令時,請記住這是H2O功能。盡管您可能通過Stata命令訪問它,但它的工作取決于H2O,并且不在Stata范圍內(nèi)。
28. do文件編輯器:導航,增強書簽…
Stata 17中的“文件”編輯器進行了以下改進:
1. 書簽:現(xiàn)在與do文件一起保存。
2. 新的導航控件:可以輕松瀏覽do文件。
3. 語法高亮顯示支持現(xiàn)已包括Java和XML。
4. 選區(qū)中引號,括號和方括號的自動補全。 例如,選擇文本mymacro,然后輸入左引號`;。 然后,文件編輯器將用單引號將文本選擇綁定,將選擇更改為“ mymacro”。
書簽:do文件編輯器最需要的功能之一是能夠?qū)灡4嬖赿o文件中。書簽用于標記感興趣的行,以便以后更輕松地導航到它們。書簽在瀏覽長do文件時特別有用。
您可以將書簽添加到您的do文件的各個部分,以執(zhí)行數(shù)據(jù)管理,顯示摘要、統(tǒng)計信息并執(zhí)行統(tǒng)計分析。然后,您可以使用菜單、工具欄或新的導航控件在這些部分之間快速來回移動,而無需滾動幾行代碼來查找所需的部分。
導航: Stata 17通過新的導航控件使do文件的導航更加容易,該控件顯示書簽及其標簽的列表。從導航控件中選擇一個書簽會將“do文件編輯器”移至書簽所在的行。除了書簽之外,導航控件還將顯示do文件中的程序列表。從導航控件中選擇一個程序會將“do文件編輯器”移至該程序的釋義。無需將其他程序添加到“導航”中。 DO文件編輯器將自動將程序的釋義添加到導航控件中。
29. 非參數(shù)的趨勢檢驗
現(xiàn)在,nptrend命令支持四種跨有序組的趨勢檢驗。您可以在the Cochran–Armitage test, the Jonckheere–Terpstra test, the linear-by-linear trend test, and the Cuzick test using ranks之間進行選擇。前三個檢驗是新的,而第四個檢驗由nptrend先前執(zhí)行。
Lasso
作為大數(shù)據(jù)Volume的一種重要形式,“高維數(shù)據(jù)”(high-dimensional data)解釋變量很多,甚至超過樣本容量。Lasso (Least Absolute Shrinkage and Selection Operator,也稱“套索估計量”)及其衍生的系列估計量正是進行高維回歸的主要工具。
Lasso系列的官方命令,包括lasso, elasticnet(彈性網(wǎng))與 sqrtlasso(平方根Lasso),可估計線性回歸模型(比如 lasso linear)、二值選擇模型(比如,lasso logit 與 lasso probit)、計數(shù)模型(比如,lasso poisson)等。
Lasso 系列的估計量通常使用懲罰回歸(penalized regressions)來處理高維數(shù)據(jù),以避免“過擬合”(overfit)與“方差爆炸”(variance explosion),并進行“變量選擇”(variable selection)。這些懲罰回歸對于回歸系數(shù)過大的懲罰力度則一般由調(diào)節(jié)參數(shù)(tuning parameter)或 L1范數(shù)(L1 norm)來控制。
使用 Stata 16的Lasso命令,可以很方便地計算回歸系數(shù)的整個路徑(coefficient paths),作為調(diào)節(jié)參數(shù) 或 L1范數(shù)的函數(shù);并根據(jù)“交叉驗證”(cross-validation)選擇最優(yōu)的調(diào)節(jié)參數(shù) ,參見下圖。
Stata 官方命令還提供了 Lasso 系列相應(yīng)的統(tǒng)計推斷方法,比如計算標準誤、置信區(qū)間,或進行假設(shè)檢驗。這些統(tǒng)計推斷方法包括“double-selection lasso”(比如,dsregress,dslogit,dspoisson),“partialling-out lasso”(比如,poregress,pologit,popoisson),以及“cross-fit partialing out lasso”(比如,xporegress,xpologit,xpopoisson)。
Multiple Datasets in Memory
在大數(shù)據(jù)時代,學界與業(yè)界越來越需要在內(nèi)存中同時處理多個數(shù)據(jù)集。在此前的 Stata 版本中,Stata 內(nèi)存只能有一個數(shù)據(jù)集。這種設(shè)置雖簡便易行,在小數(shù)據(jù)時代也基本夠用,但在大數(shù)據(jù)時代,由于數(shù)據(jù)的來源 Variety 多樣,已成為應(yīng)用的瓶頸。
因此,Stata 適時地推出在內(nèi)存內(nèi)同時調(diào)用多達100個數(shù)據(jù)集的重要功能。比如,你可以很方便地根據(jù)內(nèi)存中多個數(shù)據(jù)集的信息來定義一個新的變量。
Python Integration
隨著機器學習與數(shù)據(jù)科學的興起,Python 無疑是最炙手可熱的編程語言之一。為此,Stata 16 專門提供了一個與 Python 的接口,讓用戶可以在熟悉的 Stata 界面下調(diào)用 Python,并在 Stata 中顯示運行結(jié)果。
比如,此前的 Stata 版本無法畫三維立體圖,而在Stata 16中,通過調(diào)用Python 的 Matplotlib 則不難實現(xiàn)(參見下圖)。
這也意味著,你可以在 Stata 中,通過 Python 接口,使用 Python 所擅長的各種機器學習方法,包括隨機森林、梯度提升、支持向量機、神經(jīng)網(wǎng)絡(luò)等!
Do-file Editor -- Autocompletion and More Syntax Highlighting
在大數(shù)據(jù)時代,編程越來越成為一種基本技能。在 Stata 中編程,無疑需要一個很好的 do 文件編輯器(Do-file Editor)。 讓人驚喜的是,Stata 的 do 文件編輯器的性能也有了大幅提升,包括 Stata 命令的自動填寫完成(autocompletion),以及更多語法高亮顯示(syntax highlighting),這無疑將為 Stata 編程提供很大便利。
Meta-Analysis
Stata 提供了全新的 Meta-Analysis 模塊,使得元分析變得十分方便、快捷而高效,并輔之以強大的可視化功能(參見下圖)。
Reporting
由于大數(shù)據(jù)的更新頻繁特點(Velocity),使得數(shù)據(jù)分析經(jīng)常需要重復進行,使用更新的數(shù)據(jù)。此時,研究報告的可重復性(Reproducibility)就變得日益重要,即保證任何人只要運行你的 Stata 程序即可得到完全一樣的研究報告。這些研究報告的格式可以是 Word,PDF,Excel 或 HTML(參見下圖)。 隨著大數(shù)據(jù)時代的數(shù)據(jù)來源 Variety 越來越多,使得我們時常需要將不同來源的樣本數(shù)據(jù)之研究結(jié)果整合在一起,即所謂“元分析”(Meta-Analysis)。
而且,當你的數(shù)據(jù)集更新之后,再運行一遍你的 Stata,則你的研究報告也會相應(yīng)地自動更新!Stata 16 新引入或完善的相關(guān)命令包括 dyndoc,markdown,putdocx,html2docx,doc2pdf。
小貼士:還在發(fā)愁如何將 Word 文件轉(zhuǎn)化為 PDF 格式?Stata 16 的 doc2pdf 命令就能幫你搞定!
Import Data from SAS and SPSS
如果你有數(shù)據(jù)在 SAS 或 SPSS 中,想要導入 Stata 以利用其強大的統(tǒng)計與計量功能,Stata 16 貼心地提供了專門的新命令 import sas 與 import spss,使得這種數(shù)據(jù)遷移變得十分方便與快捷,參見下圖。
Stata 深耕計量經(jīng)濟學的經(jīng)典與前沿方法
Nonparametric Series Regression
序列回歸(series regression)是非參數(shù)回歸(nonparametric regression)的一種重要方法。它使用多項式(polynomials)、B-樣條(B-splines)或樣條(splines)所構(gòu)成的序列來近似逼近任意的未知回歸函數(shù)。
Stata 推出的命令 npregress series 填補了 Stata 在非參數(shù)回歸領(lǐng)域的又一空白,使得非參數(shù)序列回歸變得方便而高效;比如,計算平均邊際效應(yīng)(average marginal effects)。命令 npregress series 甚至可以估計“半?yún)?shù)模型”(semi-parametric model),即同時包含參數(shù)與非參數(shù)部分的模型。
Choice Models
對于微觀計量中常用的“離散選擇模型”(discrete choice models),Stata 設(shè)立了一個“選擇模型”(Choice Models)的模塊。在估計選擇模型之前,你先通過命令 cmset 來宣布你的數(shù)據(jù)為選擇模型,然后可用命令 cmsummarize,cmchoiceset,cmtab 或 cmsample 來考察你的選擇模型。
估計選擇模型的相應(yīng) Stata 命令也統(tǒng)一帶上了 cm 的前綴,比如
cmclogit:conditional logit model
cmmixlogit:mixed logit model
cmxtmixlogit:panel-data mixed logitmodel
cmmprobit:multinomial probitmodel
cmroprobit:rank-ordered probitmodel
cmrologit:rank-ordered logitmodel
其中,cmxtmixlogit 是 Stata 16的全新命令,用于估計面板數(shù)據(jù)的混合邏輯模型(mixed logit models for panel data)。
Panel-data ERMs
Stata 15 推出了 ERM(Extended Regression Models)模塊,可以處理同時出現(xiàn)“內(nèi)生性”(endogeneity)、“樣本選擇”(sample selection)與“處理效應(yīng)”(treatment)這三種并發(fā)癥的情形,或三者的任意組合,非常靈活實用。Stata 16 則將ERMs 推廣到了面板數(shù)據(jù)中,新引入了xtegress,xteintreg,xteprobit,xteoprobit 等強大命令。
New in Bayesian Analysis
Stata 的“貝葉斯分析”(Bayesian Analysis)模塊也有了不少新功能。比如,可使用多個馬爾科夫鏈(multiple chains)來檢驗現(xiàn)代貝葉斯分析所依賴的馬爾科夫鏈蒙特卡洛(Markov China Monte Carlo)是否收斂;以及使用后驗分布(posterior distribution)進行“貝葉斯預測”(Bayesian predictions),參見下圖。
Nonlinear DSGE Models
tata 可以通過命令 dsgenl 來估計非線性 DSGE 模型。 使用命令dsgenl,無須再手工將 DSGE 模型線性化,直接輸入非線性的 DSGE 模型,Stata 即會自動地對它進行線性化與估計。
xtheckman
xtheckman命令 使得 Heckman 的樣本選擇模型(sample model)也可以在面板數(shù)據(jù)中估計。
系統(tǒng)要求
Stata for Windows
Windows 11*
Windows 10 *
Windows Server 2022, 2019, 2016, 2012R2 *
* Stata requires 64-bit Windows for x86-64 processors made by Intel? or AMD (Core i3 equivalent or better)
Stata for Mac
Mac with Apple Silicon or Intel processor (Core i3 or better)
macOS 11.0 (Big Sur) or newer for Macs with Apple Silicon and macOS 10.13 (Sierra) or newer for Macs with 64-bit Intel processors
Stata for Linux
Any 64-bit (Core i3 equivalent or better) running Linux
Minimum requirements include the GNU C library (glibc) 2.17 or better and libcurl4
Check the output of ldd -v within a terminal
For xstata, you need to have GTK 2.24 installed
Hardware requirements
Package | Memory | Disk space |
Stata/MP | 4GB | 4GB |
Stata/SE | 2GB | 4GB |
Stata/BE | 1GB | 4GB |
Stata for Linux requires a video card that can display thousands of colors or more (16-bit or 24-bit color)
在在世界已邁入大數(shù)據(jù)新時代的今天,Stata 在高校商科類專業(yè)、科研院所以及企業(yè)界的應(yīng)用越來越廣泛,已成為各大高校必備的專業(yè)軟件,隨著其用戶群體的不斷擴大,建立中國用戶與 Stata 總部之間的溝通和磋商機制越發(fā)成熟。聆聽用戶的心聲,收集業(yè)界專家的論點與建議,已成為會議的主旨,無論您是為科研應(yīng)用之路尋找最佳解決方案, 還是專注 Stata 軟件探索與研究,抑或是竭力于提高工作效率的數(shù)據(jù)處理技能,在 Stata 中國用戶大會上,您的需求都能得到前所未有的碰撞與共鳴。故 Stata 中國用戶大會(China Stata Users' Conference)由此誕生,由北京友萬信息科技有限公司(Beijing Uone Info&Tech Co.,Ltd)和StataCorp LLC原廠聯(lián)合發(fā)起,規(guī)劃每年舉辦一屆,通過廣泛的國際學術(shù)交流,幫助 Stata 中國用戶探索更深層次的理論和研究。我們希望通過每年一屆的 Stata 用戶會議,讓 Stata 中國用戶及學者提高自身軟件應(yīng)用水平,開辟“學中用、用中學”的創(chuàng)新學習模式,打造強有力的學術(shù)氛圍,幫助中國用戶建立完善的軟件技術(shù)服務(wù)體系,形成中國用戶之間的技術(shù)、經(jīng)驗交流平臺。
往屆 Stata 中國用戶大會資源免費奉送,關(guān)注 Stata 的小伙半們抓緊時間領(lǐng)取咯!
2024 年第八屆 Stata 中國用戶大會將于 8 月 19 日至 20 日在南開大學舉辦。
計量經(jīng)濟學前沿方法研討會暨“第八屆Stata中國用戶大會”即將于金秋八月在南開大學隆重舉行。會議將邀請國內(nèi)外計量經(jīng)濟學領(lǐng)域的TOP級大咖擔任主講嘉賓,為與會者提供一個全面了解計量經(jīng)濟學前沿方法和Stata軟件實踐應(yīng)用的平臺。大會以“計量經(jīng)濟學的前沿方法與Stata軟件的實踐應(yīng)用”為主題,旨在運用跨界思維和方法,推動計量經(jīng)濟學等領(lǐng)域的教育創(chuàng)新與發(fā)展。同時,會議還將促進國內(nèi)外計量經(jīng)濟學領(lǐng)域的交流與合作,在會議期間,您將有難得的機會與來自國內(nèi)外不同領(lǐng)域的頂尖計量經(jīng)濟學專家、資深的Stata軟件專家以及前沿的研發(fā)工程師深入交流,共同探討并分享寶貴的學術(shù)見解和實踐經(jīng)驗。您將第一時間了解到計量經(jīng)濟學領(lǐng)域的最新發(fā)展動態(tài),以及Stata軟件新功能和新命令。恰逢StataNow全新發(fā)布,邀您與StataNow一起,開啟數(shù)據(jù)分析新篇章!此外,會議還將推出《Stata夏令營活動》,為您提供一個學習使用Stata新方法的絕佳機會。無論您是初學者還是資深用戶,都能在這里實現(xiàn)自我突破與科研創(chuàng)新。 在南開大學這座百年學府中,您將感受到濃厚的學術(shù)氛圍和人文氣息。我們誠摯邀請您共襄盛舉,與眾多專家學者共同交流學習,為推動國內(nèi)經(jīng)濟學等領(lǐng)域的交叉融合貢獻智慧和力量。期待您的到來,共同見證這場學術(shù)盛事的成功舉辦!
2023 年第七屆 Stata 中國用戶大會于 8 月 13 日至 14 日在哈爾濱商業(yè)大學成功舉辦。為促進高水平商科特色高校建設(shè)與經(jīng)濟學等其他學科的交叉融合,會議圍繞“東北全面振興與高水平商科大學建設(shè)背景下的經(jīng)濟學實證統(tǒng)計方法”為主題,積極開展跨學科的探索性研究與統(tǒng)計相關(guān)的研究。會議以數(shù)字經(jīng)濟為背景,運用跨界思維和方法,將新技術(shù)、新理念、新模式,新方法融入商科教育。與會領(lǐng)導、專家和來自全國各地的業(yè)界學者一起,置身于美麗的哈爾濱,穿過百年中央大街,探訪中華巴洛克歷史文化街區(qū),漫步美麗松花江畔,享受為期兩天的 Stata 會議和交流時光!
演講主題 | 演講人 |
《Stata 18 新功能應(yīng)用》 | Stata軟件開發(fā)者 StataCorp LLC |
《Heterogeneous difference in differences in Stata》 | 劉 迪 StataCorp LLC |
《雙重機器學習及Stata應(yīng)用》 | 陳 強 山東大學 |
《Create customizable tables》 | 徐 朝 StataCorp LLC |
《Instrumental variables quantile regression》 | 劉 迪 StataCorp LLC |
《干預時間序列分析與程序包的比較述評》 | 王群勇 南開大學 |
《因果推斷中的控制變量:好的和壞的》 | 連玉君 中山大學 |
《Fitting spatial stochastic frontier models in Stata》 | 杜克銳 廈門大學 |
《Stata與會計研究:資本市場開放與財務(wù)報告穩(wěn)健性》 | 梁上坤 中央財經(jīng)大學 |
《DID安慰劑檢驗及Stata應(yīng)用》 | 顏冠鵬 山東財經(jīng)大學 |
第六屆 Stata 中國用戶大會于2022年8月19-20日在線盛大召開。您可以與來自各領(lǐng)域頂尖的 Stata 專家及 Stata 研發(fā)工程師一起分享有價值的見解及新命令,學習最前沿的科研方法并提高您的 Stata 應(yīng)用知識。會議同期還將全新推出《Stata大師課》+《Stata公開課》的夏季聯(lián)學營活動,無論您是初學者還是專家,歡迎加入我們,并利用這一獨特的機會來學習使用 Stata 的新方法。
演講主題 | 演講人 |
《Mastering Stata's datetime concepts and functions》 | 彭 華 StataCorp LLC |
《動態(tài)隨機一般均衡模型的貝葉斯估計》 | 王群勇 南開大學 |
《合成控制法(SCM)的安慰劑檢驗、穩(wěn)健性檢驗及可視化操作》 | 顏冠鵬 山東大學 |
《Stata中的標準誤》 | 陳 強 山東大學 |
《Creating Custom Estimation Tables》 | 呂 丹 StataCorp LLC |
《模型平均化(Model Averaging)及其在經(jīng)濟金融領(lǐng)域的應(yīng)用》 | 連玉君 中山大學 |
《使用網(wǎng)絡(luò)方法研究經(jīng)濟學問題》 | 神秘嘉賓 |
《綠色全要素生產(chǎn)率與高質(zhì)量發(fā)展評估》 | 張 寧 山東大學 |
第五屆 Stata 中國用戶大會暨“Stata 高級研究方法及新應(yīng)用研討會”于2021年8月19-20日盛大召開。聚焦學術(shù)前沿,對話學界大咖,多層次解讀 Stata 17新應(yīng)用。StataCorp LLC選派技術(shù)總工及開發(fā)者出席會議,與國內(nèi)一線專家共襄盛舉,共享 Stata 應(yīng)用新思路。
演講主題 | 演講人 |
《Stata 17 自定義表格新應(yīng)用》 | 彭 華 StataCorp LLC |
《Global VAR and Bayesian VAR in Stata》 | 王群勇 南開大學 |
《回歸控制法及Stata應(yīng)用》 | 顏冠鵬 山東大學 |
《分位數(shù)控制法及Stata應(yīng)用》 | 陳 強 山東大學 |
《因果推斷中的Stata應(yīng)用》 | 王存同 中央財經(jīng)大學 |
《Fitting Cox proportional hazards model for interval-censored event-time data in Stata》 | 楊 筱 StataCorp LLC |
《雙邊隨機邊界模型的Stata應(yīng)用》 | 劉 暢 中山大學學 |
《優(yōu)質(zhì)稿件 | songbl命令的使用介紹:stata推文與電腦文檔的檢索》 | 楊景院 深圳大學 |
《一個Stata用戶的若干思考》 | 連玉君 中山大學 |
《合成控制法的Stata應(yīng)用和前沿研究》 | 陸嘉炫 芝加哥大學 |
《Mixed Regression with Macro and Micro Data in Stata》 | 王群勇 南開大學 |
2020年隨著新冠疫情的蔓延,全球都投入到積極防控的大潮中,如何高效獲取和處理COVID-19數(shù)據(jù),必然成為本屆會議的熱點主題 。第四屆“Stata中國用戶大會”(China Stata Users' Conference) 將以“新應(yīng)用+智交互”為主題,力邀國內(nèi)外行業(yè)領(lǐng)袖及學術(shù)專家,共同開啟全新主題單元。本次會議以線上直播的方式與大家見面,知識碰撞、經(jīng)驗交流、共享Stata應(yīng)用新思路。
演講主題 | 演講人 |
《使用Stata獲取與處理COVID-19數(shù)據(jù)》 | 彭 華 StataCorp LLC |
《Call Stata from Python》 | 徐 朝 StataCorp LLC |
《混頻回歸方法與Stata應(yīng)用》 | 王群勇 南開大學 |
《基于Stata模擬的內(nèi)生性來源及其應(yīng)對》 | 陳傳波 中國人民大學 |
《跨度回歸、偏度回歸與峰度回歸及Stata應(yīng)用》 | 陳 強 山東大學 |
《平滑轉(zhuǎn)換模型與Stata應(yīng)用》 | 王群勇 南開大學 |
《Causal Mediation》 | 金承剛 北京師范大學 |
《合成控制法安慰劑檢驗改進研究——基于標準化處理效應(yīng)和非拒絕域的統(tǒng)計推斷》 | 連玉君 中山大學 |
《Measuring technical efficiency and total factor productivity change with undesirable outputs in Stata》 | 王道平 上海財經(jīng)大學 |
第三屆 Stata 中國用戶大會暨“機器學習與計量方法應(yīng)用研討會”于2019年8月20—21日在上海財經(jīng)大學盛大召開并取得圓滿成功。會議得到了國內(nèi)外專家學者及眾多用戶代表的一致肯定,同時今年也是 Stata 16發(fā)布年,在會議上我們也希望能夠更多的了解對新版本的認知,反映中國用戶在應(yīng)用軟件過程中遇到的問題。通過廣泛的國際交流,幫助 Stata 中國用戶探索更深層次的理論和研究。
演講主題 | 演講人 |
《Introduction of latest reporting and language extension features in Stata》 | 彭 華 StataCorp LLC |
《Stata在公司投融資研究中的應(yīng)用》 | 覃家琦 南開大學 |
《分位數(shù)回歸:橫截面、面板與工具變量法》 | 陳 強 山東大學 |
《Inference after lasso model selection》 | 劉 迪 StataCorp LLC |
《非參數(shù)計量經(jīng)濟方法(核回歸,局部線性回歸)》 | 王群勇 南開大學 |
《Fixed effect panel threshold model for unbalanced panel》 | 王群勇 南開大學 |
《Stata在外匯市場實證中的應(yīng)用》 | 丁劍平 上海財經(jīng)大學 |
《人工智能+ Stata》 | 陳堰平 微軟中國 |
2018年“第二屆 Stata 中國用戶大會”(2018China Stata Users' Conference)是由北京友萬信息科技有限公司(簡稱:友萬科技)主辦,順德職業(yè)技術(shù)學院承辦的聚焦 Stata 應(yīng)用與技術(shù)落地的盛會。會議核心內(nèi)容將圍繞計量經(jīng)濟方法及應(yīng)用方向展開廣泛的國際學術(shù)交流,內(nèi)容覆蓋經(jīng)濟學、金融學、會計學、計算語言學、新聞學、政治學、歷史學、醫(yī)藥衛(wèi)生等微觀和宏觀計量分析的熱門應(yīng)用領(lǐng)域。今年大會的主題是“Econometric Analysis Method and Application” 秉承“開放協(xié)作、技術(shù)共享”的宗旨,面對面真誠聆聽用戶的聲音。致力于為業(yè)界帶來最新技術(shù)、行業(yè)應(yīng)用案例展示與最佳實踐單元。
會議主題:Econometric Analysis Method and Application
演講主題 | 演講人 |
《大數(shù)據(jù)、高維回歸與Stata》 | 陳 強 山東大學 |
《Spatial autoregressive models using Stata》 | 劉 迪 StataCorp LLC |
《政策評估與因果推斷:Stata應(yīng)用概述》 | 王群勇 南開大學 |
《斷點回歸》 | 連玉君 中山大學 |
《回歸分析集成輸出解決方案》 | 李春濤 華中科技大學 |
《內(nèi)含資本成本的計算》 | 顧 俊 深圳大學 |
《樣本選擇問題與處理》 | 王群勇 南開大學 |
《DSGE在Stata中的應(yīng)用》 | 許文立 安徽大學 |
《Report generation with putdocx, putexcel, putpdf, and dyndoc》 | 彭 華 StataCorp LLC |
2017年“第一屆 Stata 中國用戶大會”(2017 China Stata Users' Conference)是由北京友萬信息科技有限公司和爬蟲俱樂部,聯(lián)合StataCorp LLC發(fā)起第一屆Stata中國用戶大會。首屆Stata用戶會議的宗旨是“溝通和合作”,我們希望通過定期舉辦 Stata 用戶會議,形成中國用戶之間的技術(shù)、經(jīng)驗交流平臺;建立和 Stata 原廠的溝通機制,反映中國用戶遇到的問題,讓未來的Stata版本更多地反映中國用戶的愿望;建立學界與企業(yè)界之間的溝通和聯(lián)系,讓 Stata 用戶有更多的機會服務(wù)于企業(yè)界;打造數(shù)據(jù)分析領(lǐng)域的高端智庫,服務(wù)于我國的大數(shù)據(jù)事業(yè)。
會議主題:Retrieving data from website, Cloud oriented empirical analysis, Using Chinese in Stata
演講主題 | 演講人 |
《Stata 15 新版本發(fā)布及新功能研討》 | 彭 華 StataCorp LP 軟件工程總監(jiān) |
《內(nèi)生性問題:方法及進展》 | 連玉君 中山大學 |
《putdocx與格式化輸出》 | 李春濤 中南財經(jīng)政法大學 |
《unicode與中文編碼》 | 彭 華 StataCorp LP 軟件工程總監(jiān) |
《Stata函數(shù)》 | 彭 華 StataCorp LP 軟件工程總監(jiān) |
《Subinfile,網(wǎng)頁源代碼分析的神器》 | 薛 原 爬蟲俱樂部 |
《Stata自動化報告與可重復研究》 | 陳堰平 雪晴數(shù)據(jù)網(wǎng) |
《分詞與情感分析》 | 薛 原 爬蟲俱樂部 |
《文本分析在量化文史學研究中的應(yīng)用—以<唐書>與<紅樓夢>為例》 | 俞俊利 上海交通大學 |
《Stata、cURL交互與網(wǎng)絡(luò)爬蟲:以微博API為例》 | 彭文威 香港科技大學 |
《Stata數(shù)據(jù)清洗常用技巧》 | 彭文威 香港科技大學 |
《Econometric convergence test and club clustering using Stata》 | 杜克銳 山東大學 |
Stata Journal為每季發(fā)行的期刊,包含了統(tǒng)計、資料分析、教學方法、有效地使用Stata語言及書籍回顧…等相關(guān)內(nèi)容。 使用者亦可選擇購買有興趣的單篇文章。
ISI Web of Knowledge 的最新期刊引用報告,將Stata期刊列為社會科學數(shù)學方法類別期刊中的第四位,僅次于結(jié)構(gòu)方程模型, 計量經(jīng)濟學和經(jīng)濟學與統(tǒng)計學評論。
>>教學視頻
為順應(yīng)大數(shù)據(jù)時代要求,自開展Stata培訓以來,我司通過活動路演、創(chuàng)新講座、在線課程、線下培訓等系列活動已經(jīng)在全國開展了包含Stata應(yīng)用方法、統(tǒng)計分析、文本分析、數(shù)據(jù)分析、數(shù)據(jù)清洗、Stata、cURL交互與網(wǎng)絡(luò)爬蟲、內(nèi)生性問題的方法及進展、Stata編程與Mata運算、Stata編程技術(shù)與爬蟲、Stata自動化報告與可重復研究、計量經(jīng)濟方法及Stata應(yīng)用等學習活動,有近千余名師生及業(yè)界愛好者參與了學習。通過此類學習活動極大的加強了大數(shù)據(jù)分析人才的理論和實踐能力。推進了大數(shù)據(jù)人才培養(yǎng),以及學術(shù)成果的轉(zhuǎn)化,為大數(shù)據(jù)分析領(lǐng)域發(fā)展做出了貢獻。我司希望通過每年一屆的Stata中國用戶大會,深度推進國內(nèi)青年學者學習熱情,提升高校學術(shù)交流氛圍,整合學界及業(yè)內(nèi)的大量資源,進一步提高數(shù)據(jù)分析能力和科學決策的水平。
高級現(xiàn)場班:"面板數(shù)據(jù)與因果推斷" 研討會
主講:陳 強 |
高級現(xiàn)場班:《計量經(jīng)濟實證方法與論文寫作研討會》 一期
主講:王群勇 |
高級現(xiàn)場班:《計量經(jīng)濟實證方法與論文寫作研討會》 二期
主講:王群勇 |
高級現(xiàn)場班:"面板數(shù)據(jù)與因果推斷" 研討會
主講:王群勇 |
高級現(xiàn)場班:"異質(zhì)性穩(wěn)健DID及Stata應(yīng)用" 研討會
主講:陳強 |
高級現(xiàn)場班:"宏觀計量經(jīng)濟模型" 研討會
主講:王群勇 |
高級課程:蒙特卡洛模擬、貝葉斯分析與Stata應(yīng)用
主講:王群勇 |
高級課程:宏觀計量經(jīng)濟分析與Stata、Mathematica應(yīng)用
主講:王群勇 |
高級課程:貝葉斯分析與Stata應(yīng)用
主講:王群勇 |
中級課程:面板數(shù)據(jù)計量分析與Stata應(yīng)用
主講:王群勇 |
初級課程:Stata 17新功能介紹課程
主講:StataCorp LLC |
初級課程:Stata 16軟件功能介紹課程
主講:StataCorp LLC |
初級課程:實證方法與Stata應(yīng)用專題課程
主講:王群勇 |
高級課程:“非線模型講述非常故事”專題課程
主講:王群勇 |
高級課程:“自然實驗與因果推斷”專題課程
主講:王群勇 |
Stata 案例集
為強化示范引領(lǐng)效果,加快推動高校Stata科研實驗室建設(shè),由北京友萬信息科技有限公司聯(lián)合授權(quán)高校共同編制的《Stata案例集》正式發(fā)布。Stata案例集根據(jù)客戶成功案例收集整理而成,介紹了應(yīng)用Stata軟件在科研工作和教學人材培養(yǎng)以及豐碩的科研成果方面取得的突出成效和變化,旨在幫助更多教學和科研單位根據(jù)其所屬的專業(yè)領(lǐng)域,參考如何高效的部署Stata軟件產(chǎn)品及解決方案。
案例一:首都經(jīng)濟貿(mào)易大學 國際經(jīng)濟管理學院
案例二:南開大學 經(jīng)濟學院
案例三:西南政法大學
經(jīng)濟學院
Stata實驗室建設(shè)計劃
北京友萬信息科技有限公司自成為Stata中國授權(quán)經(jīng)銷商及合作伙伴以來,已為國內(nèi)數(shù)十所高等院校及科研院所完成了Stata科研實驗室采購計劃。幫助其在教學科研、人材培養(yǎng),論文發(fā)表、學科建設(shè)方面取得了突破性的進展。解決了在數(shù)據(jù)分析、數(shù)據(jù)處理、可視化、統(tǒng)計分析和自動報告等多方面的業(yè)務(wù)問題和個性化需求。對提高科研人員與教師的科學研究能力和教學水平起到了尤為重要的作用,誠邀有意向的單位加入我們,共同建立適合您的實驗室定制建設(shè)方案。