Stata 是一套提供其使用者數據分析、數據管理以及繪制專業圖表的完整及整合性統計軟件。它功能非常強大,包含異質性DID、中介效應、多向聚類標準誤、野聚類自助法、工具變量分位數回歸、貝葉斯模型平均、描述性統計制表等功能。用 Stata 繪制的統計圖形相當精美。Stata 具有操作靈活、簡單、易學易用、運行速度極快等優點。
2025年4月8日,Stata19重磅發布!Stata 19以前瞻性的視野與卓越的技術實力,勇敢地超越了傳統數據分析工具的局限,以革新者的姿態引領著數據科學的新潮流。它不僅集成了最新一代的算法模型與智能分析技術,更在數據處理速度、分析維度拓展以及結果精準度上實現了質的飛躍,讓數據分析過程更加流暢高效,仿佛為研究者們配備了一把銳利的智慧之劍,輕松斬斷復雜數據背后的重重迷霧,讓每一個分析結果都如同經過精密雕琢的藝術品,精準無誤地揭示出數據背后的深層規律與價值,為決策制定提供了堅實而可靠的依據。
[->Stata 校園版來啦!可滿足全校使用的授權,點擊了解詳情]
>>熱烈祝賀“2025年第十四屆數量經濟學國際學術會議”“數量經濟學國際講習班暨第九屆Stata中國用戶大會”系列活動取得圓滿成功!
>>從教學到科研:友萬科技助力中國社會科學院大學全面部署Stata校園版!
>>南開大學經濟學院正式啟用Stata/MP8 V18.5正版軟件 助力科研教學高質量發展!
>> 2024 Stata夏季訓練營“面板數據的因果推斷及Stata應用研討會”圓滿結束!
>> 2024 Stata夏季訓練營“計量經濟實證方法與論文寫作研討會”圓滿結束!
>> 友萬快訊:友萬科技深入喀什大學開展Stata和IBM SPSS軟件內訓及服務解決方案
Stata 19 現已發布!您可以在我們的網站上看到所有新功能。 表格、圖形、框架和 “Do-file 編輯器”(Do-file Editor)都有許多改進,將簡化您的工作流程。 許多令人興奮的新統計功能包括:
Stata19版本官方命令引入另一類常用的機器學習方法,即基于決策樹(decision trees)的集成學習方法(ensemble learning),包括隨機森林(random forest)與梯度提升法(gradient boosting machine)
Stata 19提供了一套新的h2oml命令,可輕松地接入開源的大數據機器學習平臺H2O,針對回歸(regression)或分類(classification)問題使用隨機森林或梯度提升法。H2O使得機器學習變得更加容易,有時稱為AutoML。
h20.png
畫變量重要性圖(variable importance plot):
Stata 19引入了有關面板數據的若干新命令或選擇項,包括高維固定效應(high dimensional FE)、相關隨機效應(correlated random effects)、面板向量自回歸(panel VAR),給用戶帶來了強大的新功能與便利。
這次Stata 19將其相應功能納入了官方命令(無須額外命令,僅新增了一個選擇項),使得操作更為簡便可靠!
例如,在估計面板固定效應模型時,假設我們還想額外地控制三個分類變量(categorical variables)z1, z2與z3,只要在常規命令加上absorb()的選擇項即可,類似地,我們在進行二階段最小二乘法(2SLS)估計時,也可以使用absorb()的選擇項。
靜態面板的兩個常用模型為隨機效應(random effects,簡記RE)與固定效應(fixed effects,簡記FE)。然而,二者均有缺點。隨機效應模型不夠穩健,如果解釋變量與個體效應相關,則得不到一致估計。另一方面,雖然固定效應模型較為穩健,但無法估計非時變(time-invariant)變量的系數。為此,Stata 19推出了“相關隨機效應”(correlated random effects,簡記CRE),可以兼顧二者的優點。
CRE模型允許解釋變量與個體效應相關,且時變(time-varying)變量的系數估計值與FE完全相同,故本質上為FE模型。在算法上,CRE估計量將時變變量的組平均值加入混合回歸中,故可視為一種控制函數法(通過時變變量的組平均值來控制遺漏變量)。由于CRE未做組內離差變換,故也可以估計出非時變變量的系數,這是CRE的最大優點。
向量自回歸(vector autoregressoin,簡記VAR)是常見的時間序列模型,但由于VAR模型的待估參數較多,故一般需要較長的時間維度。面板向量自回歸(panel vector autogression,簡記Panel VAR)將VAR模型推廣到面板數據中。面板VAR模型既包含個體固定效應,也包括被解釋變量的滯后項,故可視為動態面板模型(dynamic panel-data model)與VAR模型的結合。相應地,面板VAR模型的估計方法類似于動態面板,主要使用廣義矩估計(generalized method of moment,簡記GMM)。其漸近理論要求橫截面單位的數量趨向無窮大,故適用于時間維度較短的短面板。
因果推斷始終是實證研究的核心方法。Stata 19在因果推斷方面的功能也進一步加強,新推出的方法包括條件平均處理效應(CATE)以及有關工具變量法的一些新方法。
因果推斷關注的對象一般為全樣本的平均處理效應(average treatment effect,簡記ATE)或處理組平均處理效應(average treatment effect on the treated,簡記ATT或ATET)。然而,不同個體的處理效應很可能存在異質性,而研究者有時感興趣,異質性處理效應如何隨著個體特征而變。例如,電商平臺可能關心價格折扣如何影響消費者行為,而價格折扣的處理效應可能依賴于消費者的年齡與收入。
為此,Stata 19推出了全新的cate命令,用于估計“條件平均處理效應”(conditional average treatment effect,簡記CATE),即在給定某種個體特征條件下的平均處理效應。命令cate可以估計三種不同類型的CATE,包括“個體平均處理效應”(individualized average treatment effect),“分組平均處理效應”(group?average treatment effect)及“排序分組平均處理效應”(sorted group?average treatment effect)。除了估計外,cate系列命令還可進行預測、可視化及統計推斷。
Stata 19的cate命令功能強大、靈活而穩健。例如,在對結果回歸(outcome regression)與處理效應模型(treatment models)建模時,可使用參數模型(parametric models),拉索估計量(lasso)或廣義隨機森林(generalized random forest;有時也稱為“誠實森林”,即honest forest)。該命令提供了兩個穩健估計量,即“偏效應過濾”(partialling out)與“增強逆概加權”(augmented inverse probability weighting),其中后者為雙穩健估計量(doubly robust estimator);并使用“交叉擬合”(cross-fitting)以避免過擬合(overfitting)。
傳統的工具變量法一般使用二階段最小二乘法(two-stage least squares,簡記2SLS)。2SLS之所以成立,是因為第一階段回歸為線性模型,而線性回歸的OLS估計具有正交性。這也意味著,2SLS一般無法推廣到非線性模型中;例如,當內生變量為虛擬變量時,第一階段回歸為Probit模型。
為此,Stata 19新推出了更為靈活的“控制函數法”(control function approach,簡記CF),不僅可用于線性模型,而且也適用于非線性模型。
使用工具變量法進行因果推斷一般要求強工具變量。在弱工具變量(weak instrument)的情況下,2SLS估計量變得不可靠,即使在大樣本下。這是因為2SLS估計量其實是一個比值(ratio),而在弱工具變量的情況下,該比值的分母接近于0,導致統計推斷失效。
為此,Stata 19推出了安德森-魯賓檢驗(Anderson-Rubin test),不再使用上述比值進行統計推斷,故即使在弱工具變量的情況下依然穩健。
Stata 19專門推出了針對時間序列的工具變量法,包括通過工具變量法估計結構VAR模型,以及使用工具變量法估計脈沖響應函數。
Stata 19在貝葉斯計量經濟學(Bayesian econometrics)方面的功能繼續得到加強,新增方法包括貝葉斯變量選擇、分位數回歸及自助法等。
現在可以使用新的 bayesboot 前綴,通過貝葉斯自助法在小樣本中獲得更精確的參數估計,并在抽樣時納入先驗信息。它可與官方命令或社區貢獻命令搭配使用。
使用貝葉斯方法從變量x1-x100中進行變量選擇:
使用貝葉斯方法進行分位數回歸(quantile regression):
使用貝葉斯自助法(Bayesian bootstrap)估計x的均值:
Stata 19還提供了其他方面的計量新方法,包括久期模型、相關系數的元分析、潛類別模型等。
久期模型(duration model)的被解釋變量為某事件存續的時間,例如失業持續時間,病人存活的時長等。在原有久期模型的Stata模塊基礎上(命令均以st開頭),針對存在“區間刪失”(interval-censored)的多事件數據(multiple-events data),Stata 19提供了估計“邊際考克斯比例風險模型”(marginal Cox proportional hazards model)的新命令stmgintcox。
在文獻中,針對同一問題,常常有多項類似的研究,但所得估計結果不盡相同。如何將這些相似研究的結果進行整合,以得到統一的結論,這正是“元分析”(meta-analysis)的目標。在Stata原有的元分析meta命令模塊中,Stata 19新增了對于相關系數的元分析功能。相關系數無疑是最重要的描述性統計之一。
“潛類別模型”(latent class model)是一種常見的統計模型,它假設數據來自于若干總體(或類別)的混合,故也稱為“有限混合模型”(finite mixture model);例如,三個服從正態分布的總體按照一定比例的混合。如果知道類別的數目,則可使用原有的Stata命令gsem(表示generalized structural equation model)進行估計。
Stata 19的Do文件編輯器(Do-file Editor)變得更為強大,新增功能包括:
(1)變量名(variable names)、宏(macros)與存儲結果(stored results)的自動補全(autocompletion);
(2)方便用戶使用的Do文件編輯器模板(Do-file Editor templates);
(3)對當前詞(current word)在編輯器中的所有出現之處均提供高亮(highlighting),無論大小寫(case-insensitive);并對當前所選內容(current selection)在編輯器中的所有出現之處均提供高亮(highlighting),區分大小寫(case sensitive);
(4)括號高亮(bracket hightlighting),即對包含當前光標的括號(the brackets enclosing the current cursor position)提供高亮;
(5)代碼折疊功能的提升(code folding enhancement),包括新增的菜單欄目(menu items)“Fold all”(折疊全部可折疊代碼), “Unfold all”(展開所有已折疊代碼)與“Fold selection”(折疊所選內容)。
Stata 19的畫圖功能也變得更為強大,新增功能包括:
(1)通過新增命令twoway heatmap畫熱圖(heat maps),即在變量(x, y)取值的網格上,以小方塊的顏色變化來表示對應變量z的取值高低。
(2)通過新增命令twoway rpspikes畫“刺形”的點圖或范圍圖(plot points and ranges indicated by spikes),例如展示某統計量及其相應的置信區間。
(3)通過新增命令twoway rpcaps畫“帶帽刺形”的點圖或范圍圖(plot points and ranges indicated by?spikes with caps),例如展示某統計量及其相應的置信區間。
(4)在使用命令graph bar畫柱狀圖/條形圖(bar plot)時,可畫樣本均值及其置信區間,以及在標簽與控制條形分組方面的改進(improved labelling, and control of bar groupings)。
(5)在使用命令graph dot畫點狀圖(dot chart)時,可畫樣本均值及其置信區間,以及在標簽與控制點狀分組方面的改進(improved labelling, and control of dot groupings)。
(6)在使用命令graph box畫箱形圖(box plot)時,改進了標簽與對箱形分組的控制(improved labelling, and control of box groupings)。
(7)根據變量上色(colors by variable)的選擇項colorvar(),可適用于更多的twoway plot命令,包括line, connected, tsline, rconnected及tsrline等。
Stata 19的制表功能也得以進一步提升,可更方便地創建與定制表格
(1)Stata的制表命令table新增了增加標題的選擇項title(),增加腳注的選擇項note(),以及將表格導出為指定文件格式(例如Word, LaTex, Excel等)的選擇項export()。
(2)更簡便的方差分析表格(easier ANOVA tables)。
快!精準!易于使用! Stata是一個完整的集成軟件包,可提供您的所有數據科學需求 - 數據處理,可視化,統計和自動報告。
掌握您的數據
廣泛的統計功能
出版質量的圖形
自動報告
真正可重復的研究
PyStata — Python 集成
真實文檔
值得信賴
簡單易用
易于掌握
易于自動化
易于擴展
高級編程
自動多核支持
跨平臺兼容
世界一流的技術支持
Stata的數據管理功能如下:
同時管理多個數據集
Import, export
JDBC, ODBC, SQL
排序,匹配,合并,加入,追加,創建
內置電子表格
unicode
處理文本或二進制數據
在本地或在Web上訪問數據
收集組間的統計信息
BLOBs -strings可以容納整個文檔
數十億個觀測值
數萬個變量數
生存數據, 面板數據, 多級數據, 調查數據, 多重插補數據, 分類數據, 時間序列數據
更重要的是,支持您的所有數據科學需求。
Stata可以輕松生成出版品質,風格獨特的圖形。
您可以指向并單擊以創建自定義圖形。或者,您可以編寫腳本以可重現的方式生成數百或數千個圖形。將圖形導出為EPS或TIFF進行發布,導出為PNG或SVG進行Web導出,或者導出為PDF進行查看。使用集成的Graph Editor,您可以單擊以更改有關圖形的任何內容或添加標題,注釋,線條,箭頭和文本。
自動報告結果所需的所有工具 。
動態Markdown文檔
創建Word文檔
創建PDF文檔
創建Excel文件
可定制的表格
圖形方案
Word,HTML,PDF,SVG,PNG
很多人談論可重復的研究。
Stata 已經致力于它超過40年。
我們不斷添加新功能; 我們甚至從根本上改變了語言元素。不管。Stata 是唯一具有集成版本控制的統計軟件包。如果你在1985年編寫了一個腳本來執行分析,那么同樣的腳本仍然可以運行,并且今天仍會產生相同的結果。您在1985年創建的任何數據集,今天都可以閱讀。在2050年也是如此.Stata 將能夠運行你今天所做的任何事情。
以交互方式調用Python或將Python嵌入到您的Stata代碼中。
從Python調用Stata并從IPython環境調用Stata代碼。
在Jupyter Notebook中使用Stata。
在Stata和Python之間無縫傳遞數據和結果。
從Python內部使用Stata分析。
在Stata中使用任何Python包
Matplotlib和Seaborn進行可視化
美麗的湯和Scrapy用于網頁抓取
NumPy和熊貓進行數值分析
TensorFlow和scikit-learn用于機器學習
以及更多
我們的每個數據管理功能都經過充分解釋和記錄,并在實際示例中顯示。每個估算器都有完整的文檔記錄,包括幾個關于實際數據的示例,以及如何解釋結果的真實討論。這些示例為您提供數據,以便您可以在 Stata 中工作甚至擴展分析。我們為您提供每個功能的快速入門,展示一些最常見的用途。想要更多細節?我們的方法和公式部分提供了計算內容的具體信息,我們的參考文獻為您提供了更多信息。 Stata 是一個很大的包,所以有很多文檔 - 超過19,000頁,共36卷。但不要擔心,鍵入 help ,Stata 將搜索其關鍵字,索引,甚至社區提供的包,為您帶來您需要了解的主題。一切都在Stata內可用。
我們不僅編程統計方法,還對它們進行驗證。
您從 Stata 估算器看到的結果取決于與其他估算器的比較,一致性和覆蓋率的蒙特卡洛模擬以及我們的統計人員進行的廣泛測試。我們運送的每一個Stata都通過了一套認證套件 ,其中包括410萬行測試代碼,可產生600萬行輸出。我們對600萬行輸出中的每個數字和一段文本進行認證。
Stata 的所有功能都可以通過 菜單,對話框,控制面板,數據編輯器,變量管理器,圖形編輯器甚至 SEM 圖形生成器來訪問。您可以通過任何分析指向并單擊您的方式。
如果您不想編寫命令和腳本,則不必這樣做。
即使您指向并單擊,也可以記錄所有結果,然后將其包含在報告中。您甚至可以保存您的操作創建的命令,并在以后重現您的完整分析。
Stata 執行任務的命令直觀易學。更好的是,您從執行任務中學到的所有知識都可以應用于其他任務。例如,您只需在任何命令中添加“ gender =“ =” female“,即可將分析范圍限制為樣本中的女性。您只需將 vce(robust)添加到任何估計量中,即可獲得對許多常見假設都具有魯棒性的標準誤差和假設檢驗。
一致性更加深入。您從數據管理命令中學到的知識通常適用于估算命令,反之亦然。還有一整套后估計命令,用于執行假設檢驗,形成線性和非線性組合,進行預測,形成對比,甚至使用交互作用圖執行邊際分析。在幾乎每個估算器之后,這些命令都以相同的方式工作。
排序命令以讀取和清除數據,然后執行統計測試和估計,最后報告結果是可重復研究的核心。Stata 使所有研究人員都可以訪問此過程。
每個人都有他們一直在做的任務 - 創建特定類型的變量,生成特定的表,執行一系列統計步驟,計算 RMSE 等。可能性是無窮無盡的。Stata 有數千個內置程序,但可能擁有相對獨特的任務或者您希望以特定方式完成的任務。
如果您編寫了一個腳本來執行給定數據集上的任務,則可以輕松地將該腳本轉換為可用于所有數據集,任何變量集以及任何觀察集的內容。
自動化的一些內容可能非常實用。只需一點代碼,就可以將自動化腳本轉換為 Stata 命令。支持 Stata 官方命令支持的標準功能的命令。可以與使用官方命令相同的方式使用的命令。
Stata 還包括一種高級編程語言-Mata。
Mata 具有您期望在編程語言中使用的結構,指針和類,并為矩陣編程添加了直接支持。
Mata 既是一個用于操作矩陣的交互式環境,也是一個可以生成編譯和優化代碼的完整開發環境。它包括處理面板數據的特殊功能,對實際或復雜矩陣執行操作,為面向對象編程提供全面支持,并與 Stata 的各個方面完全集成。
充分利用您的多核計算機。
沒有其他統計軟件可以與之匹敵。
以最快的速度享受 Stata 19的新功能。
Stata 將在 Windows,Mac 和 Linux / Unix 計算機上運行;但是,我們的許可證不是特定于平臺的。
這意味著,如果您有一臺 Mac 筆記本電腦和 Windows 臺式機,則不需要兩個單獨的許可證即可運行Stata。您可以在任何受支持的平臺上安裝 Stata 許可證。Stata 數據集,程序和其他數據可以在不進行翻譯的情況下跨平臺共享。您還可以快速輕松地從其他統計數據包,電子表格和數據庫中導入數據集。
Stata/MP, Stata/SE, Stata/BE 三個版本
Stata/MP : 最快的 Stata 版本(四核,雙核和多核/多處理器計算機),可以分析最大的數據集。
Stata/SE : 標準版; 對于更大的數據集。
Stata/BE : 基礎版; 用于中型數據集。
Stata/SE 和 Stata/BE 的區別僅在于每個數據集可以分析的數據集大小不同。與 Stata/BE(最多798個)相比,Stata/SE(最多10,998個)和 Stata/MP(最多65,532個)可以擬合具有更多自變量的模型。Stata/SE 最多可以分析20億個觀測值。
Stata/BE 允許具有多達2,048個變量和20億個觀測值的數據集。一個模型中的 Stata/BE 最多可包含798個獨立變量。
Stata/MP 是最快,最大的 Stata 版本。實際上,當前任何一臺計算機都可以利用 Stata/MP 的高級多處理功能。這包括Intel i3, i5, i7, i9, Xeon, Celeron, and AMD multi-core chips。在雙核芯片上,根據耗時的估算命令,Stata/MP的總體運行速度提高40%,在重要的位置運行速度提高72%。Stata / MP具有兩個以上的內核或處理器,速度甚至更快。
Stata MP,Stata/SE和Stata/BE均可在任何計算機上運行,??但Stata/MP的運行速度更快。您可以購買Stata/MP許可證,最多可獲取計算機上的內核數量(最多64個)。例如,如果您的計算機具有八個核心,則可以為八個核心,四個核心或兩個核心購買Stata/MP許可證。
Stata/MP還可以分析比其他任何版本的Stata更多的數據。如果使用當前最大的計算機,Stata/MP可以分析100到200億個觀測值,并且一旦計算機硬件趕上來,就可以分析多達1萬億個觀測值。
在執行計算密集型估計程序時,速度通常是最關鍵的。包括線性回歸在內的一些 Stata 估計程序幾乎是完全并行的,這意味著它們在兩個內核上的運行速度是原來的兩倍,在四個內核上的運行速度是原來的四倍,在八個內核上的運行速度是其八倍,等等。一些估計命令可以比其他命令更多地并行化。以中位數計算,估計命令在 2 核上的運行速度快 1.7 倍,在 4 核上快 2.6 倍,在 8 核上快 3.4 倍。
在管理大型數據集時,速度也很重要。添加新變量幾乎可實現 100% 并行計算,而排序時的并行計算可到達 61% 。
Product features |
![]() |
![]() |
![]() |
||||
(Basic Edition) | (Standard Edition) |
|
|||||
|
Up to 2,048 variables | Up to 32,767 variables | Up to 120,000 variables | ||||
|
2.14 billion | 2.14 billion | Up to 20 billion | ||||
|
Fast | Fast |
|
||||
|
20 seconds | 20 seconds |
|
||||
|
798 | 10,998 | 65,532 | ||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
![]() |
![]() |
|
||||
|
1 GB | 2 GB |
|
||||
|
4 GB | 4 GB |
|
點擊列表鏈接查看視頻功能演示 |
|
Lasso|套索估計量 Reproducible reporting|研究報告的可重復性 Meta-Analysis|元分析 Choice Models|選擇模型 Python Integration|Python集成 Bayes—multiple chains, more|貝葉斯分析新功能 Panel-data ERMs|面板數據ERM Import Data from SAS and SPSS |從SAS和SPSS導入數據 Nonparametric series regression |非參數序列回歸 Frames — multiple datasets in memory|幀-內存中的多個數據集 Panel-data mixed logit | 面板數據 |
Nonlinear DSGE models|非線性 DSGE 模型 Multiple-group IRT | 多組IRT xtheckman|xtheckman新命令 NLMEMs with lags: PK models | PK模型 Heteroskedastic ordered probit | 異方差有序概率 Point sizes for graphics | 圖形 Numerical integration Linear programming | 線性回歸 Mac interface | Mac介面 Do-file Editor autocompletion |do 文件編輯器 Sample-size analysis for CIs |
功能名稱 | 功能介紹 |
線性模型 (Linear models) |
regression ? censored outcomes ? endogenous regressors ? bootstrap, jackknife, and robust and cluster–robust variance ? instrumental variables ? three-stage least squares ? constraints ? quantile regression ? GLS ? DID ? more |
面板/縱向數據 (Panel/longitudinal data) |
random and fixed effects with robust standard errors ? linear mixed models ? random-effects probit ? GEE ? random- and fixed-effects Poisson ? dynamic panel-data models ? instrumental variables ? DID ? panel unit-root tests ? more |
多級混合效應模型 (Multilevel mixed-effects models) |
continuous, binary, count, and survival outcomes ? two-, three-, and higher-level models ? generalized linear models ? nonlinear models ? random intercepts ? random slopes ? crossed random effects ? BLUPs of effects and fitted values ? hierarchical models ? residual error structures ? DDF adjustments ? support for survey data ? more |
二進制、計數和有限結果 (Binary, count, and limited outcomes) |
logistic, probit, tobit ? Poisson and negative binomial ? conditional, multinomial, nested, ordered, rank-ordered, and stereotype logistic ? multinomial probit ? zero-inflated and left-truncated models ? selection models ? marginal effects ? more |
選擇模型 (Choice models) |
discrete choice ? rank-ordered alternatives ? conditional logit ? multinomial probit ? nested logit ? mixed logit ? panel data ? case-specific and alternative-specific predictors ? interpret results—expected probabilities, covariate effects, comparisons across alternatives ? more |
擴展回歸模型(ERMs) (Extended regression models (ERMs)) |
endogenous covariates ? sample selection ? nonrandom treatment ? panel data ? account for problems alone or in combination ? continuous, interval-censored, binary, and ordinal outcomes ? more |
廣義線性模型(GLMs) (Generalized linear models (GLMs)) |
ten link functions ? user-defined links ? seven distributions ? ML and IRLS estimation ? nine variance estimators ? seven residuals ? more |
有限混合模型(FMMs) (Finite mixture models (FMMs)) |
fmm: prefix for 17 estimators ? mixtures of a single estimator ? mixtures combining multiple estimators or distributions ? continuous, binary, count, ordinal, categorical, censored, truncated, and survival outcomes ? more |
空間自回歸模型 (Spatial autoregressive models) |
spatial lags of dependent variable, independent variables, and autoregressive errors ? fixed and random effects in panel data ? endogenous covariates ? analyze spillover effects ? more |
方差分析/多變量方差分析 (ANOVA/MANOVA) |
balanced and unbalanced designs ? factorial, nested, and mixed designs ? repeated measures ? marginal means ? contrasts ? more |
精確統計 (Exact statistics) |
standardization of rates ? case–control ? cohort ? matched case–control ? Mantel–Haenszel ? pharmacokinetics ? ROC analysis ? ICD-10 ? more |
流行病學 (Epidemiology) |
standardization of rates ? case–control ? cohort ? matched case–control ? Mantel–Haenszel ? pharmacokinetics ? ROC analysis ? ICD-10 ? more |
動態隨機一般均衡模型 (DSGE models) |
specify models algebraically ? solve models ? estimate parameters ? identification diagnostics ? policy and transition matrices ? IRFs ? dynamic forecasts ? Bayesian ? more |
測試、預測和結果 (Tests, predictions, and effects) |
Wald tests ? LR tests ? linear and nonlinear combinations ? predictions and generalized predictions ? marginal means ? least-squares means ? adjusted means ? marginal and partial effects ? forecast models ? Hausman tests ? more |
差異、成對比較和差數 (Contrasts, pairwise comparisons, and margins) |
compare means, intercepts, or slopes ? compare with reference category, adjacent category, grand mean, etc. ? orthogonal polynomials ? multiple-comparison adjustments ? graph estimated means and contrasts ? interaction plots ? more |
再抽樣及模擬方法 (Resampling and simulation methods) |
bootstrap ? jackknife ? Monte Carlo simulation ? permutation tests ? exact p-values ? more |
多變量方法 (Multivariate methods) |
factor analysis ? principal components ? discriminant analysis ? rotation ? multidimensional scaling ? Procrustean analysis ? correspondence analysis ? biplots ? dendrograms ? user-extensible analyses ? more |
時間序列 (Time series) |
ARIMA ? ARFIMA ? ARCH/GARCH ? VAR ? VECM ? multivariate GARCH ? unobserved-components model ? dynamic factors ? state-space models ? Markov-switching models ? business calendars ? tests for structural breaks ? threshold regression ? forecasts ? impulse–response functions ? unit-root tests ? filters and smoothers ? rolling and recursive estimation ? Bayesian ? more |
生存分析 (Survival analysis) |
Kaplan–Meier and Nelson–Aalen estimators, ? Cox regression (frailty) ? parametric models (frailty, random effects) ? competing risks ? hazards ? time-varying covariates ? left-, right-, and interval-censoring ? Weibull, exponential, and Gompertz models ? more |
貝葉斯分析 (Bayesian analysis) |
thousands of built-in models ? univariate and multivariate models ? linear and nonlinear models ? panel data ? multilevel models ? VAR ? DSGE ? continuous, binary, ordinal, and count outcomes ? bayes: prefix for 58 estimation commands ? continuous univariate, multivariate, and discrete priors ? add your own models ? multiple chains ? convergence diagnostics ? posterior summaries ? hypothesis testing ? model fit ? model comparison ? predictions ? dynamic forecast ? impulse-response functions ? more |
元分析 (Meta-analysis) |
effect sizes ? common, fixed, and random effects ? forest, funnel, and more plots ? subgroup, leave-one-out, and cumulative analysis ? meta-regression ? small-study effects ? publication bias ? multivariate ? more |
功效、精度和樣本大小 (Power, precision, and sample size) |
power ? sample size ? effect size ? minimum detectable effect ? CI width ? means ? proportions ? variances ? correlations ? ANOVA ? regression ? cluster randomized designs ? case–control studies ? cohort studies ? contingency tables ? survival analysis ? balanced or unbalanced designs ? results in tables or graphs ? more |
治療效果/因果推斷 (Treatment effects/Causal inference) |
inverse probability weight (IPW) ? doubly robust methods ? propensity-score matching ? regression adjustment ? covariate matching ? DID ? multilevel treatments ? endogenous treatments ? average treatment effects (ATEs) ? ATEs on the treated (ATETs) ? potential-outcome means (POMs) ? continuous, binary, count, fractional, and survival outcomes ? panel data ? lasso ? more |
Lasso回歸模型 (Lasso) |
lasso ? elastic net ? model selection ? prediction ? inference ? continuous, binary, and count outcomes ? cross-validation ? adaptive lasso ? double selection ? partialing out ? cross-fit partialing out ? double machine learning ? endogenous covariates ? treatment effects ? more |
結構方程模型(SEM) (SEM (structural equation modeling)) |
graphical path diagram builder ? standardized and unstandardized estimates ? modification indices ? direct and indirect effects ? continuous, binary, count, ordinal, and survival outcomes ? multilevel models ? random slopes and intercepts ? factor scores, empirical Bayes, and other predictions ? groups and tests of invariance ? goodness of fit ? handles MAR data by FIML ? correlated data ? survey data ? more |
潛伏組分析 (Latent class analysis) |
binary, ordinal, continuous, count, categorical, fractional, and survival items ? add covariates to model class membership ? combine with SEM path models ? expected class proportions ? goodness of fit ? predictions of class membership ? more |
多重估算 (Multiple imputation) |
nine univariate imputation methods ? multivariate normal imputation ? chained equations ? explore pattern of missingness ? manage imputed datasets ? fit model and pool results ? transform parameters ? joint tests of parameter estimates ? predictions ? more |
調查方法 (Survey methods) |
multistage designs ? bootstrap, BRR, jackknife, linearized, and SDR variance estimation ? poststratification ? raking ? calibration ? DEFF ? predictive margins ? means, proportions, ratios, totals ? summary tables ? almost all estimators supported ? more |
聚類分析 (Cluster analysis) |
hierarchical clustering ? kmeans and kmedian nonhierarchical clustering ? dendrograms ? stopping rules ? user-extensible analyses ? more |
項目反應理論(IRT) (IRT (item response theory)) |
binary (1PL, 2PL, 3PL), ordinal, and categorical response models ? item characteristic curves ? test characteristic curves ? item information functions ? test information functions ? multiple-group models ? differential item functioning (DIF) ? more |
網絡分析 (Network analysis) |
nwcommands: import and manipulate networks ? generate networks ? calculate centrality and dissimilarity measures ? visualize networks ? more |
數據[資料]管理 (Data manipulation) |
data transformations ? data frames ? match-merge ? import/export data ? JDBC ? ODBC ? SQL ? Unicode ? by-group processing ? append files ? sort ? row–column transposition ? labeling ? save results ? more |
報表 (Reporting) |
reproducible reports ? customizable tables ? graphical tables builder ? Word ? Excel ? PDF ? HTML ? dynamic documents ? Markdown ? Stata results and graphs ? SVG ? EPS ? PNG ? TIF ? more |
繪圖 (Graphics) |
lines ? bars ? areas ? ranges ? contours ? confidence intervals ? interaction plots ? survival plots ? publication quality ? customize anything ? Graph Editor ? more |
編程特點 (Programming features) |
adding new commands ? scripting ? object-oriented programming ? menu and dialog-box programming ? dynamic documents ? Markdown ? Project Manager ? Python integration ? PyStata ? Jupyter notebook ? Java integration ? Java plugins ? H2O access ? C/C++ plugins ? more |
矩陣編程 Mata—Stata重要編程語言 (Mata—Stata's serious programming language) |
interactive sessions ? large-scale development projects ? optimization ? matrix inversions ? decompositions ? eigenvalues and eigenvectors ? LAPACK engine ? Intel? MKL ? real and complex numbers ? string matrices ? interface to Stata datasets and matrices ? numerical derivatives ? object-oriented programming ? more |
圖形用戶界面 (Graphical user interface) |
menus and dialogs for all features ? Data Editor ? Variables Manager ? Graph Editor ? Project Manager ? Do-file Editor ? multiple preference sets ? more |
參考資料 (Documentation) |
35 manuals ? 18,000+ pages ? seamless navigation ? thousands of worked examples ? quick starts ? methods and formulas ? references ? more |
基本統計 (Basic statistics) |
summaries ? cross-tabulations ? correlations ? z and t tests ? equality-of-variance tests ? tests of proportions ? confidence intervals ? factor variables ? more |
非參數方法 (Nonparametric methods) |
nonparametric regression ? Wilcoxon–Mann–Whitney, Wilcoxon signed ranks, and Kruskal–Wallis tests ? Cochran–Armitage and other trend tests ? Spearman and Kendall correlations ? Kolmogorov–Smirnov tests ? exact binomial CIs ? survival data ? ROC analysis ? smoothing ? bootstrapping ? more |
GMM與非線性回歸 (GMM and nonlinear regression) |
generalized method of moments (GMM) ? nonlinear regression ? more |
簡單最大概似法 (Simple maximum likelihood) |
specify likelihood using simple expressions ? no programming required ? survey data ? standard, robust, bootstrap, and jackknife SEs ? matrix estimators ? more |
可編程最大概似法 (Programmable maximum likelihood) |
user-specified functions ? NR, DFP, BFGS, BHHH ? OIM, OPG, robust, bootstrap, and jackknife SEs ? Wald tests ? survey data ? numeric or analytic derivatives ? more |
其他統計方法 (Other statistical methods) |
kappa measure of interrater agreement ? Cronbach's alpha ? stepwise regression ? tests of normality ? more |
函數 (Functions) |
statistical ? random-number ? mathematical ? string ? date and time ? regular expressions ? Unicode ? more |
互聯網功能 (Internet capabilities) |
search and download thousands of community-contributed features (see below) ? web updating ? web file sharing ? latest Stata news ? more |
網絡社區功能 (Community-contributed features) |
search and download thousands of free additions ? discover new features in the Stata Journal ? share commands by posting to the SSC ? discuss community-contributed features on Statalist ? more |
嵌入式統計計算 (Embedded statistical computations) |
Numerics by Stata ? more |
安裝驗證 (Installation Qualification) |
IQ report for regulatory agencies such as the FDA ? installation verification ? more |
FDA規則 (FDA Compliance) |
Adherence to FDA regulatory requirement for statistical software ? more |
無障礙訪問 (Accessibility) |
Section 508 compliance, accessibility for persons with disabilities ? more |
樣本范例 (Sample session) |
A sample session of Stata for Mac, Unix, or Windows. |
1. 表格 (Tables)
用戶一直希望我們提供更完美的表格,現在您可以很容易地創建比較回歸結果或匯總統計數據的表格,您可以創建樣式并將其應用于您構建的任何表,還可以將表導出到MS Word?, PDF, HTML, LaTeX, MS Excel?, 并將它們插入到報告中。新版本修改了table命令,新的 collective 前綴可以從任意多個命令收集任意多的結果,生成表格,并將其導出為多種格式等。您還可以使用新的Tables Builder來單擊并創建表格。
2. 貝葉斯計量經濟學
Stata能進行計量經濟學,也能進行貝葉斯統計,現在Stata能夠進行貝葉斯計量經濟學!想要用概率性的陳述來回答經濟問題,例如:那些參加職業培訓項目的人在未來五年里更有可能保持就業嗎?想把對經濟過程的先驗知識結合起來嗎?Stata新推出的貝葉斯計量經濟學功能可以幫到您。適合許多貝葉斯模型,如橫截面模型、面板數據模型、多層模型和時間序列模型。使用貝葉斯因子比較模型,獲取更多預測和展望!
在計量經濟學建模中使用貝葉斯方法的吸引力之一是將關于通常在實踐中可用的模型參數的外部信息納入其中。這些信息可能來自歷史數據,也可能自然來自經濟過程的知識。無論哪種方式,貝葉斯方法都可以使我們將外部信息與我們在當前數據中觀察到的信息結合起來,以形成對感興趣的經濟過程的更現實的看法。
Stata 17 在貝葉斯計量經濟學領域提供了幾個新功能:
> Bayesian VAR models /貝葉斯VAR模型
> Bayesian IRF and FEVD analysis /貝葉斯IRF和FEVD分析
> Bayesian dynamic forecasting /貝葉斯動態預測
> Bayesian longitudinal/panel-data models /貝葉斯縱向/面板數據模型
> Bayesian linear and nonlinear DSGE models /貝葉斯線性與非線性DSGE模型
3. 更快的Stata
4. 雙重差分(DID)和DDD模型
新的估計命令didregress和xtdidregress具有使用重復測量數據擬合雙重差分(DID)模型和三重差分(DDD)模型。 didregress適用于重復橫截面數據,xtdidregress適用于縱向/面板數據。
采用DID和DDD模型,用重復測量數據估計平均治療效果(ATET)。 治療效果可以是藥物方案對血壓的影響,也可以是培訓計劃對就業的影響。 與現有的teffects命令可用的標準橫截面分析不同,DID分析可控制估計ATET時的組和時間效應,組可在其中識別重復的度量。DDD分析控件可控制其他組效果及其與時間的相互作用——您最多可以指定三個組變量或兩個組變量和一個時間變量。
5. 區間刪失Cox模型
半參數Cox比例風險回歸模型通常用于分析未刪失和右刪失的事件時間數據。 新的估計命令stintcox可使用Cox模型,來估計刪失事件時間數據。當未直接觀察到發生某個事件(例如癌癥復發)的時間,但已知該時間間隔在某個時間間隔內時,便會進行時間間隔檢查。例如,可以在定期檢查之間檢測到癌癥的復發,但是無法觀察到確切的復發時間。我們只知道在先前檢查和當前檢查之間的某個時間復發了癌癥。忽略區間刪失可能會導致錯誤的結果(有偏差的)。
當沒有完全指定基線風險函數時,對區間刪失事件時間數據進行半參數估計是一項挑戰,因為沒有一個事件時間是被精確地觀測到的。
因此,這些數據的“半參數”建模通常采用樣條方法或分段指數模型作為基線風險函數。直到最近的方法學進展(在stintcox命令中實現)之后,才提供真正的區間刪失事件時間數據的半參數建模。
6. 多維元分析
您想分析多項研究的結果。這些研究報告了多個效應量,這些效應量很可能在一項研究中相互關聯。單獨的meta分析(例如使用現有meta命令的那些meta分析)將忽略相關性。現在,您可以使用新的meta mvregress命令執行多維元分析,這將解釋相關性。
7. 貝葉斯VAR模型
貝葉斯前綴現在支持var命令以擬合貝葉斯矢量自回歸(VAR)模型。VAR模型通過將結果變量的滯后時間作為模型預測變量來研究多個時間序列之間的關系。已知這些模型具有許多參數:對于K個結果變量和標記,至少存在p(K ^ 2 + \ nn1)個參數。對模型參數的可靠估計可能會遇到挑戰,尤其是在使用小型數據集的情況下。貝葉斯VAR模型通過整合有關模型參數的先驗信息來穩定參數估計,從而克服了這些挑戰。
8. PyStata
Stata 17引入了一個我們稱之為PyStata的概念。PyStata是一個涵蓋了Stata和Python可以交互的所有方式的術語。
Stata 16具有從Stata調用Python代碼的功能。Stata 17允許您通過一個新的pystata Python包從一個獨立的Python環境中調用Stata,從而極大地擴展了此功能。您可以在基于IPython內核的環境(例如Jupyter Notebook和控制臺以及Jupyter Lab和控制臺)中方便地訪問Stata和Mata。
在其他支持IPython內核的環境中(例如,Spyder IDE和PyCharm IDE);或從命令行訪問Python(例如Windows命令提示符,macOS終端,Unix終端和Python的IDLE)時。
9. Lasso治療效果評估
您可以使用teffects 來估計治療效果。您可以使用Lasso來控制許多協變量。(當我們說“很多”時,可以理解為成百上千甚至更多!)現在,您可以使用telasso來估計治療效果并控制許多協變量。
10. Galbraith圖
新命令meta galbraithplot生成Galbraith圖以進行元分析。這些圖可用于評估研究的異質性和檢測潛在的異常值。當有許多研究時,它們還可以用作森林圖forest plots的替代方案,以總結元分析結果。
11. 留一元分析
現在,您可以通過使用meta summarize和meta forestplot的新選項leaoneout來執行留一元分析。留一元分析通過在每次分析中排除一項研究來執行多種元分析。研究通常會產生夸大的效應大小,這可能會扭曲整體結果。留一元分析可用于研究每項研究對總體效應量估計的影響,并確定有影響力的研究。
12. 貝葉斯縱向/面板模型
通過使用xtreg表示連續結果,xtlogit或xtprobit表示二進制結果,xtologit或xtoprobit表示序數結果等,可以擬合隨機效應面板數據模型。在Stata 17中,您可以簡單地通過在它們前面加上Bayes前綴來擬合這些模型的Bayesian版本。
13. 面板多項邏輯模型
Stata的新估計命令xtmlogit可使用面板多項邏輯(MNL)模型,以對隨時間推移觀察到的分類結果進行分類。假設我們手機了幾個星期關于個人對餐館選擇的數據。餐館的選擇是沒有自然排序的分類結果,因此我們可以使用現有的mlogit命令(帶有聚類穩健的標準誤)。但是xtmlogit直接對單個特征建模,因此可能會產生更有效的結果。并且它可以很好地解釋可能與協變量相關的特征。
14. 零膨脹排序邏輯模型
新的估計命令ziologit適合零膨脹排序邏輯回歸模型。這個模型是在當數據在最低類別中的觀測值比例高于標準有序邏輯模型的預期值時使用的。我們將最低類別中的觀測值稱為零,因為它們通常對應于某一行為或特征的缺失。零膨脹是通過假設零同時來自邏輯模型和有序邏輯模型來解釋的。每個模型可以具有不同的協變量,并且結果可以顯示為優勢比而不是默認系數。
15. 貝葉斯多層次模型:非線性、聯合、類SEM等
您可以使用bayesmh命令的新的精美隨機效果語法來擬合貝葉斯多級模型的廣度。您可以更輕松地擬合單變量線性和非線性多級模型。現在,您可以擬合多元線性和非線性多級模型!考慮增長線性和非線性多級模型,聯合縱向和生存時間模型,SEM型模型等等。
16. 貝葉斯動態預測
在擬合多元時間序列模型(例如向量自回歸(VAR)模型)之外,動態預測是一種常見的預測工具。擬合經典var模型后,可以使用fcast計算動態預測。 使用bayes:var擬合貝葉斯var模型后,現在可以使用bayesfcast 來計算貝葉斯動態預測。貝葉斯動態預測會生成整個預測值樣本,而不是像傳統分析中那樣生成單個預測。該樣本可用于解答各種建模問題,例如,在估計預測不確定性時,在不做出漸近正態性假設的前提下,該模型對未來觀測的預測程度如何。這對于可能會出現漸近正態性假設的小型數據集尤其有吸引力。
17. 貝葉斯IRF與FEVD分析
脈沖響應函數(IRF),動態乘數函數和預測誤差方差分解(FEVD)通常用于描述多元時間序列模型(例如VAR模型)的結果。VAR模型具有許多參數,可能難以逐個解釋。 IRFs和其他函數將多個參數的影響合并為一個摘要(每個時間段)。例如,IRFs測量一個變量對給定結果變量的沖擊(變化)的影響。貝葉斯IRFs(和其他函數)使用IRFs的“精確”后驗分布產生結果,這不依賴于漸近正態性的假設。它們還可以為小型數據集提供更穩定的估計,因為它們合并了有關模型參數的先驗信息。
18. 使用 BIC 選擇Lasso懲罰參數
懲罰參數的選擇是lasso分析的基礎。套用少量的懲罰可能會包含太多變量。套用較大的懲罰可能會忽略潛在的重要變量。lasso估計已經提供了幾種懲罰選擇方法,包括交叉驗證,自適應和插件。現在,您可以使用貝葉斯信息準則(BIC)通過指定selection(bic)選項在Lasso進行預測和Lasso進行推理之后選擇懲罰參數。同樣,在擬合Lasso模型后,新的后估計命令bicplot將BIC值繪制為懲罰參數的函數。這為懲罰參數的值提供了方便的圖形表示形式,從而使BIC功能最小化。
19. lasso聚類數據
現在,您可以在Lasso分析中解釋集群數據。忽略聚類可能會導致錯誤結果,因為同一聚類中的觀測值之間存在相關性。使用Lasso命令進行Lasso和Elasticnet等預測,您可以指定新的cluster({\ it clustvar})選項。使用Lasso命令進行推斷(例如:poregress),您可以指定新的vce(cluster {\ it clustvar})選項。
20. 貝葉斯線性和非線性DSGE模型
現在,可以通過在dsge和dsgenl前面加上前綴Bayes:來擬合貝葉斯線性和非線性動態隨機一般均衡(DSGE)模型。通過從30多種不同的先驗分布中進行選擇,合并有關模型參數范圍的信息。執行貝葉斯IRF分析,執行區間假設檢驗,使用貝葉斯因子比較模型等等。
21. Jupyter Notebook與Stata
Jupyter Notebook是一個功能強大且易于使用的Web應用程序,它允許您將在單個文檔(“筆記本”)中將可執行代碼、可視化、數學方程式和公式、敘述文本以及其他富媒體組合在一起,以進行交互式計算和開發。 它已被研究人員和科學家廣泛使用,以分享他們的想法和成果,進行協作和創新。
在Stata 17中,作為PyStat的一部分,您可以使用IPython(交互式Python)內核從Jupyter Notebook調用Stata和Mata。這意味著您可以在一個環境中結合使用Python和Stata的功能,以使您的工作易于復制和與他人共享。
從Jupyter Notebook調用Stata是由新的pystata Python軟件包驅動的。
22. 日期和時間的新功能
Stata 17增加了新的便利功能,用于處理Stata和Mata中的日期和時間。 新功能可以分為三類:
1.Datetime持續時間:旨在獲取持續時間的函數(例如ages)。
2.相對日期:基于其他日期返回日期的函數,例如相對于給定日期的下一個生日。
3.Datetime組件:從日期時間值中提取不同成分的函數。
新功能將閏年,閏日和閏秒(如果適用的話)考慮在內。
閏秒是一秒的調整,偶爾會應用于協調世界時(UTC)。
23. Intel數學內核庫(MKL)
Stata 17引入了在兼容硬件(所有基于Intel和AMD的64位計算機)上使用Intel Math Kernel Library(MKL)的方法,并提供了深度優化的LAPACK例程。
LAPACK是線性代數包的縮寫,它是一套用于求解聯立方程組、特征值問題和奇值問題等的程序。Mata運算符和函數(如qrd()、lud()和cholesky())在可能的情況下利用LAPACK進行許多數值操作。
由英特爾MKL支持的LAPACK提供了最新的LAPACK例程,這些例程針對現代Intel和現代AMD處理器使用的64位Intel x86-64指令集進行了優化。使用MKL的Mata函數和運算符在性能方面大有裨益。最重要的是,您無需采取任何措施即可充分利用速度的提高。使用這些Mata函數和運算符的Stata命令以及Mata函數和運算符本身,將在兼容硬件上自動使用Intel MKL。
24. Stata on Apple Silicon
Stata 17 for Mac是一款通用應用程序,可以在Apple Silicon和Intel處理器的Mac上運行。采用Apple Silicon的Mac電腦包括新款MacBook Air、MacBook Pro和Mac mini,均采用M1處理器。M1芯片承諾有更高的性能和更大的功能效率。這對于我們的Stata-for-Mac用戶來說是值得注意的,他們中的許多人使用Mac筆記本電腦。
雖然第一套M1 mac被認為是入門級的,但我們發現,本機運行Stata的M1 mac比英特爾mac的性能要好30-35%。它們的性能甚至遠遠超過價格超過兩倍的Intel Mac!對于只堅持在其Apple Silicon Mac上使用Apple-Siliconnative軟件的用戶,從安裝程序到應用程序本身,Stata 17的任何部分都不需要用到Rosetta 2。
無論您是在M1 Mac上還是在Intel Mac上本地運行Stata,Stata的功能都相同,并且M1 Mac不需要特殊的許可證。英特爾Mac用戶應注意,未來幾年,我們將繼續支持并發布適用于英特爾處理器的Mac的新版本Stata。
25. JDBC
將Stata與數據庫連接變得更加容易了。Stata 17添加了對JDBC(Java數據庫連接)的支持。 新的jdbc命令支持JDBC標準,用于與具有矩形數據的關系數據庫或非關系數據庫管理系統交換數據。您可以從一些最受歡迎的數據庫供應商中導入數據,例如Oracle,MySQL,Amazon Redshift,Snowflake,Microsoft SQL Server等。
jdbc的優點在于它是一個跨平臺的解決方案,因此我們的JDBC設置適用于Windows,Mac和Unix系統。如果您的數據庫供應商提供了JDBC驅動程序,則可以下載并安裝該驅動程序,然后通過jdbc在數據庫上讀取,寫入和執行SQL。 您可以將整個數據庫表加載到Stata中,也可以使用SQL SELECT將表中的特定列加載到Stata中。您還可以將所有變量插入數據庫表中,或僅插入數據集的子集。
26. Java集成
在Stata 17中,您現在可以直接在Stata中嵌入和執行Java代碼。您可以在以前的Stata版本中創建和使用Java插件,但這需要您編譯代碼并將其打包到Jar文件中。在do文件中執行Java可以讓您自由地執行直接與Stata代碼綁定的Java代碼。現在,您可以在do-file或ado-file中編寫Java代碼,甚至可以從Stata中交互式地調用Java(如JShell)。
Java的優勢之一在于與Java虛擬機打包在一起的廣泛的APIs。還有許多有用的第三方庫。根據您需要執行的操作,您甚至可以編寫并行代碼以利用多核運算。您編寫的Java代碼可以即時編譯,無需使用外部編譯器!此外,還包括Stata函數接口(SFI)Java軟件包,提供了Stata與Java之間的雙向連接。
SFI包具有訪問Stata當前數據集,幀,宏,標量,矩陣,值標簽,特征,全局Mata矩陣,日期和時間值等的類。Stata將Java開發工具包(JDK)與其安裝捆綁在一起,因此不涉及其他設置。
27. H2O集成
在Stata 17中,我們一直在嘗試連接H2O,H2O是一種可擴展的分布式開源機器學習和預測分析平臺。您可以在https://docs.h2o.ai/上了解有關H2O的更多信息。
借助H2O的集成,您可以從Stata上啟動,連接和查詢H2O集群。此外,我們提供了一組命令來處理集群上的數據(H2O幀)。例如,您可以通過導入數據文件或加載Stata的當前數據集來創建新的H2O框架。您還可以在Stata內部拆分,組合和查詢H2O幀。盡管對于我們來說,這仍處于試驗階段,但我們希望將其提供給我們的用戶進行試用。
另一方面,由于它是實驗性功能,因此語法和功能可能會發生變化。使用提供對H2O特定功能的訪問的Stata命令時,請記住這是H2O功能。盡管您可能通過Stata命令訪問它,但它的工作取決于H2O,并且不在Stata范圍內。
28. do文件編輯器:導航,增強書簽…
Stata 17中的“文件”編輯器進行了以下改進:
1. 書簽:現在與do文件一起保存。
2. 新的導航控件:可以輕松瀏覽do文件。
3. 語法高亮顯示支持現已包括Java和XML。
4. 選區中引號,括號和方括號的自動補全。 例如,選擇文本mymacro,然后輸入左引號`;。 然后,文件編輯器將用單引號將文本選擇綁定,將選擇更改為“ mymacro”。
書簽:do文件編輯器最需要的功能之一是能夠將書簽保存在do文件中。書簽用于標記感興趣的行,以便以后更輕松地導航到它們。書簽在瀏覽長do文件時特別有用。
您可以將書簽添加到您的do文件的各個部分,以執行數據管理,顯示摘要、統計信息并執行統計分析。然后,您可以使用菜單、工具欄或新的導航控件在這些部分之間快速來回移動,而無需滾動幾行代碼來查找所需的部分。
導航: Stata 17通過新的導航控件使do文件的導航更加容易,該控件顯示書簽及其標簽的列表。從導航控件中選擇一個書簽會將“do文件編輯器”移至書簽所在的行。除了書簽之外,導航控件還將顯示do文件中的程序列表。從導航控件中選擇一個程序會將“do文件編輯器”移至該程序的釋義。無需將其他程序添加到“導航”中。 DO文件編輯器將自動將程序的釋義添加到導航控件中。
29. 非參數的趨勢檢驗
現在,nptrend命令支持四種跨有序組的趨勢檢驗。您可以在the Cochran–Armitage test, the Jonckheere–Terpstra test, the linear-by-linear trend test, and the Cuzick test using ranks之間進行選擇。前三個檢驗是新的,而第四個檢驗由nptrend先前執行。
Lasso
作為大數據Volume的一種重要形式,“高維數據”(high-dimensional data)解釋變量很多,甚至超過樣本容量。Lasso (Least Absolute Shrinkage and Selection Operator,也稱“套索估計量”)及其衍生的系列估計量正是進行高維回歸的主要工具。
Lasso系列的官方命令,包括lasso, elasticnet(彈性網)與 sqrtlasso(平方根Lasso),可估計線性回歸模型(比如 lasso linear)、二值選擇模型(比如,lasso logit 與 lasso probit)、計數模型(比如,lasso poisson)等。
Lasso 系列的估計量通常使用懲罰回歸(penalized regressions)來處理高維數據,以避免“過擬合”(overfit)與“方差爆炸”(variance explosion),并進行“變量選擇”(variable selection)。這些懲罰回歸對于回歸系數過大的懲罰力度則一般由調節參數(tuning parameter)或 L1范數(L1 norm)來控制。
使用 Stata 16的Lasso命令,可以很方便地計算回歸系數的整個路徑(coefficient paths),作為調節參數 或 L1范數的函數;并根據“交叉驗證”(cross-validation)選擇最優的調節參數 ,參見下圖。
Stata 官方命令還提供了 Lasso 系列相應的統計推斷方法,比如計算標準誤、置信區間,或進行假設檢驗。這些統計推斷方法包括“double-selection lasso”(比如,dsregress,dslogit,dspoisson),“partialling-out lasso”(比如,poregress,pologit,popoisson),以及“cross-fit partialing out lasso”(比如,xporegress,xpologit,xpopoisson)。
Multiple Datasets in Memory
在大數據時代,學界與業界越來越需要在內存中同時處理多個數據集。在此前的 Stata 版本中,Stata 內存只能有一個數據集。這種設置雖簡便易行,在小數據時代也基本夠用,但在大數據時代,由于數據的來源 Variety 多樣,已成為應用的瓶頸。
因此,Stata 適時地推出在內存內同時調用多達100個數據集的重要功能。比如,你可以很方便地根據內存中多個數據集的信息來定義一個新的變量。
Python Integration
隨著機器學習與數據科學的興起,Python 無疑是最炙手可熱的編程語言之一。為此,Stata 16 專門提供了一個與 Python 的接口,讓用戶可以在熟悉的 Stata 界面下調用 Python,并在 Stata 中顯示運行結果。
比如,此前的 Stata 版本無法畫三維立體圖,而在Stata 16中,通過調用Python 的 Matplotlib 則不難實現(參見下圖)。
這也意味著,你可以在 Stata 中,通過 Python 接口,使用 Python 所擅長的各種機器學習方法,包括隨機森林、梯度提升、支持向量機、神經網絡等!
Do-file Editor -- Autocompletion and More Syntax Highlighting
在大數據時代,編程越來越成為一種基本技能。在 Stata 中編程,無疑需要一個很好的 do 文件編輯器(Do-file Editor)。 讓人驚喜的是,Stata 的 do 文件編輯器的性能也有了大幅提升,包括 Stata 命令的自動填寫完成(autocompletion),以及更多語法高亮顯示(syntax highlighting),這無疑將為 Stata 編程提供很大便利。
Meta-Analysis
Stata 提供了全新的 Meta-Analysis 模塊,使得元分析變得十分方便、快捷而高效,并輔之以強大的可視化功能(參見下圖)。
Reporting
由于大數據的更新頻繁特點(Velocity),使得數據分析經常需要重復進行,使用更新的數據。此時,研究報告的可重復性(Reproducibility)就變得日益重要,即保證任何人只要運行你的 Stata 程序即可得到完全一樣的研究報告。這些研究報告的格式可以是 Word,PDF,Excel 或 HTML(參見下圖)。 隨著大數據時代的數據來源 Variety 越來越多,使得我們時常需要將不同來源的樣本數據之研究結果整合在一起,即所謂“元分析”(Meta-Analysis)。
而且,當你的數據集更新之后,再運行一遍你的 Stata,則你的研究報告也會相應地自動更新!Stata 16 新引入或完善的相關命令包括 dyndoc,markdown,putdocx,html2docx,doc2pdf。
小貼士:還在發愁如何將 Word 文件轉化為 PDF 格式?Stata 16 的 doc2pdf 命令就能幫你搞定!
Import Data from SAS and SPSS
如果你有數據在 SAS 或 SPSS 中,想要導入 Stata 以利用其強大的統計與計量功能,Stata 16 貼心地提供了專門的新命令 import sas 與 import spss,使得這種數據遷移變得十分方便與快捷,參見下圖。
Stata 深耕計量經濟學的經典與前沿方法
Nonparametric Series Regression
序列回歸(series regression)是非參數回歸(nonparametric regression)的一種重要方法。它使用多項式(polynomials)、B-樣條(B-splines)或樣條(splines)所構成的序列來近似逼近任意的未知回歸函數。
Stata 推出的命令 npregress series 填補了 Stata 在非參數回歸領域的又一空白,使得非參數序列回歸變得方便而高效;比如,計算平均邊際效應(average marginal effects)。命令 npregress series 甚至可以估計“半參數模型”(semi-parametric model),即同時包含參數與非參數部分的模型。
Choice Models
對于微觀計量中常用的“離散選擇模型”(discrete choice models),Stata 設立了一個“選擇模型”(Choice Models)的模塊。在估計選擇模型之前,你先通過命令 cmset 來宣布你的數據為選擇模型,然后可用命令 cmsummarize,cmchoiceset,cmtab 或 cmsample 來考察你的選擇模型。
估計選擇模型的相應 Stata 命令也統一帶上了 cm 的前綴,比如
cmclogit:conditional logit model
cmmixlogit:mixed logit model
cmxtmixlogit:panel-data mixed logitmodel
cmmprobit:multinomial probitmodel
cmroprobit:rank-ordered probitmodel
cmrologit:rank-ordered logitmodel
其中,cmxtmixlogit 是 Stata 16的全新命令,用于估計面板數據的混合邏輯模型(mixed logit models for panel data)。
Panel-data ERMs
Stata 15 推出了 ERM(Extended Regression Models)模塊,可以處理同時出現“內生性”(endogeneity)、“樣本選擇”(sample selection)與“處理效應”(treatment)這三種并發癥的情形,或三者的任意組合,非常靈活實用。Stata 16 則將ERMs 推廣到了面板數據中,新引入了xtegress,xteintreg,xteprobit,xteoprobit 等強大命令。
New in Bayesian Analysis
Stata 的“貝葉斯分析”(Bayesian Analysis)模塊也有了不少新功能。比如,可使用多個馬爾科夫鏈(multiple chains)來檢驗現代貝葉斯分析所依賴的馬爾科夫鏈蒙特卡洛(Markov China Monte Carlo)是否收斂;以及使用后驗分布(posterior distribution)進行“貝葉斯預測”(Bayesian predictions),參見下圖。
Nonlinear DSGE Models
tata 可以通過命令 dsgenl 來估計非線性 DSGE 模型。 使用命令dsgenl,無須再手工將 DSGE 模型線性化,直接輸入非線性的 DSGE 模型,Stata 即會自動地對它進行線性化與估計。
xtheckman
xtheckman命令 使得 Heckman 的樣本選擇模型(sample model)也可以在面板數據中估計。
系統要求
Stata for Windows
Windows 11*
Windows 10 *
Windows Server 2022, 2019, 2016, 2012R2 *
* Stata requires 64-bit Windows for x86-64 processors made by Intel? or AMD (Core i3 equivalent or better)
Stata for Mac
Mac with Apple Silicon or Intel processor (Core i3 or better)
macOS 11.0 (Big Sur) or newer for Macs with Apple Silicon and macOS 10.13 (Sierra) or newer for Macs with 64-bit Intel processors
Stata for Linux
Any 64-bit (Core i3 equivalent or better) running Linux
Minimum requirements include the GNU C library (glibc) 2.17 or better and libcurl4
Check the output of ldd -v within a terminal
For xstata, you need to have GTK 2.24 installed
Hardware requirements
Package | Memory | Disk space |
Stata/MP | 4GB | 4GB |
Stata/SE | 2GB | 4GB |
Stata/BE | 1GB | 4GB |
Stata for Linux requires a video card that can display thousands of colors or more (16-bit or 24-bit color)
在在世界已邁入大數據新時代的今天,Stata 在高校商科類專業、科研院所以及企業界的應用越來越廣泛,已成為各大高校必備的專業軟件,隨著其用戶群體的不斷擴大,建立中國用戶與 Stata 總部之間的溝通和磋商機制越發成熟。聆聽用戶的心聲,收集業界專家的論點與建議,已成為會議的主旨,無論您是為科研應用之路尋找最佳解決方案, 還是專注 Stata 軟件探索與研究,抑或是竭力于提高工作效率的數據處理技能,在 Stata 中國用戶大會上,您的需求都能得到前所未有的碰撞與共鳴。故 Stata 中國用戶大會(China Stata Users' Conference)由此誕生,由北京友萬信息科技有限公司(Beijing Uone Info&Tech Co.,Ltd)和StataCorp LLC原廠聯合發起,規劃每年舉辦一屆,通過廣泛的國際學術交流,幫助 Stata 中國用戶探索更深層次的理論和研究。我們希望通過每年一屆的 Stata 用戶會議,讓 Stata 中國用戶及學者提高自身軟件應用水平,開辟“學中用、用中學”的創新學習模式,打造強有力的學術氛圍,幫助中國用戶建立完善的軟件技術服務體系,形成中國用戶之間的技術、經驗交流平臺。
往屆 Stata 中國用戶大會資源免費奉送,關注 Stata 的小伙半們抓緊時間領取咯!
2024 年第八屆 Stata 中國用戶大會將于 8 月 19 日至 20 日在南開大學舉辦。
計量經濟學前沿方法研討會暨“第八屆Stata中國用戶大會”即將于金秋八月在南開大學隆重舉行。會議將邀請國內外計量經濟學領域的TOP級大咖擔任主講嘉賓,為與會者提供一個全面了解計量經濟學前沿方法和Stata軟件實踐應用的平臺。大會以“計量經濟學的前沿方法與Stata軟件的實踐應用”為主題,旨在運用跨界思維和方法,推動計量經濟學等領域的教育創新與發展。同時,會議還將促進國內外計量經濟學領域的交流與合作,在會議期間,您將有難得的機會與來自國內外不同領域的頂尖計量經濟學專家、資深的Stata軟件專家以及前沿的研發工程師深入交流,共同探討并分享寶貴的學術見解和實踐經驗。您將第一時間了解到計量經濟學領域的最新發展動態,以及Stata軟件新功能和新命令。恰逢StataNow全新發布,邀您與StataNow一起,開啟數據分析新篇章!此外,會議還將推出《Stata夏令營活動》,為您提供一個學習使用Stata新方法的絕佳機會。無論您是初學者還是資深用戶,都能在這里實現自我突破與科研創新。 在南開大學這座百年學府中,您將感受到濃厚的學術氛圍和人文氣息。我們誠摯邀請您共襄盛舉,與眾多專家學者共同交流學習,為推動國內經濟學等領域的交叉融合貢獻智慧和力量。期待您的到來,共同見證這場學術盛事的成功舉辦!
2023 年第七屆 Stata 中國用戶大會于 8 月 13 日至 14 日在哈爾濱商業大學成功舉辦。為促進高水平商科特色高校建設與經濟學等其他學科的交叉融合,會議圍繞“東北全面振興與高水平商科大學建設背景下的經濟學實證統計方法”為主題,積極開展跨學科的探索性研究與統計相關的研究。會議以數字經濟為背景,運用跨界思維和方法,將新技術、新理念、新模式,新方法融入商科教育。與會領導、專家和來自全國各地的業界學者一起,置身于美麗的哈爾濱,穿過百年中央大街,探訪中華巴洛克歷史文化街區,漫步美麗松花江畔,享受為期兩天的 Stata 會議和交流時光!
演講主題 | 演講人 |
《Stata 18 新功能應用》 | Stata軟件開發者 StataCorp LLC |
《Heterogeneous difference in differences in Stata》 | 劉 迪 StataCorp LLC |
《雙重機器學習及Stata應用》 | 陳 強 山東大學 |
《Create customizable tables》 | 徐 朝 StataCorp LLC |
《Instrumental variables quantile regression》 | 劉 迪 StataCorp LLC |
《干預時間序列分析與程序包的比較述評》 | 王群勇 南開大學 |
《因果推斷中的控制變量:好的和壞的》 | 連玉君 中山大學 |
《Fitting spatial stochastic frontier models in Stata》 | 杜克銳 廈門大學 |
《Stata與會計研究:資本市場開放與財務報告穩健性》 | 梁上坤 中央財經大學 |
《DID安慰劑檢驗及Stata應用》 | 顏冠鵬 山東財經大學 |
第六屆 Stata 中國用戶大會于2022年8月19-20日在線盛大召開。您可以與來自各領域頂尖的 Stata 專家及 Stata 研發工程師一起分享有價值的見解及新命令,學習最前沿的科研方法并提高您的 Stata 應用知識。會議同期還將全新推出《Stata大師課》+《Stata公開課》的夏季聯學營活動,無論您是初學者還是專家,歡迎加入我們,并利用這一獨特的機會來學習使用 Stata 的新方法。
演講主題 | 演講人 |
《Mastering Stata's datetime concepts and functions》 | 彭 華 StataCorp LLC |
《動態隨機一般均衡模型的貝葉斯估計》 | 王群勇 南開大學 |
《合成控制法(SCM)的安慰劑檢驗、穩健性檢驗及可視化操作》 | 顏冠鵬 山東大學 |
《Stata中的標準誤》 | 陳 強 山東大學 |
《Creating Custom Estimation Tables》 | 呂 丹 StataCorp LLC |
《模型平均化(Model Averaging)及其在經濟金融領域的應用》 | 連玉君 中山大學 |
《使用網絡方法研究經濟學問題》 | 神秘嘉賓 |
《綠色全要素生產率與高質量發展評估》 | 張 寧 山東大學 |
第五屆 Stata 中國用戶大會暨“Stata 高級研究方法及新應用研討會”于2021年8月19-20日盛大召開。聚焦學術前沿,對話學界大咖,多層次解讀 Stata 17新應用。StataCorp LLC選派技術總工及開發者出席會議,與國內一線專家共襄盛舉,共享 Stata 應用新思路。
演講主題 | 演講人 |
《Stata 17 自定義表格新應用》 | 彭 華 StataCorp LLC |
《Global VAR and Bayesian VAR in Stata》 | 王群勇 南開大學 |
《回歸控制法及Stata應用》 | 顏冠鵬 山東大學 |
《分位數控制法及Stata應用》 | 陳 強 山東大學 |
《因果推斷中的Stata應用》 | 王存同 中央財經大學 |
《Fitting Cox proportional hazards model for interval-censored event-time data in Stata》 | 楊 筱 StataCorp LLC |
《雙邊隨機邊界模型的Stata應用》 | 劉 暢 中山大學學 |
《優質稿件 | songbl命令的使用介紹:stata推文與電腦文檔的檢索》 | 楊景院 深圳大學 |
《一個Stata用戶的若干思考》 | 連玉君 中山大學 |
《合成控制法的Stata應用和前沿研究》 | 陸嘉炫 芝加哥大學 |
《Mixed Regression with Macro and Micro Data in Stata》 | 王群勇 南開大學 |
2020年隨著新冠疫情的蔓延,全球都投入到積極防控的大潮中,如何高效獲取和處理COVID-19數據,必然成為本屆會議的熱點主題 。第四屆“Stata中國用戶大會”(China Stata Users' Conference) 將以“新應用+智交互”為主題,力邀國內外行業領袖及學術專家,共同開啟全新主題單元。本次會議以線上直播的方式與大家見面,知識碰撞、經驗交流、共享Stata應用新思路。
演講主題 | 演講人 |
《使用Stata獲取與處理COVID-19數據》 | 彭 華 StataCorp LLC |
《Call Stata from Python》 | 徐 朝 StataCorp LLC |
《混頻回歸方法與Stata應用》 | 王群勇 南開大學 |
《基于Stata模擬的內生性來源及其應對》 | 陳傳波 中國人民大學 |
《跨度回歸、偏度回歸與峰度回歸及Stata應用》 | 陳 強 山東大學 |
《平滑轉換模型與Stata應用》 | 王群勇 南開大學 |
《Causal Mediation》 | 金承剛 北京師范大學 |
《合成控制法安慰劑檢驗改進研究——基于標準化處理效應和非拒絕域的統計推斷》 | 連玉君 中山大學 |
《Measuring technical efficiency and total factor productivity change with undesirable outputs in Stata》 | 王道平 上海財經大學 |
第三屆 Stata 中國用戶大會暨“機器學習與計量方法應用研討會”于2019年8月20—21日在上海財經大學盛大召開并取得圓滿成功。會議得到了國內外專家學者及眾多用戶代表的一致肯定,同時今年也是 Stata 16發布年,在會議上我們也希望能夠更多的了解對新版本的認知,反映中國用戶在應用軟件過程中遇到的問題。通過廣泛的國際交流,幫助 Stata 中國用戶探索更深層次的理論和研究。
演講主題 | 演講人 |
《Introduction of latest reporting and language extension features in Stata》 | 彭 華 StataCorp LLC |
《Stata在公司投融資研究中的應用》 | 覃家琦 南開大學 |
《分位數回歸:橫截面、面板與工具變量法》 | 陳 強 山東大學 |
《Inference after lasso model selection》 | 劉 迪 StataCorp LLC |
《非參數計量經濟方法(核回歸,局部線性回歸)》 | 王群勇 南開大學 |
《Fixed effect panel threshold model for unbalanced panel》 | 王群勇 南開大學 |
《Stata在外匯市場實證中的應用》 | 丁劍平 上海財經大學 |
《人工智能+ Stata》 | 陳堰平 微軟中國 |
2018年“第二屆 Stata 中國用戶大會”(2018China Stata Users' Conference)是由北京友萬信息科技有限公司(簡稱:友萬科技)主辦,順德職業技術學院承辦的聚焦 Stata 應用與技術落地的盛會。會議核心內容將圍繞計量經濟方法及應用方向展開廣泛的國際學術交流,內容覆蓋經濟學、金融學、會計學、計算語言學、新聞學、政治學、歷史學、醫藥衛生等微觀和宏觀計量分析的熱門應用領域。今年大會的主題是“Econometric Analysis Method and Application” 秉承“開放協作、技術共享”的宗旨,面對面真誠聆聽用戶的聲音。致力于為業界帶來最新技術、行業應用案例展示與最佳實踐單元。
會議主題:Econometric Analysis Method and Application
演講主題 | 演講人 |
《大數據、高維回歸與Stata》 | 陳 強 山東大學 |
《Spatial autoregressive models using Stata》 | 劉 迪 StataCorp LLC |
《政策評估與因果推斷:Stata應用概述》 | 王群勇 南開大學 |
《斷點回歸》 | 連玉君 中山大學 |
《回歸分析集成輸出解決方案》 | 李春濤 華中科技大學 |
《內含資本成本的計算》 | 顧 俊 深圳大學 |
《樣本選擇問題與處理》 | 王群勇 南開大學 |
《DSGE在Stata中的應用》 | 許文立 安徽大學 |
《Report generation with putdocx, putexcel, putpdf, and dyndoc》 | 彭 華 StataCorp LLC |
2017年“第一屆 Stata 中國用戶大會”(2017 China Stata Users' Conference)是由北京友萬信息科技有限公司和爬蟲俱樂部,聯合StataCorp LLC發起第一屆Stata中國用戶大會。首屆Stata用戶會議的宗旨是“溝通和合作”,我們希望通過定期舉辦 Stata 用戶會議,形成中國用戶之間的技術、經驗交流平臺;建立和 Stata 原廠的溝通機制,反映中國用戶遇到的問題,讓未來的Stata版本更多地反映中國用戶的愿望;建立學界與企業界之間的溝通和聯系,讓 Stata 用戶有更多的機會服務于企業界;打造數據分析領域的高端智庫,服務于我國的大數據事業。
會議主題:Retrieving data from website, Cloud oriented empirical analysis, Using Chinese in Stata
演講主題 | 演講人 |
《Stata 15 新版本發布及新功能研討》 | 彭 華 StataCorp LP 軟件工程總監 |
《內生性問題:方法及進展》 | 連玉君 中山大學 |
《putdocx與格式化輸出》 | 李春濤 中南財經政法大學 |
《unicode與中文編碼》 | 彭 華 StataCorp LP 軟件工程總監 |
《Stata函數》 | 彭 華 StataCorp LP 軟件工程總監 |
《Subinfile,網頁源代碼分析的神器》 | 薛 原 爬蟲俱樂部 |
《Stata自動化報告與可重復研究》 | 陳堰平 雪晴數據網 |
《分詞與情感分析》 | 薛 原 爬蟲俱樂部 |
《文本分析在量化文史學研究中的應用—以<唐書>與<紅樓夢>為例》 | 俞俊利 上海交通大學 |
《Stata、cURL交互與網絡爬蟲:以微博API為例》 | 彭文威 香港科技大學 |
《Stata數據清洗常用技巧》 | 彭文威 香港科技大學 |
《Econometric convergence test and club clustering using Stata》 | 杜克銳 山東大學 |
Stata Journal為每季發行的期刊,包含了統計、資料分析、教學方法、有效地使用Stata語言及書籍回顧…等相關內容。 使用者亦可選擇購買有興趣的單篇文章。
ISI Web of Knowledge 的最新期刊引用報告,將Stata期刊列為社會科學數學方法類別期刊中的第四位,僅次于結構方程模型, 計量經濟學和經濟學與統計學評論。
>>教學視頻
為順應大數據時代要求,自開展Stata培訓以來,我司通過活動路演、創新講座、在線課程、線下培訓等系列活動已經在全國開展了包含Stata應用方法、統計分析、文本分析、數據分析、數據清洗、Stata、cURL交互與網絡爬蟲、內生性問題的方法及進展、Stata編程與Mata運算、Stata編程技術與爬蟲、Stata自動化報告與可重復研究、計量經濟方法及Stata應用等學習活動,有近千余名師生及業界愛好者參與了學習。通過此類學習活動極大的加強了大數據分析人才的理論和實踐能力。推進了大數據人才培養,以及學術成果的轉化,為大數據分析領域發展做出了貢獻。我司希望通過每年一屆的Stata中國用戶大會,深度推進國內青年學者學習熱情,提升高校學術交流氛圍,整合學界及業內的大量資源,進一步提高數據分析能力和科學決策的水平。
高級現場班:"面板數據與因果推斷" 研討會
主講:陳 強 |
高級現場班:《計量經濟實證方法與論文寫作研討會》 一期
主講:王群勇 |
高級現場班:《計量經濟實證方法與論文寫作研討會》 二期
主講:王群勇 |
高級現場班:"面板數據與因果推斷" 研討會
主講:王群勇 |
高級現場班:"異質性穩健DID及Stata應用" 研討會
主講:陳強 |
高級現場班:"宏觀計量經濟模型" 研討會
主講:王群勇 |
高級課程:蒙特卡洛模擬、貝葉斯分析與Stata應用
主講:王群勇 |
高級課程:宏觀計量經濟分析與Stata、Mathematica應用
主講:王群勇 |
高級課程:貝葉斯分析與Stata應用
主講:王群勇 |
中級課程:面板數據計量分析與Stata應用
主講:王群勇 |
初級課程:Stata 17新功能介紹課程
主講:StataCorp LLC |
初級課程:Stata 16軟件功能介紹課程
主講:StataCorp LLC |
初級課程:實證方法與Stata應用專題課程
主講:王群勇 |
高級課程:“非線模型講述非常故事”專題課程
主講:王群勇 |
高級課程:“自然實驗與因果推斷”專題課程
主講:王群勇 |
Stata 案例集
為強化示范引領效果,加快推動高校Stata科研實驗室建設,由北京友萬信息科技有限公司聯合授權高校共同編制的《Stata案例集》正式發布。Stata案例集根據客戶成功案例收集整理而成,介紹了應用Stata軟件在科研工作和教學人材培養以及豐碩的科研成果方面取得的突出成效和變化,旨在幫助更多教學和科研單位根據其所屬的專業領域,參考如何高效的部署Stata軟件產品及解決方案。
案例一:首都經濟貿易大學 國際經濟管理學院
案例二:南開大學 經濟學院
案例三:西南政法大學
經濟學院
Stata實驗室建設計劃
北京友萬信息科技有限公司自成為Stata中國授權經銷商及合作伙伴以來,已為國內數十所高等院校及科研院所完成了Stata科研實驗室采購計劃。幫助其在教學科研、人材培養,論文發表、學科建設方面取得了突破性的進展。解決了在數據分析、數據處理、可視化、統計分析和自動報告等多方面的業務問題和個性化需求。對提高科研人員與教師的科學研究能力和教學水平起到了尤為重要的作用,誠邀有意向的單位加入我們,共同建立適合您的實驗室定制建設方案。