**123区,青青操久久,久久情侣视频,中文字幕亚洲免费,国产精品久久久久免费,精品福利视频在线观看

返回
頂部

Stata 19—數據統計分析軟件包

視頻介紹 Stata安裝手冊 獲取報價 軟件試用 官網授權


關于Stata

Stata 是一套提供其使用者數據分析、數據管理以及繪制專業圖表的完整及整合性統計軟件。它功能非常強大,包含異質性DID、中介效應、多向聚類標準誤、野聚類自助法、工具變量分位數回歸、貝葉斯模型平均、描述性統計制表等功能。用 Stata 繪制的統計圖形相當精美。Stata 具有操作靈活、簡單、易學易用、運行速度極快等優點。

2025年4月8日,Stata19重磅發布!Stata 19以前瞻性的視野與卓越的技術實力,勇敢地超越了傳統數據分析工具的局限,以革新者的姿態引領著數據科學的新潮流。它不僅集成了最新一代的算法模型與智能分析技術,更在數據處理速度、分析維度拓展以及結果精準度上實現了質的飛躍,讓數據分析過程更加流暢高效,仿佛為研究者們配備了一把銳利的智慧之劍,輕松斬斷復雜數據背后的重重迷霧,讓每一個分析結果都如同經過精密雕琢的藝術品,精準無誤地揭示出數據背后的深層規律與價值,為決策制定提供了堅實而可靠的依據。
[->Stata 校園版來啦!可滿足全校使用的授權,點擊了解詳情]


超越傳統,Stata 19引領數據科學新潮流,讓分析更高效,結果更精準

Stata 19 重磅發布!!

點擊了解 Stata 19 新功能


  • Stata 19 新功能
  • Why Stata
  • 軟件功能版本
  • 軟件詳細功能
  • 系統要求
  • Stata中國用戶會議
  • 原廠相關資源
  • Stata系列課程
  • Stata案例集


Stata 19 現已發布!您可以在我們的網站上看到所有新功能。 表格、圖形、框架和 “Do-file 編輯器”(Do-file Editor)都有許多改進,將簡化您的工作流程。 許多令人興奮的新統計功能包括:


1、機器學習功能的擴展:集合決策樹

Stata19版本官方命令引入另一類常用的機器學習方法,即基于決策樹(decision trees)的集成學習方法(ensemble learning),包括隨機森林(random forest)與梯度提升法(gradient boosting machine)
Stata 19提供了一套新的h2oml命令,可輕松地接入開源的大數據機器學習平臺H2O,針對回歸(regression)或分類(classification)問題使用隨機森林或梯度提升法。H2O使得機器學習變得更加容易,有時稱為AutoML。

h20.png 畫變量重要性圖(variable importance plot):



2、面板數據

Stata 19引入了有關面板數據的若干新命令或選擇項,包括高維固定效應(high dimensional FE)、相關隨機效應(correlated random effects)、面板向量自回歸(panel VAR),給用戶帶來了強大的新功能與便利。


2.1 高維固定效應

這次Stata 19將其相應功能納入了官方命令(無須額外命令,僅新增了一個選擇項),使得操作更為簡便可靠!
例如,在估計面板固定效應模型時,假設我們還想額外地控制三個分類變量(categorical variables)z1, z2與z3,只要在常規命令加上absorb()的選擇項即可,類似地,我們在進行二階段最小二乘法(2SLS)估計時,也可以使用absorb()的選擇項。

2.2 相關隨機效應

靜態面板的兩個常用模型為隨機效應(random effects,簡記RE)與固定效應(fixed effects,簡記FE)。然而,二者均有缺點。隨機效應模型不夠穩健,如果解釋變量與個體效應相關,則得不到一致估計。另一方面,雖然固定效應模型較為穩健,但無法估計非時變(time-invariant)變量的系數。為此,Stata 19推出了“相關隨機效應”(correlated random effects,簡記CRE),可以兼顧二者的優點。
CRE模型允許解釋變量與個體效應相關,且時變(time-varying)變量的系數估計值與FE完全相同,故本質上為FE模型。在算法上,CRE估計量將時變變量的組平均值加入混合回歸中,故可視為一種控制函數法(通過時變變量的組平均值來控制遺漏變量)。由于CRE未做組內離差變換,故也可以估計出非時變變量的系數,這是CRE的最大優點。


2.3 面板向量自回歸

向量自回歸(vector autoregressoin,簡記VAR)是常見的時間序列模型,但由于VAR模型的待估參數較多,故一般需要較長的時間維度。面板向量自回歸(panel vector autogression,簡記Panel VAR)將VAR模型推廣到面板數據中。面板VAR模型既包含個體固定效應,也包括被解釋變量的滯后項,故可視為動態面板模型(dynamic panel-data model)與VAR模型的結合。相應地,面板VAR模型的估計方法類似于動態面板,主要使用廣義矩估計(generalized method of moment,簡記GMM)。其漸近理論要求橫截面單位的數量趨向無窮大,故適用于時間維度較短的短面板。


3、因果推斷

因果推斷始終是實證研究的核心方法。Stata 19在因果推斷方面的功能也進一步加強,新推出的方法包括條件平均處理效應(CATE)以及有關工具變量法的一些新方法。


3.1 條件平均處理效應

因果推斷關注的對象一般為全樣本的平均處理效應(average treatment effect,簡記ATE)或處理組平均處理效應(average treatment effect on the treated,簡記ATT或ATET)。然而,不同個體的處理效應很可能存在異質性,而研究者有時感興趣,異質性處理效應如何隨著個體特征而變。例如,電商平臺可能關心價格折扣如何影響消費者行為,而價格折扣的處理效應可能依賴于消費者的年齡與收入。
為此,Stata 19推出了全新的cate命令,用于估計“條件平均處理效應”(conditional average treatment effect,簡記CATE),即在給定某種個體特征條件下的平均處理效應。命令cate可以估計三種不同類型的CATE,包括“個體平均處理效應”(individualized average treatment effect),“分組平均處理效應”(group?average treatment effect)及“排序分組平均處理效應”(sorted group?average treatment effect)。除了估計外,cate系列命令還可進行預測、可視化及統計推斷。
Stata 19的cate命令功能強大、靈活而穩健。例如,在對結果回歸(outcome regression)與處理效應模型(treatment models)建模時,可使用參數模型(parametric models),拉索估計量(lasso)或廣義隨機森林(generalized random forest;有時也稱為“誠實森林”,即honest forest)。該命令提供了兩個穩健估計量,即“偏效應過濾”(partialling out)與“增強逆概加權”(augmented inverse probability weighting),其中后者為雙穩健估計量(doubly robust estimator);并使用“交叉擬合”(cross-fitting)以避免過擬合(overfitting)。


3.2 控制函數法

傳統的工具變量法一般使用二階段最小二乘法(two-stage least squares,簡記2SLS)。2SLS之所以成立,是因為第一階段回歸為線性模型,而線性回歸的OLS估計具有正交性。這也意味著,2SLS一般無法推廣到非線性模型中;例如,當內生變量為虛擬變量時,第一階段回歸為Probit模型。
為此,Stata 19新推出了更為靈活的“控制函數法”(control function approach,簡記CF),不僅可用于線性模型,而且也適用于非線性模型。


3.3 弱工具變量穩健推斷

使用工具變量法進行因果推斷一般要求強工具變量。在弱工具變量(weak instrument)的情況下,2SLS估計量變得不可靠,即使在大樣本下。這是因為2SLS估計量其實是一個比值(ratio),而在弱工具變量的情況下,該比值的分母接近于0,導致統計推斷失效。
為此,Stata 19推出了安德森-魯賓檢驗(Anderson-Rubin test),不再使用上述比值進行統計推斷,故即使在弱工具變量的情況下依然穩健。


3.4 時間序列的工具變量法

Stata 19專門推出了針對時間序列的工具變量法,包括通過工具變量法估計結構VAR模型,以及使用工具變量法估計脈沖響應函數。


4、貝葉斯方法

Stata 19在貝葉斯計量經濟學(Bayesian econometrics)方面的功能繼續得到加強,新增方法包括貝葉斯變量選擇、分位數回歸及自助法等。 現在可以使用新的 bayesboot 前綴,通過貝葉斯自助法在小樣本中獲得更精確的參數估計,并在抽樣時納入先驗信息。它可與官方命令或社區貢獻命令搭配使用。


使用貝葉斯方法從變量x1-x100中進行變量選擇:


使用貝葉斯方法進行分位數回歸(quantile regression):


使用貝葉斯自助法(Bayesian bootstrap)估計x的均值:


5、其他計量方法

Stata 19還提供了其他方面的計量新方法,包括久期模型、相關系數的元分析、潛類別模型等。


5.1 久期模型

久期模型(duration model)的被解釋變量為某事件存續的時間,例如失業持續時間,病人存活的時長等。在原有久期模型的Stata模塊基礎上(命令均以st開頭),針對存在“區間刪失”(interval-censored)的多事件數據(multiple-events data),Stata 19提供了估計“邊際考克斯比例風險模型”(marginal Cox proportional hazards model)的新命令stmgintcox。


5.2 相關系數的元分析

在文獻中,針對同一問題,常常有多項類似的研究,但所得估計結果不盡相同。如何將這些相似研究的結果進行整合,以得到統一的結論,這正是“元分析”(meta-analysis)的目標。在Stata原有的元分析meta命令模塊中,Stata 19新增了對于相關系數的元分析功能。相關系數無疑是最重要的描述性統計之一。


5.3 潛類別模型

“潛類別模型”(latent class model)是一種常見的統計模型,它假設數據來自于若干總體(或類別)的混合,故也稱為“有限混合模型”(finite mixture model);例如,三個服從正態分布的總體按照一定比例的混合。如果知道類別的數目,則可使用原有的Stata命令gsem(表示generalized structural equation model)進行估計。


6、Stata基礎功能提升

6.1 Do文件編輯器

Stata 19的Do文件編輯器(Do-file Editor)變得更為強大,新增功能包括:
(1)變量名(variable names)、宏(macros)與存儲結果(stored results)的自動補全(autocompletion);
(2)方便用戶使用的Do文件編輯器模板(Do-file Editor templates);
(3)對當前詞(current word)在編輯器中的所有出現之處均提供高亮(highlighting),無論大小寫(case-insensitive);并對當前所選內容(current selection)在編輯器中的所有出現之處均提供高亮(highlighting),區分大小寫(case sensitive);
(4)括號高亮(bracket hightlighting),即對包含當前光標的括號(the brackets enclosing the current cursor position)提供高亮;
(5)代碼折疊功能的提升(code folding enhancement),包括新增的菜單欄目(menu items)“Fold all”(折疊全部可折疊代碼), “Unfold all”(展開所有已折疊代碼)與“Fold selection”(折疊所選內容)。


6.2 畫圖

Stata 19的畫圖功能也變得更為強大,新增功能包括:
(1)通過新增命令twoway heatmap畫熱圖(heat maps),即在變量(x, y)取值的網格上,以小方塊的顏色變化來表示對應變量z的取值高低。

(2)通過新增命令twoway rpspikes畫“刺形”的點圖或范圍圖(plot points and ranges indicated by spikes),例如展示某統計量及其相應的置信區間。
(3)通過新增命令twoway rpcaps畫“帶帽刺形”的點圖或范圍圖(plot points and ranges indicated by?spikes with caps),例如展示某統計量及其相應的置信區間。
(4)在使用命令graph bar畫柱狀圖/條形圖(bar plot)時,可畫樣本均值及其置信區間,以及在標簽與控制條形分組方面的改進(improved labelling, and control of bar groupings)。
(5)在使用命令graph dot畫點狀圖(dot chart)時,可畫樣本均值及其置信區間,以及在標簽與控制點狀分組方面的改進(improved labelling, and control of dot groupings)。
(6)在使用命令graph box畫箱形圖(box plot)時,改進了標簽與對箱形分組的控制(improved labelling, and control of box groupings)。
(7)根據變量上色(colors by variable)的選擇項colorvar(),可適用于更多的twoway plot命令,包括line, connected, tsline, rconnected及tsrline等。


6.3 制表

Stata 19的制表功能也得以進一步提升,可更方便地創建與定制表格
(1)Stata的制表命令table新增了增加標題的選擇項title(),增加腳注的選擇項note(),以及將表格導出為指定文件格式(例如Word, LaTex, Excel等)的選擇項export()。

(2)更簡便的方差分析表格(easier ANOVA tables)。



立即試用或購買,獲得Stata 19新體驗! 獲取報價 軟件試用





快!精準!易于使用! Stata是一個完整的集成軟件包,可提供您的所有數據科學需求 - 數據處理,可視化,統計和自動報告。


掌握您的數據
廣泛的統計功能
出版質量的圖形
自動報告
真正可重復的研究
PyStata — Python 集成
真實文檔
值得信賴
簡單易用
易于掌握
易于自動化
易于擴展
高級編程
自動多核支持
跨平臺兼容
世界一流的技術支持



  • 掌握您的數據

    Stata的數據管理功能如下:
    同時管理多個數據集
    Import, export
    JDBC, ODBC, SQL
    排序,匹配,合并,加入,追加,創建
    內置電子表格
    unicode
    處理文本或二進制數據
    在本地或在Web上訪問數據
    收集組間的統計信息
    BLOBs -strings可以容納整個文檔
    數十億個觀測值
    數萬個變量數
    生存數據, 面板數據, 多級數據, 調查數據, 多重插補數據, 分類數據, 時間序列數據
    更重要的是,支持您的所有數據科學需求。

  • 廣泛的統計功能

  • 出版品質的圖形


    Stata可以輕松生成出版品質,風格獨特的圖形。

    您可以指向并單擊以創建自定義圖形。或者,您可以編寫腳本以可重現的方式生成數百或數千個圖形。將圖形導出為EPS或TIFF進行發布,導出為PNG或SVG進行Web導出,或者導出為PDF進行查看。使用集成的Graph Editor,您可以單擊以更改有關圖形的任何內容或添加標題,注釋,線條,箭頭和文本。

  • 自動報告

    自動報告結果所需的所有工具 。

    動態Markdown文檔
    創建Word文檔
    創建PDF文檔
    創建Excel文件
    可定制的表格
    圖形方案
    Word,HTML,PDF,SVG,PNG




  • 真正可重復的研究

    很多人談論可重復的研究。
    Stata 已經致力于它超過40年。
    我們不斷添加新功能; 我們甚至從根本上改變了語言元素。不管。Stata 是唯一具有集成版本控制的統計軟件包。如果你在1985年編寫了一個腳本來執行分析,那么同樣的腳本仍然可以運行,并且今天仍會產生相同的結果。您在1985年創建的任何數據集,今天都可以閱讀。在2050年也是如此.Stata 將能夠運行你今天所做的任何事情。

  • PyStata — Python集成

    以交互方式調用Python或將Python嵌入到您的Stata代碼中。
    從Python調用Stata并從IPython環境調用Stata代碼。
    在Jupyter Notebook中使用Stata。
    在Stata和Python之間無縫傳遞數據和結果。
    從Python內部使用Stata分析。

    在Stata中使用任何Python包
    Matplotlib和Seaborn進行可視化
    美麗的湯和Scrapy用于網頁抓取
    NumPy和熊貓進行數值分析
    TensorFlow和scikit-learn用于機器學習
    以及更多

  • 真實的文檔

    我們的每個數據管理功能都經過充分解釋和記錄,并在實際示例中顯示。每個估算器都有完整的文檔記錄,包括幾個關于實際數據的示例,以及如何解釋結果的真實討論。這些示例為您提供數據,以便您可以在 Stata 中工作甚至擴展分析。我們為您提供每個功能的快速入門,展示一些最常見的用途。想要更多細節?我們的方法和公式部分提供了計算內容的具體信息,我們的參考文獻為您提供了更多信息。 Stata 是一個很大的包,所以有很多文檔 - 超過19,000頁,共36卷。但不要擔心,鍵入 help ,Stata 將搜索其關鍵字,索引,甚至社區提供的包,為您帶來您需要了解的主題。一切都在Stata內可用。

  • 值得信賴

    我們不僅編程統計方法,還對它們進行驗證。
    您從 Stata 估算器看到的結果取決于與其他估算器的比較,一致性和覆蓋率的蒙特卡洛模擬以及我們的統計人員進行的廣泛測試。我們運送的每一個Stata都通過了一套認證套件 ,其中包括410萬行測試代碼,可產生600萬行輸出。我們對600萬行輸出中的每個數字和一段文本進行認證。

  • 簡單易用

    Stata 的所有功能都可以通過 菜單,對話框,控制面板,數據編輯器,變量管理器,圖形編輯器甚至 SEM 圖形生成器來訪問。您可以通過任何分析指向并單擊您的方式。
    如果您不想編寫命令和腳本,則不必這樣做。
    即使您指向并單擊,也可以記錄所有結果,然后將其包含在報告中。您甚至可以保存您的操作創建的命令,并在以后重現您的完整分析。

  • 容易掌握

    Stata 執行任務的命令直觀易學。更好的是,您從執行任務中學到的所有知識都可以應用于其他任務。例如,您只需在任何命令中添加“ gender =“ =” female“,即可將分析范圍限制為樣本中的女性。您只需將 vce(robust)添加到任何估計量中,即可獲得對許多常見假設都具有魯棒性的標準誤差和假設檢驗。
    一致性更加深入。您從數據管理命令中學到的知識通常適用于估算命令,反之亦然。還有一整套后估計命令,用于執行假設檢驗,形成線性和非線性組合,進行預測,形成對比,甚至使用交互作用圖執行邊際分析。在幾乎每個估算器之后,這些命令都以相同的方式工作。
    排序命令以讀取和清除數據,然后執行統計測試和估計,最后報告結果是可重復研究的核心。Stata 使所有研究人員都可以訪問此過程。

  • 易于自動化

    每個人都有他們一直在做的任務 - 創建特定類型的變量,生成特定的表,執行一系列統計步驟,計算 RMSE 等。可能性是無窮無盡的。Stata 有數千個內置程序,但可能擁有相對獨特的任務或者您希望以特定方式完成的任務。
    如果您編寫了一個腳本來執行給定數據集上的任務,則可以輕松地將該腳本轉換為可用于所有數據集,任何變量集以及任何觀察集的內容。

  • 易于擴展

    自動化的一些內容可能非常實用。只需一點代碼,就可以將自動化腳本轉換為 Stata 命令。支持 Stata 官方命令支持的標準功能的命令。可以與使用官方命令相同的方式使用的命令。

  • 高級編程

    Stata 還包括一種高級編程語言-Mata。
    Mata 具有您期望在編程語言中使用的結構,指針和類,并為矩陣編程添加了直接支持。
    Mata 既是一個用于操作矩陣的交互式環境,也是一個可以生成編譯和優化代碼的完整開發環境。它包括處理面板數據的特殊功能,對實際或復雜矩陣執行操作,為面向對象編程提供全面支持,并與 Stata 的各個方面完全集成。

  • 充分利用您的多核計算機。
    沒有其他統計軟件可以與之匹敵。
    以最快的速度享受 Stata 19的新功能。

  • 跨平臺兼容

    Stata 將在 Windows,Mac 和 Linux / Unix 計算機上運行;但是,我們的許可證不是特定于平臺的。
    這意味著,如果您有一臺 Mac 筆記本電腦和 Windows 臺式機,則不需要兩個單獨的許可證即可運行Stata。您可以在任何受支持的平臺上安裝 Stata 許可證。Stata 數據集,程序和其他數據可以在不進行翻譯的情況下跨平臺共享。您還可以快速輕松地從其他統計數據包,電子表格和數據庫中導入數據集。



Stata各系列版本區別


 Stata/MP, Stata/SE, Stata/BE 三個版本
 Stata/MP : 最快的 Stata 版本(四核,雙核和多核/多處理器計算機),可以分析最大的數據集。
 Stata/SE   : 標準版; 對于更大的數據集。
 Stata/BE   : 基礎版; 用于中型數據集。


Stata/SE 和 Stata/BE 的區別僅在于每個數據集可以分析的數據集大小不同。與 Stata/BE(最多798個)相比,Stata/SE(最多10,998個)和 Stata/MP(最多65,532個)可以擬合具有更多自變量的模型。Stata/SE 最多可以分析20億個觀測值。
Stata/BE 允許具有多達2,048個變量和20億個觀測值的數據集。一個模型中的 Stata/BE 最多可包含798個獨立變量。



Stata/MP 性能報告


Stata/MP 是最快,最大的 Stata 版本。實際上,當前任何一臺計算機都可以利用 Stata/MP 的高級多處理功能。這包括Intel i3, i5, i7, i9, Xeon, Celeron, and AMD multi-core chips。在雙核芯片上,根據耗時的估算命令,Stata/MP的總體運行速度提高40%,在重要的位置運行速度提高72%。Stata / MP具有兩個以上的內核或處理器,速度甚至更快。

Stata MP,Stata/SE和Stata/BE均可在任何計算機上運行,??但Stata/MP的運行速度更快。您可以購買Stata/MP許可證,最多可獲取計算機上的內核數量(最多64個)。例如,如果您的計算機具有八個核心,則可以為八個核心,四個核心或兩個核心購買Stata/MP許可證。


Stata/MP還可以分析比其他任何版本的Stata更多的數據。如果使用當前最大的計算機,Stata/MP可以分析100到200億個觀測值,并且一旦計算機硬件趕上來,就可以分析多達1萬億個觀測值。


在執行計算密集型估計程序時,速度通常是最關鍵的。包括線性回歸在內的一些 Stata 估計程序幾乎是完全并行的,這意味著它們在兩個內核上的運行速度是原來的兩倍,在四個內核上的運行速度是原來的四倍,在八個內核上的運行速度是其八倍,等等。一些估計命令可以比其他命令更多地并行化。以中位數計算,估計命令在 2 核上的運行速度快 1.7 倍,在 4 核上快 2.6 倍,在 8 核上快 3.4 倍。


在管理大型數據集時,速度也很重要。添加新變量幾乎可實現 100% 并行計算,而排序時的并行計算可到達 61% 。



Stata版本功能對比

Product features
(Basic Edition) (Standard Edition)
2-core 4-core 6+
Maximum number of variables
變量的最大數量
Up to 2,048 variables Up to 32,767 variables Up to 120,000 variables
Maximum number of observations
最大觀測次數
2.14 billion 2.14 billion Up to 20 billion
Speed comparisons
速度比較
Fast Fast
Twice as fast Almost four times as fast Even faster
Time to run logistic regression with 10 million observations and 20 covariates
使用1000萬個觀測值和20個協變量進行邏輯回歸的時間
20 seconds 20 seconds
10 seconds 5.2 seconds < 5.2 seconds
Maximum number of independent variables
自變量的最大數量
798 10,998 65,532
Complete suite of statistical features
完整的統計特征套件
Yes! Yes!
Yes! Yes! Yes!
Publication-quality graphics
出版物質量圖形
Yes! Yes!
Yes! Yes! Yes!
Extensive data management facilities
廣泛的數據管理設施
Yes! Yes!
Yes! Yes! Yes!
Truly reproducible research
真正可重復的研究
Yes! Yes!
Yes! Yes! Yes!
Comprehensive reporting and table generation
全面的報告和表格生成
Yes! Yes!
Yes! Yes! Yes!
Powerful programming language
強大的編程語言
Yes! Yes!
Yes! Yes! Yes!
Complete PDF documentation
完整的PDF文檔
Yes! Yes!
Yes! Yes! Yes!
Exceptional technical support
卓越的技術支持
Yes! Yes!
Yes! Yes! Yes!
Includes within-release updates
包含在版本更新中
Yes! Yes!
Yes! Yes! Yes!
Windows, macOS, and Linux
Yes! Yes!
Yes! Yes! Yes!
And much more for all your data science needs
更多滿足您所有數據科學需求
Yes! Yes!
Yes! Yes! Yes!
Memory requirements
內存要求
1 GB 2 GB
4 GB
Disk space requirements
磁盤空間要求
4 GB 4 GB
4 GB

點擊列表鏈接查看視頻功能演示

Lasso|套索估計量
Reproducible reporting|研究報告的可重復性
Meta-Analysis|元分析
Choice Models|選擇模型
Python Integration|Python集成
Bayes—multiple chains, more|貝葉斯分析新功能
Panel-data ERMs|面板數據ERM
Import Data from SAS and SPSS |從SAS和SPSS導入數據
Nonparametric series regression |非參數序列回歸
Frames — multiple datasets in memory|幀-內存中的多個數據集
Panel-data mixed logit | 面板數據
Nonlinear DSGE models|非線性 DSGE 模型
Multiple-group IRT | 多組IRT
xtheckman|xtheckman新命令
NLMEMs with lags: PK models | PK模型
Heteroskedastic ordered probit | 異方差有序概率
Point sizes for graphics | 圖形
Numerical integration
Linear programming | 線性回歸
Mac interface | Mac介面
Do-file Editor autocompletion |do 文件編輯器
Sample-size analysis for CIs

功能列表

功能名稱 功能介紹
線性模型
(Linear models)
regression   ?   censored outcomes   ?   endogenous regressors   ?   bootstrap, jackknife, and robust and cluster–robust variance   ?   instrumental variables   ?   three-stage least squares   ?   constraints   ?   quantile regression   ?   GLS   ?   DID   ?   more
面板/縱向數據
(Panel/longitudinal data)
random and fixed effects with robust standard errors   ?   linear mixed models   ?   random-effects probit   ?   GEE   ?   random- and fixed-effects Poisson   ?   dynamic panel-data models   ?   instrumental variables   ?   DID   ?   panel unit-root tests   ?   more
多級混合效應模型
(Multilevel mixed-effects models)
continuous, binary, count, and survival outcomes   ?   two-, three-, and higher-level models   ?   generalized linear models   ?   nonlinear models   ?   random intercepts   ?   random slopes   ?   crossed random effects   ?   BLUPs of effects and fitted values   ?   hierarchical models   ?   residual error structures   ?   DDF adjustments   ?   support for survey data   ?   more
二進制、計數和有限結果
(Binary, count, and limited outcomes)
logistic, probit, tobit   ?   Poisson and negative binomial   ?   conditional, multinomial, nested, ordered, rank-ordered, and stereotype logistic   ?   multinomial probit   ?   zero-inflated and left-truncated models   ?   selection models   ?   marginal effects   ?   more
選擇模型
(Choice models)
discrete choice   ?   rank-ordered alternatives   ?   conditional logit   ?   multinomial probit   ?   nested logit   ?   mixed logit   ?   panel data   ?   case-specific and alternative-specific predictors   ?   interpret results—expected probabilities, covariate effects, comparisons across alternatives   ?   more
擴展回歸模型(ERMs)
(Extended regression models (ERMs))
endogenous covariates   ?   sample selection   ?   nonrandom treatment   ?   panel data   ?   account for problems alone or in combination   ?   continuous, interval-censored, binary, and ordinal outcomes   ?   more
廣義線性模型(GLMs)
(Generalized linear models (GLMs))
ten link functions   ?   user-defined links   ?   seven distributions   ?   ML and IRLS estimation   ?   nine variance estimators   ?   seven residuals   ?   more
有限混合模型(FMMs)
(Finite mixture models (FMMs))
fmm: prefix for 17 estimators   ?   mixtures of a single estimator   ?   mixtures combining multiple estimators or distributions   ?   continuous, binary, count, ordinal, categorical, censored, truncated, and survival outcomes   ?   more
空間自回歸模型
(Spatial autoregressive models)
spatial lags of dependent variable, independent variables, and autoregressive errors   ?   fixed and random effects in panel data   ?   endogenous covariates   ?   analyze spillover effects   ?   more
方差分析/多變量方差分析
(ANOVA/MANOVA)
balanced and unbalanced designs   ?   factorial, nested, and mixed designs   ?   repeated measures   ?   marginal means   ?   contrasts   ?   more
精確統計
(Exact statistics)
standardization of rates   ?   case–control   ?   cohort   ?   matched case–control   ?   Mantel–Haenszel   ?   pharmacokinetics   ?   ROC analysis   ?   ICD-10   ?   more
流行病學
(Epidemiology)
standardization of rates   ?   case–control   ?   cohort   ?   matched case–control   ?   Mantel–Haenszel   ?   pharmacokinetics   ?   ROC analysis   ?   ICD-10   ?   more
動態隨機一般均衡模型
(DSGE models)
specify models algebraically   ?   solve models   ?   estimate parameters   ?   identification diagnostics   ?   policy and transition matrices   ?   IRFs   ?   dynamic forecasts   ?   Bayesian   ?   more
測試、預測和結果
(Tests, predictions, and effects)
Wald tests   ?   LR tests   ?   linear and nonlinear combinations   ?   predictions and generalized predictions   ?   marginal means   ?   least-squares means   ?   adjusted means   ?   marginal and partial effects   ?   forecast models   ?   Hausman tests   ?   more
差異、成對比較和差數
(Contrasts, pairwise comparisons, and margins)
compare means, intercepts, or slopes   ?   compare with reference category, adjacent category, grand mean, etc.   ?   orthogonal polynomials   ?   multiple-comparison adjustments   ?   graph estimated means and contrasts   ?   interaction plots   ?   more
再抽樣及模擬方法
(Resampling and simulation methods)
bootstrap   ?   jackknife   ?   Monte Carlo simulation   ?   permutation tests   ?   exact p-values   ?   more
多變量方法
(Multivariate methods)
factor analysis   ?   principal components   ?   discriminant analysis   ?   rotation   ?   multidimensional scaling   ?   Procrustean analysis   ?   correspondence analysis   ?   biplots   ?   dendrograms   ?   user-extensible analyses   ?   more
時間序列
(Time series)
ARIMA   ?   ARFIMA   ?   ARCH/GARCH   ?   VAR   ?   VECM   ?   multivariate GARCH   ?   unobserved-components model   ?   dynamic factors   ?   state-space models   ?   Markov-switching models   ?   business calendars   ?   tests for structural breaks   ?   threshold regression   ?   forecasts   ?   impulse–response functions   ?   unit-root tests   ?   filters and smoothers   ?   rolling and recursive estimation   ?   Bayesian   ?   more
生存分析
(Survival analysis)
Kaplan–Meier and Nelson–Aalen estimators,   ?   Cox regression (frailty)   ?   parametric models (frailty, random effects)   ?   competing risks   ?   hazards   ?   time-varying covariates   ?   left-, right-, and interval-censoring   ?   Weibull, exponential, and Gompertz models   ?   more
貝葉斯分析
(Bayesian analysis)
thousands of built-in models   ?   univariate and multivariate models   ?   linear and nonlinear models   ?   panel data   ?   multilevel models   ?   VAR   ?   DSGE   ?   continuous, binary, ordinal, and count outcomes   ?   bayes: prefix for 58 estimation commands   ?   continuous univariate, multivariate, and discrete priors   ?   add your own models   ?   multiple chains   ?   convergence diagnostics   ?   posterior summaries   ?   hypothesis testing   ?   model fit   ?   model comparison   ?   predictions   ?   dynamic forecast   ?   impulse-response functions   ?   more
元分析
(Meta-analysis)
effect sizes   ?   common, fixed, and random effects   ?   forest, funnel, and more plots   ?   subgroup, leave-one-out, and cumulative analysis   ?   meta-regression   ?   small-study effects   ?   publication bias   ?   multivariate   ?   more
功效、精度和樣本大小
(Power, precision, and sample size)
power   ?   sample size   ?   effect size   ?   minimum detectable effect   ?   CI width   ?   means   ?   proportions   ?   variances   ?   correlations   ?   ANOVA   ?   regression   ?   cluster randomized designs   ?   case–control studies   ?   cohort studies   ?   contingency tables   ?   survival analysis   ?   balanced or unbalanced designs   ?   results in tables or graphs   ?   more
治療效果/因果推斷
(Treatment effects/Causal inference)
inverse probability weight (IPW)   ?   doubly robust methods   ?   propensity-score matching   ?   regression adjustment   ?   covariate matching   ?   DID   ?   multilevel treatments   ?   endogenous treatments   ?   average treatment effects (ATEs)   ?   ATEs on the treated (ATETs)   ?   potential-outcome means (POMs)   ?   continuous, binary, count, fractional, and survival outcomes   ?   panel data   ?   lasso   ?   more
Lasso回歸模型
(Lasso)
lasso   ?   elastic net   ?   model selection   ?   prediction   ?   inference   ?   continuous, binary, and count outcomes   ?   cross-validation   ?   adaptive lasso   ?   double selection   ?   partialing out   ?   cross-fit partialing out   ?   double machine learning   ?   endogenous covariates   ?   treatment effects   ?   more
結構方程模型(SEM)
(SEM (structural equation modeling))
graphical path diagram builder   ?   standardized and unstandardized estimates   ?   modification indices   ?   direct and indirect effects   ?   continuous, binary, count, ordinal, and survival outcomes   ?   multilevel models   ?   random slopes and intercepts   ?   factor scores, empirical Bayes, and other predictions   ?   groups and tests of invariance   ?   goodness of fit   ?   handles MAR data by FIML   ?   correlated data   ?   survey data   ?   more
潛伏組分析
(Latent class analysis)
binary, ordinal, continuous, count, categorical, fractional, and survival items   ?   add covariates to model class membership   ?   combine with SEM path models   ?   expected class proportions   ?   goodness of fit   ?   predictions of class membership   ?   more
多重估算
(Multiple imputation)
nine univariate imputation methods   ?   multivariate normal imputation   ?   chained equations   ?   explore pattern of missingness   ?   manage imputed datasets   ?   fit model and pool results   ?   transform parameters   ?   joint tests of parameter estimates   ?   predictions   ?   more
調查方法
(Survey methods)
multistage designs   ?   bootstrap, BRR, jackknife, linearized, and SDR variance estimation   ?   poststratification   ?   raking   ?   calibration   ?   DEFF   ?   predictive margins   ?   means, proportions, ratios, totals   ?   summary tables   ?   almost all estimators supported   ?   more
聚類分析
(Cluster analysis)
hierarchical clustering   ?   kmeans and kmedian nonhierarchical clustering   ?   dendrograms   ?   stopping rules   ?   user-extensible analyses   ?   more
項目反應理論(IRT)
(IRT (item response theory))
binary (1PL, 2PL, 3PL), ordinal, and categorical response models   ?   item characteristic curves   ?   test characteristic curves   ?   item information functions   ?   test information functions   ?   multiple-group models   ?   differential item functioning (DIF)   ?   more
網絡分析
(Network analysis)
nwcommands: import and manipulate networks   ?   generate networks   ?   calculate centrality and dissimilarity measures   ?   visualize networks   ?   more
數據[資料]管理
(Data manipulation)
data transformations   ?   data frames   ?   match-merge   ?   import/export data   ?   JDBC   ?   ODBC   ?   SQL   ?   Unicode   ?   by-group processing   ?   append files   ?   sort   ?   row–column transposition   ?   labeling   ?   save results   ?   more
報表
(Reporting)
reproducible reports   ?   customizable tables   ?   graphical tables builder   ?   Word   ?   Excel   ?   PDF   ?   HTML   ?   dynamic documents   ?   Markdown   ?   Stata results and graphs   ?   SVG   ?   EPS   ?   PNG   ?   TIF   ?   more
繪圖
(Graphics)
lines   ?   bars   ?   areas   ?   ranges   ?   contours   ?   confidence intervals   ?   interaction plots   ?   survival plots   ?   publication quality   ?   customize anything   ?   Graph Editor   ?   more
編程特點
(Programming features)
adding new commands   ?   scripting   ?   object-oriented programming   ?   menu and dialog-box programming   ?   dynamic documents   ?   Markdown   ?   Project Manager   ?   Python integration   ?   PyStata   ?   Jupyter notebook   ?   Java integration   ?   Java plugins   ?   H2O access   ?   C/C++ plugins   ?   more
矩陣編程 Mata—Stata重要編程語言
(Mata—Stata's serious programming language)
interactive sessions   ?   large-scale development projects   ?   optimization   ?   matrix inversions   ?   decompositions   ?   eigenvalues and eigenvectors   ?   LAPACK engine   ?   Intel? MKL   ?   real and complex numbers   ?   string matrices   ?   interface to Stata datasets and matrices   ?   numerical derivatives   ?   object-oriented programming   ?   more
圖形用戶界面
(Graphical user interface)
menus and dialogs for all features   ?   Data Editor   ?   Variables Manager   ?   Graph Editor   ?   Project Manager   ?   Do-file Editor   ?   multiple preference sets   ?   more
參考資料
(Documentation)
35 manuals ? 18,000+ pages ? seamless navigation ? thousands of worked examples ? quick starts ? methods and formulas ? references ? more
基本統計
(Basic statistics)
summaries   ?   cross-tabulations   ?   correlations   ?   z and t tests   ?   equality-of-variance tests   ?   tests of proportions   ?   confidence intervals   ?   factor variables   ?   more
非參數方法
(Nonparametric methods)
nonparametric regression   ?   Wilcoxon–Mann–Whitney, Wilcoxon signed ranks, and Kruskal–Wallis tests   ?   Cochran–Armitage and other trend tests   ?   Spearman and Kendall correlations   ?   Kolmogorov–Smirnov tests   ?   exact binomial CIs   ?   survival data   ?   ROC analysis   ?   smoothing   ?   bootstrapping   ?   more
GMM與非線性回歸
(GMM and nonlinear regression)
generalized method of moments (GMM)   ?   nonlinear regression   ?   more
簡單最大概似法
(Simple maximum likelihood)
specify likelihood using simple expressions   ?   no programming required   ?   survey data   ?   standard, robust, bootstrap, and jackknife SEs   ?   matrix estimators   ?   more
可編程最大概似法
(Programmable maximum likelihood)
user-specified functions   ?   NR, DFP, BFGS, BHHH   ?   OIM, OPG, robust, bootstrap, and jackknife SEs   ?   Wald tests   ?   survey data   ?   numeric or analytic derivatives   ?   more
其他統計方法
(Other statistical methods)
kappa measure of interrater agreement   ?   Cronbach's alpha   ?   stepwise regression   ?   tests of normality   ?   more
函數
(Functions)
statistical   ?   random-number   ?   mathematical   ?   string   ?   date and time   ?   regular expressions   ?   Unicode   ?   more
互聯網功能
(Internet capabilities)
search and download thousands of community-contributed features (see below)   ?   web updating   ?   web file sharing   ?   latest Stata news   ?   more
網絡社區功能
(Community-contributed features)
search and download thousands of free additions   ?   discover new features in the Stata Journal   ?   share commands by posting to the SSC   ?   discuss community-contributed features on Statalist   ?   more
嵌入式統計計算
(Embedded statistical computations)
Numerics by Stata   ?   more
安裝驗證
(Installation Qualification)
IQ report for regulatory agencies such as the FDA   ?   installation verification   ?   more
FDA規則
(FDA Compliance)
Adherence to FDA regulatory requirement for statistical software   ?   more
無障礙訪問
(Accessibility)
Section 508 compliance, accessibility for persons with disabilities   ?   more
樣本范例
(Sample session)
A sample session of Stata for Mac, Unix, or Windows.

更多功能特色

  • 1. 表格 (Tables)



    用戶一直希望我們提供更完美的表格,現在您可以很容易地創建比較回歸結果或匯總統計數據的表格,您可以創建樣式并將其應用于您構建的任何表,還可以將表導出到MS Word?, PDF, HTML, LaTeX, MS Excel?, 并將它們插入到報告中。新版本修改了table命令,新的 collective 前綴可以從任意多個命令收集任意多的結果,生成表格,并將其導出為多種格式等。您還可以使用新的Tables Builder來單擊并創建表格。


  • 2. 貝葉斯計量經濟學



    Stata能進行計量經濟學,也能進行貝葉斯統計,現在Stata能夠進行貝葉斯計量經濟學!想要用概率性的陳述來回答經濟問題,例如:那些參加職業培訓項目的人在未來五年里更有可能保持就業嗎?想把對經濟過程的先驗知識結合起來嗎?Stata新推出的貝葉斯計量經濟學功能可以幫到您。適合許多貝葉斯模型,如橫截面模型、面板數據模型、多層模型和時間序列模型。使用貝葉斯因子比較模型,獲取更多預測和展望!

    在計量經濟學建模中使用貝葉斯方法的吸引力之一是將關于通常在實踐中可用的模型參數的外部信息納入其中。這些信息可能來自歷史數據,也可能自然來自經濟過程的知識。無論哪種方式,貝葉斯方法都可以使我們將外部信息與我們在當前數據中觀察到的信息結合起來,以形成對感興趣的經濟過程的更現實的看法。

    Stata 17 在貝葉斯計量經濟學領域提供了幾個新功能:
    > Bayesian VAR models /貝葉斯VAR模型
    > Bayesian IRF and FEVD analysis /貝葉斯IRF和FEVD分析
    > Bayesian dynamic forecasting /貝葉斯動態預測
    > Bayesian longitudinal/panel-data models /貝葉斯縱向/面板數據模型
    > Bayesian linear and nonlinear DSGE models /貝葉斯線性與非線性DSGE模型



  • 3. 更快的Stata



    Stata不僅重視數據處理的準確性而且重視處理的速度,兩者之間通常需要權衡取舍,但Stata努力為用戶提供兩全其美的選擇。在Stata 17中,我們更新了sort和collapse的算法,使這些命令運行更快。我們還對某些估計命令(例如mixed)實現了速度改進,使這些命令適合多層混合效應模型(multilevel mixed-effects models)。


  • 4. 雙重差分(DID)和DDD模型



    新的估計命令didregress和xtdidregress具有使用重復測量數據擬合雙重差分(DID)模型和三重差分(DDD)模型。 didregress適用于重復橫截面數據,xtdidregress適用于縱向/面板數據。
    采用DID和DDD模型,用重復測量數據估計平均治療效果(ATET)。 治療效果可以是藥物方案對血壓的影響,也可以是培訓計劃對就業的影響。 與現有的teffects命令可用的標準橫截面分析不同,DID分析可控制估計ATET時的組和時間效應,組可在其中識別重復的度量。DDD分析控件可控制其他組效果及其與時間的相互作用——您最多可以指定三個組變量或兩個組變量和一個時間變量。


  • 5. 區間刪失Cox模型


    半參數Cox比例風險回歸模型通常用于分析未刪失和右刪失的事件時間數據。 新的估計命令stintcox可使用Cox模型,來估計刪失事件時間數據。當未直接觀察到發生某個事件(例如癌癥復發)的時間,但已知該時間間隔在某個時間間隔內時,便會進行時間間隔檢查。例如,可以在定期檢查之間檢測到癌癥的復發,但是無法觀察到確切的復發時間。我們只知道在先前檢查和當前檢查之間的某個時間復發了癌癥。忽略區間刪失可能會導致錯誤的結果(有偏差的)。
    當沒有完全指定基線風險函數時,對區間刪失事件時間數據進行半參數估計是一項挑戰,因為沒有一個事件時間是被精確地觀測到的。
    因此,這些數據的“半參數”建模通常采用樣條方法或分段指數模型作為基線風險函數。直到最近的方法學進展(在stintcox命令中實現)之后,才提供真正的區間刪失事件時間數據的半參數建模。


  • 6. 多維元分析



    您想分析多項研究的結果。這些研究報告了多個效應量,這些效應量很可能在一項研究中相互關聯。單獨的meta分析(例如使用現有meta命令的那些meta分析)將忽略相關性。現在,您可以使用新的meta mvregress命令執行多維元分析,這將解釋相關性。


  • 7. 貝葉斯VAR模型



    貝葉斯前綴現在支持var命令以擬合貝葉斯矢量自回歸(VAR)模型。VAR模型通過將結果變量的滯后時間作為模型預測變量來研究多個時間序列之間的關系。已知這些模型具有許多參數:對于K個結果變量和標記,至少存在p(K ^ 2 + \ nn1)個參數。對模型參數的可靠估計可能會遇到挑戰,尤其是在使用小型數據集的情況下。貝葉斯VAR模型通過整合有關模型參數的先驗信息來穩定參數估計,從而克服了這些挑戰。


  • 8. PyStata



    Stata 17引入了一個我們稱之為PyStata的概念。PyStata是一個涵蓋了Stata和Python可以交互的所有方式的術語。
    Stata 16具有從Stata調用Python代碼的功能。Stata 17允許您通過一個新的pystata Python包從一個獨立的Python環境中調用Stata,從而極大地擴展了此功能。您可以在基于IPython內核的環境(例如Jupyter Notebook和控制臺以及Jupyter Lab和控制臺)中方便地訪問Stata和Mata。
    在其他支持IPython內核的環境中(例如,Spyder IDE和PyCharm IDE);或從命令行訪問Python(例如Windows命令提示符,macOS終端,Unix終端和Python的IDLE)時。


  • 9. Lasso治療效果評估



    您可以使用teffects 來估計治療效果。您可以使用Lasso來控制許多協變量。(當我們說“很多”時,可以理解為成百上千甚至更多!)現在,您可以使用telasso來估計治療效果并控制許多協變量。

  • 10. Galbraith圖



    新命令meta galbraithplot生成Galbraith圖以進行元分析。這些圖可用于評估研究的異質性和檢測潛在的異常值。當有許多研究時,它們還可以用作森林圖forest plots的替代方案,以總結元分析結果。

  • 11. 留一元分析



    現在,您可以通過使用meta summarize和meta forestplot的新選項leaoneout來執行留一元分析。留一元分析通過在每次分析中排除一項研究來執行多種元分析。研究通常會產生夸大的效應大小,這可能會扭曲整體結果。留一元分析可用于研究每項研究對總體效應量估計的影響,并確定有影響力的研究。

  • 12. 貝葉斯縱向/面板模型



    通過使用xtreg表示連續結果,xtlogit或xtprobit表示二進制結果,xtologit或xtoprobit表示序數結果等,可以擬合隨機效應面板數據模型。在Stata 17中,您可以簡單地通過在它們前面加上Bayes前綴來擬合這些模型的Bayesian版本。

  • 13. 面板多項邏輯模型



    Stata的新估計命令xtmlogit可使用面板多項邏輯(MNL)模型,以對隨時間推移觀察到的分類結果進行分類。假設我們手機了幾個星期關于個人對餐館選擇的數據。餐館的選擇是沒有自然排序的分類結果,因此我們可以使用現有的mlogit命令(帶有聚類穩健的標準誤)。但是xtmlogit直接對單個特征建模,因此可能會產生更有效的結果。并且它可以很好地解釋可能與協變量相關的特征。

  • 14. 零膨脹排序邏輯模型



    新的估計命令ziologit適合零膨脹排序邏輯回歸模型。這個模型是在當數據在最低類別中的觀測值比例高于標準有序邏輯模型的預期值時使用的。我們將最低類別中的觀測值稱為零,因為它們通常對應于某一行為或特征的缺失。零膨脹是通過假設零同時來自邏輯模型和有序邏輯模型來解釋的。每個模型可以具有不同的協變量,并且結果可以顯示為優勢比而不是默認系數。

  • 15. 貝葉斯多層次模型:非線性、聯合、類SEM等



    您可以使用bayesmh命令的新的精美隨機效果語法來擬合貝葉斯多級模型的廣度。您可以更輕松地擬合單變量線性和非線性多級模型。現在,您可以擬合多元線性和非線性多級模型!考慮增長線性和非線性多級模型,聯合縱向和生存時間模型,SEM型模型等等。

  • 16. 貝葉斯動態預測



    在擬合多元時間序列模型(例如向量自回歸(VAR)模型)之外,動態預測是一種常見的預測工具。擬合經典var模型后,可以使用fcast計算動態預測。 使用bayes:var擬合貝葉斯var模型后,現在可以使用bayesfcast 來計算貝葉斯動態預測。貝葉斯動態預測會生成整個預測值樣本,而不是像傳統分析中那樣生成單個預測。該樣本可用于解答各種建模問題,例如,在估計預測不確定性時,在不做出漸近正態性假設的前提下,該模型對未來觀測的預測程度如何。這對于可能會出現漸近正態性假設的小型數據集尤其有吸引力。

  • 17. 貝葉斯IRF與FEVD分析



    脈沖響應函數(IRF),動態乘數函數和預測誤差方差分解(FEVD)通常用于描述多元時間序列模型(例如VAR模型)的結果。VAR模型具有許多參數,可能難以逐個解釋。 IRFs和其他函數將多個參數的影響合并為一個摘要(每個時間段)。例如,IRFs測量一個變量對給定結果變量的沖擊(變化)的影響。貝葉斯IRFs(和其他函數)使用IRFs的“精確”后驗分布產生結果,這不依賴于漸近正態性的假設。它們還可以為小型數據集提供更穩定的估計,因為它們合并了有關模型參數的先驗信息。

  • 18. 使用 BIC 選擇Lasso懲罰參數



    懲罰參數的選擇是lasso分析的基礎。套用少量的懲罰可能會包含太多變量。套用較大的懲罰可能會忽略潛在的重要變量。lasso估計已經提供了幾種懲罰選擇方法,包括交叉驗證,自適應和插件。現在,您可以使用貝葉斯信息準則(BIC)通過指定selection(bic)選項在Lasso進行預測和Lasso進行推理之后選擇懲罰參數。同樣,在擬合Lasso模型后,新的后估計命令bicplot將BIC值繪制為懲罰參數的函數。這為懲罰參數的值提供了方便的圖形表示形式,從而使BIC功能最小化。

  • 19. lasso聚類數據



    現在,您可以在Lasso分析中解釋集群數據。忽略聚類可能會導致錯誤結果,因為同一聚類中的觀測值之間存在相關性。使用Lasso命令進行Lasso和Elasticnet等預測,您可以指定新的cluster({\ it clustvar})選項。使用Lasso命令進行推斷(例如:poregress),您可以指定新的vce(cluster {\ it clustvar})選項。

  • 20. 貝葉斯線性和非線性DSGE模型



    現在,可以通過在dsge和dsgenl前面加上前綴Bayes:來擬合貝葉斯線性和非線性動態隨機一般均衡(DSGE)模型。通過從30多種不同的先驗分布中進行選擇,合并有關模型參數范圍的信息。執行貝葉斯IRF分析,執行區間假設檢驗,使用貝葉斯因子比較模型等等。


  • 21. Jupyter Notebook與Stata



    Jupyter Notebook是一個功能強大且易于使用的Web應用程序,它允許您將在單個文檔(“筆記本”)中將可執行代碼、可視化、數學方程式和公式、敘述文本以及其他富媒體組合在一起,以進行交互式計算和開發。 它已被研究人員和科學家廣泛使用,以分享他們的想法和成果,進行協作和創新。
    在Stata 17中,作為PyStat的一部分,您可以使用IPython(交互式Python)內核從Jupyter Notebook調用Stata和Mata。這意味著您可以在一個環境中結合使用Python和Stata的功能,以使您的工作易于復制和與他人共享。
    從Jupyter Notebook調用Stata是由新的pystata Python軟件包驅動的。


  • 22. 日期和時間的新功能



    Stata 17增加了新的便利功能,用于處理Stata和Mata中的日期和時間。 新功能可以分為三類:
    1.Datetime持續時間:旨在獲取持續時間的函數(例如ages)。
    2.相對日期:基于其他日期返回日期的函數,例如相對于給定日期的下一個生日。
    3.Datetime組件:從日期時間值中提取不同成分的函數。

    新功能將閏年,閏日和閏秒(如果適用的話)考慮在內。
    閏秒是一秒的調整,偶爾會應用于協調世界時(UTC)。

  • 23. Intel數學內核庫(MKL)



    Stata 17引入了在兼容硬件(所有基于Intel和AMD的64位計算機)上使用Intel Math Kernel Library(MKL)的方法,并提供了深度優化的LAPACK例程。
    LAPACK是線性代數包的縮寫,它是一套用于求解聯立方程組、特征值問題和奇值問題等的程序。Mata運算符和函數(如qrd()、lud()和cholesky())在可能的情況下利用LAPACK進行許多數值操作。
    由英特爾MKL支持的LAPACK提供了最新的LAPACK例程,這些例程針對現代Intel和現代AMD處理器使用的64位Intel x86-64指令集進行了優化。使用MKL的Mata函數和運算符在性能方面大有裨益。最重要的是,您無需采取任何措施即可充分利用速度的提高。使用這些Mata函數和運算符的Stata命令以及Mata函數和運算符本身,將在兼容硬件上自動使用Intel MKL。

  • 24. Stata on Apple Silicon



    Stata 17 for Mac是一款通用應用程序,可以在Apple Silicon和Intel處理器的Mac上運行。采用Apple Silicon的Mac電腦包括新款MacBook Air、MacBook Pro和Mac mini,均采用M1處理器。M1芯片承諾有更高的性能和更大的功能效率。這對于我們的Stata-for-Mac用戶來說是值得注意的,他們中的許多人使用Mac筆記本電腦。
    雖然第一套M1 mac被認為是入門級的,但我們發現,本機運行Stata的M1 mac比英特爾mac的性能要好30-35%。它們的性能甚至遠遠超過價格超過兩倍的Intel Mac!對于只堅持在其Apple Silicon Mac上使用Apple-Siliconnative軟件的用戶,從安裝程序到應用程序本身,Stata 17的任何部分都不需要用到Rosetta 2。
    無論您是在M1 Mac上還是在Intel Mac上本地運行Stata,Stata的功能都相同,并且M1 Mac不需要特殊的許可證。英特爾Mac用戶應注意,未來幾年,我們將繼續支持并發布適用于英特爾處理器的Mac的新版本Stata。


  • 25. JDBC


    將Stata與數據庫連接變得更加容易了。Stata 17添加了對JDBC(Java數據庫連接)的支持。 新的jdbc命令支持JDBC標準,用于與具有矩形數據的關系數據庫或非關系數據庫管理系統交換數據。您可以從一些最受歡迎的數據庫供應商中導入數據,例如Oracle,MySQL,Amazon Redshift,Snowflake,Microsoft SQL Server等。
    jdbc的優點在于它是一個跨平臺的解決方案,因此我們的JDBC設置適用于Windows,Mac和Unix系統。如果您的數據庫供應商提供了JDBC驅動程序,則可以下載并安裝該驅動程序,然后通過jdbc在數據庫上讀取,寫入和執行SQL。 您可以將整個數據庫表加載到Stata中,也可以使用SQL SELECT將表中的特定列加載到Stata中。您還可以將所有變量插入數據庫表中,或僅插入數據集的子集。

  • 26. Java集成


    在Stata 17中,您現在可以直接在Stata中嵌入和執行Java代碼。您可以在以前的Stata版本中創建和使用Java插件,但這需要您編譯代碼并將其打包到Jar文件中。在do文件中執行Java可以讓您自由地執行直接與Stata代碼綁定的Java代碼。現在,您可以在do-file或ado-file中編寫Java代碼,甚至可以從Stata中交互式地調用Java(如JShell)。
    Java的優勢之一在于與Java虛擬機打包在一起的廣泛的APIs。還有許多有用的第三方庫。根據您需要執行的操作,您甚至可以編寫并行代碼以利用多核運算。您編寫的Java代碼可以即時編譯,無需使用外部編譯器!此外,還包括Stata函數接口(SFI)Java軟件包,提供了Stata與Java之間的雙向連接。
    SFI包具有訪問Stata當前數據集,幀,宏,標量,矩陣,值標簽,特征,全局Mata矩陣,日期和時間值等的類。Stata將Java開發工具包(JDK)與其安裝捆綁在一起,因此不涉及其他設置。

  • 27. H2O集成


    在Stata 17中,我們一直在嘗試連接H2O,H2O是一種可擴展的分布式開源機器學習和預測分析平臺。您可以在https://docs.h2o.ai/上了解有關H2O的更多信息。
    借助H2O的集成,您可以從Stata上啟動,連接和查詢H2O集群。此外,我們提供了一組命令來處理集群上的數據(H2O幀)。例如,您可以通過導入數據文件或加載Stata的當前數據集來創建新的H2O框架。您還可以在Stata內部拆分,組合和查詢H2O幀。盡管對于我們來說,這仍處于試驗階段,但我們希望將其提供給我們的用戶進行試用。
    另一方面,由于它是實驗性功能,因此語法和功能可能會發生變化。使用提供對H2O特定功能的訪問的Stata命令時,請記住這是H2O功能。盡管您可能通過Stata命令訪問它,但它的工作取決于H2O,并且不在Stata范圍內。


  • 28. do文件編輯器:導航,增強書簽…



    Stata 17中的“文件”編輯器進行了以下改進:
    1. 書簽:現在與do文件一起保存。
    2. 新的導航控件:可以輕松瀏覽do文件。
    3. 語法高亮顯示支持現已包括Java和XML。
    4. 選區中引號,括號和方括號的自動補全。 例如,選擇文本mymacro,然后輸入左引號`;。 然后,文件編輯器將用單引號將文本選擇綁定,將選擇更改為“ mymacro”。
    書簽:do文件編輯器最需要的功能之一是能夠將書簽保存在do文件中。書簽用于標記感興趣的行,以便以后更輕松地導航到它們。書簽在瀏覽長do文件時特別有用。 您可以將書簽添加到您的do文件的各個部分,以執行數據管理,顯示摘要、統計信息并執行統計分析。然后,您可以使用菜單、工具欄或新的導航控件在這些部分之間快速來回移動,而無需滾動幾行代碼來查找所需的部分。
    導航: Stata 17通過新的導航控件使do文件的導航更加容易,該控件顯示書簽及其標簽的列表。從導航控件中選擇一個書簽會將“do文件編輯器”移至書簽所在的行。除了書簽之外,導航控件還將顯示do文件中的程序列表。從導航控件中選擇一個程序會將“do文件編輯器”移至該程序的釋義。無需將其他程序添加到“導航”中。 DO文件編輯器將自動將程序的釋義添加到導航控件中。

  • 29. 非參數的趨勢檢驗



    現在,nptrend命令支持四種跨有序組的趨勢檢驗。您可以在the Cochran–Armitage test, the Jonckheere–Terpstra test, the linear-by-linear trend test, and the Cuzick test using ranks之間進行選擇。前三個檢驗是新的,而第四個檢驗由nptrend先前執行。


  • Lasso


    作為大數據Volume的一種重要形式,“高維數據”(high-dimensional data)解釋變量很多,甚至超過樣本容量。Lasso (Least Absolute Shrinkage and Selection Operator,也稱“套索估計量”)及其衍生的系列估計量正是進行高維回歸的主要工具。
    Lasso系列的官方命令,包括lasso, elasticnet(彈性網)與 sqrtlasso(平方根Lasso),可估計線性回歸模型(比如 lasso linear)、二值選擇模型(比如,lasso logit 與 lasso probit)、計數模型(比如,lasso poisson)等。
    Lasso 系列的估計量通常使用懲罰回歸(penalized regressions)來處理高維數據,以避免“過擬合”(overfit)與“方差爆炸”(variance explosion),并進行“變量選擇”(variable selection)。這些懲罰回歸對于回歸系數過大的懲罰力度則一般由調節參數(tuning parameter)或 L1范數(L1 norm)來控制。
    使用 Stata 16的Lasso命令,可以很方便地計算回歸系數的整個路徑(coefficient paths),作為調節參數 或 L1范數的函數;并根據“交叉驗證”(cross-validation)選擇最優的調節參數 ,參見下圖。




    Stata 官方命令還提供了 Lasso 系列相應的統計推斷方法,比如計算標準誤、置信區間,或進行假設檢驗。這些統計推斷方法包括“double-selection lasso”(比如,dsregress,dslogit,dspoisson),“partialling-out lasso”(比如,poregress,pologit,popoisson),以及“cross-fit partialing out lasso”(比如,xporegress,xpologit,xpopoisson)。


  • Multiple Datasets in Memory


    在大數據時代,學界與業界越來越需要在內存中同時處理多個數據集。在此前的 Stata 版本中,Stata 內存只能有一個數據集。這種設置雖簡便易行,在小數據時代也基本夠用,但在大數據時代,由于數據的來源 Variety 多樣,已成為應用的瓶頸。
    因此,Stata 適時地推出在內存內同時調用多達100個數據集的重要功能。比如,你可以很方便地根據內存中多個數據集的信息來定義一個新的變量。


  • Python Integration


    隨著機器學習與數據科學的興起,Python 無疑是最炙手可熱的編程語言之一。為此,Stata 16 專門提供了一個與 Python 的接口,讓用戶可以在熟悉的 Stata 界面下調用 Python,并在 Stata 中顯示運行結果。
    比如,此前的 Stata 版本無法畫三維立體圖,而在Stata 16中,通過調用Python 的 Matplotlib 則不難實現(參見下圖)。


    這也意味著,你可以在 Stata 中,通過 Python 接口,使用 Python 所擅長的各種機器學習方法,包括隨機森林、梯度提升、支持向量機、神經網絡等!


  • Do-file Editor -- Autocompletion and More Syntax Highlighting


    在大數據時代,編程越來越成為一種基本技能。在 Stata 中編程,無疑需要一個很好的 do 文件編輯器(Do-file Editor)。 讓人驚喜的是,Stata 的 do 文件編輯器的性能也有了大幅提升,包括 Stata 命令的自動填寫完成(autocompletion),以及更多語法高亮顯示(syntax highlighting),這無疑將為 Stata 編程提供很大便利。


  • Meta-Analysis


    Stata 提供了全新的 Meta-Analysis 模塊,使得元分析變得十分方便、快捷而高效,并輔之以強大的可視化功能(參見下圖)。


  • Reporting


    由于大數據的更新頻繁特點(Velocity),使得數據分析經常需要重復進行,使用更新的數據。此時,研究報告的可重復性(Reproducibility)就變得日益重要,即保證任何人只要運行你的 Stata 程序即可得到完全一樣的研究報告。這些研究報告的格式可以是 Word,PDF,Excel 或 HTML(參見下圖)。 隨著大數據時代的數據來源 Variety 越來越多,使得我們時常需要將不同來源的樣本數據之研究結果整合在一起,即所謂“元分析”(Meta-Analysis)。


    而且,當你的數據集更新之后,再運行一遍你的 Stata,則你的研究報告也會相應地自動更新!Stata 16 新引入或完善的相關命令包括 dyndoc,markdown,putdocx,html2docx,doc2pdf。

    小貼士:還在發愁如何將 Word 文件轉化為 PDF 格式?Stata 16 的 doc2pdf 命令就能幫你搞定!

  • Import Data from SAS and SPSS


    如果你有數據在 SAS 或 SPSS 中,想要導入 Stata 以利用其強大的統計與計量功能,Stata 16 貼心地提供了專門的新命令 import sas 與 import spss,使得這種數據遷移變得十分方便與快捷,參見下圖。




  • Stata 深耕計量經濟學的經典與前沿方法


  • Nonparametric Series Regression


    序列回歸(series regression)是非參數回歸(nonparametric regression)的一種重要方法。它使用多項式(polynomials)、B-樣條(B-splines)或樣條(splines)所構成的序列來近似逼近任意的未知回歸函數。

    Stata 推出的命令 npregress series 填補了 Stata 在非參數回歸領域的又一空白,使得非參數序列回歸變得方便而高效;比如,計算平均邊際效應(average marginal effects)。命令 npregress series 甚至可以估計“半參數模型”(semi-parametric model),即同時包含參數與非參數部分的模型。

  • Choice Models


    對于微觀計量中常用的“離散選擇模型”(discrete choice models),Stata 設立了一個“選擇模型”(Choice Models)的模塊。在估計選擇模型之前,你先通過命令 cmset 來宣布你的數據為選擇模型,然后可用命令 cmsummarize,cmchoiceset,cmtab 或 cmsample 來考察你的選擇模型。
    估計選擇模型的相應 Stata 命令也統一帶上了 cm 的前綴,比如
    cmclogit:conditional logit model
    cmmixlogit:mixed logit model
    cmxtmixlogit:panel-data mixed logitmodel
    cmmprobit:multinomial probitmodel
    cmroprobit:rank-ordered probitmodel
    cmrologit:rank-ordered logitmodel
    其中,cmxtmixlogit 是 Stata 16的全新命令,用于估計面板數據的混合邏輯模型(mixed logit models for panel data)。

  • Panel-data ERMs


    Stata 15 推出了 ERM(Extended Regression Models)模塊,可以處理同時出現“內生性”(endogeneity)、“樣本選擇”(sample selection)與“處理效應”(treatment)這三種并發癥的情形,或三者的任意組合,非常靈活實用。Stata 16 則將ERMs 推廣到了面板數據中,新引入了xtegress,xteintreg,xteprobit,xteoprobit 等強大命令。

  • New in Bayesian Analysis


    Stata 的“貝葉斯分析”(Bayesian Analysis)模塊也有了不少新功能。比如,可使用多個馬爾科夫鏈(multiple chains)來檢驗現代貝葉斯分析所依賴的馬爾科夫鏈蒙特卡洛(Markov China Monte Carlo)是否收斂;以及使用后驗分布(posterior distribution)進行“貝葉斯預測”(Bayesian predictions),參見下圖。


  • Nonlinear DSGE Models


    tata 可以通過命令 dsgenl 來估計非線性 DSGE 模型。 使用命令dsgenl,無須再手工將 DSGE 模型線性化,直接輸入非線性的 DSGE 模型,Stata 即會自動地對它進行線性化與估計。

  • xtheckman


    xtheckman命令 使得 Heckman 的樣本選擇模型(sample model)也可以在面板數據中估計。


系統要求

Stata for Windows
Windows 11*
Windows 10 *
Windows Server 2022, 2019, 2016, 2012R2 *
* Stata requires 64-bit Windows for x86-64 processors made by Intel? or AMD (Core i3 equivalent or better)

Stata for Mac
Mac with Apple Silicon or Intel processor (Core i3 or better)
macOS 11.0 (Big Sur) or newer for Macs with Apple Silicon and macOS 10.13 (Sierra) or newer for Macs with 64-bit Intel processors

Stata for Linux
Any 64-bit (Core i3 equivalent or better) running Linux
Minimum requirements include the GNU C library (glibc) 2.17 or better and libcurl4
Check the output of ldd -v within a terminal
For xstata, you need to have GTK 2.24 installed

Hardware requirements

Package Memory Disk space
Stata/MP 4GB 4GB
Stata/SE 2GB 4GB
Stata/BE 1GB 4GB

Stata for Linux requires a video card that can display thousands of colors or more (16-bit or 24-bit color)




在世界已邁入大數據新時代的今天,Stata 在高校商科類專業、科研院所以及企業界的應用越來越廣泛,已成為各大高校必備的專業軟件,隨著其用戶群體的不斷擴大,建立中國用戶與 Stata 總部之間的溝通和磋商機制越發成熟。聆聽用戶的心聲,收集業界專家的論點與建議,已成為會議的主旨,無論您是為科研應用之路尋找最佳解決方案, 還是專注 Stata 軟件探索與研究,抑或是竭力于提高工作效率的數據處理技能,在 Stata 中國用戶大會上,您的需求都能得到前所未有的碰撞與共鳴。故 Stata 中國用戶大會(China Stata Users' Conference)由此誕生,由北京友萬信息科技有限公司(Beijing Uone Info&Tech Co.,Ltd)和StataCorp LLC原廠聯合發起,規劃每年舉辦一屆,通過廣泛的國際學術交流,幫助 Stata 中國用戶探索更深層次的理論和研究。我們希望通過每年一屆的 Stata 用戶會議,讓 Stata 中國用戶及學者提高自身軟件應用水平,開辟“學中用、用中學”的創新學習模式,打造強有力的學術氛圍,幫助中國用戶建立完善的軟件技術服務體系,形成中國用戶之間的技術、經驗交流平臺。



往屆 Stata 中國用戶大會資源免費奉送,關注 Stata 的小伙半們抓緊時間領取咯!


第八屆 Stata 中國用戶大會概況


2024 年第八屆 Stata 中國用戶大會將于 8 月 19 日至 20 日在南開大學舉辦。
計量經濟學前沿方法研討會暨“第八屆Stata中國用戶大會”即將于金秋八月在南開大學隆重舉行。會議將邀請國內外計量經濟學領域的TOP級大咖擔任主講嘉賓,為與會者提供一個全面了解計量經濟學前沿方法和Stata軟件實踐應用的平臺。大會以“計量經濟學的前沿方法與Stata軟件的實踐應用”為主題,旨在運用跨界思維和方法,推動計量經濟學等領域的教育創新與發展。同時,會議還將促進國內外計量經濟學領域的交流與合作,在會議期間,您將有難得的機會與來自國內外不同領域的頂尖計量經濟學專家、資深的Stata軟件專家以及前沿的研發工程師深入交流,共同探討并分享寶貴的學術見解和實踐經驗。您將第一時間了解到計量經濟學領域的最新發展動態,以及Stata軟件新功能和新命令。恰逢StataNow全新發布,邀您與StataNow一起,開啟數據分析新篇章!此外,會議還將推出《Stata夏令營活動》,為您提供一個學習使用Stata新方法的絕佳機會。無論您是初學者還是資深用戶,都能在這里實現自我突破與科研創新。 在南開大學這座百年學府中,您將感受到濃厚的學術氛圍和人文氣息。我們誠摯邀請您共襄盛舉,與眾多專家學者共同交流學習,為推動國內經濟學等領域的交叉融合貢獻智慧和力量。期待您的到來,共同見證這場學術盛事的成功舉辦!


第七屆 Stata 中國用戶大會概況


2023 年第七屆 Stata 中國用戶大會于 8 月 13 日至 14 日在哈爾濱商業大學成功舉辦。為促進高水平商科特色高校建設與經濟學等其他學科的交叉融合,會議圍繞“東北全面振興與高水平商科大學建設背景下的經濟學實證統計方法”為主題,積極開展跨學科的探索性研究與統計相關的研究。會議以數字經濟為背景,運用跨界思維和方法,將新技術、新理念、新模式,新方法融入商科教育。與會領導、專家和來自全國各地的業界學者一起,置身于美麗的哈爾濱,穿過百年中央大街,探訪中華巴洛克歷史文化街區,漫步美麗松花江畔,享受為期兩天的 Stata 會議和交流時光!


演講主題 演講人
《Stata 18 新功能應用》 Stata軟件開發者    StataCorp LLC
《Heterogeneous difference in differences in Stata》 劉   迪    StataCorp LLC
《雙重機器學習及Stata應用》 陳   強    山東大學
《Create customizable tables》 徐   朝    StataCorp LLC
《Instrumental variables quantile regression》 劉   迪    StataCorp LLC
《干預時間序列分析與程序包的比較述評》 王群勇    南開大學
《因果推斷中的控制變量:好的和壞的》 連玉君    中山大學
《Fitting spatial stochastic frontier models in Stata》 杜克銳    廈門大學
《Stata與會計研究:資本市場開放與財務報告穩健性》 梁上坤    中央財經大學
《DID安慰劑檢驗及Stata應用》 顏冠鵬    山東財經大學

—> 前往了解大會詳情


第六屆 Stata 中國用戶大會概況


第六屆 Stata 中國用戶大會于2022年8月19-20日在線盛大召開。您可以與來自各領域頂尖的 Stata 專家及 Stata 研發工程師一起分享有價值的見解及新命令,學習最前沿的科研方法并提高您的 Stata 應用知識。會議同期還將全新推出《Stata大師課》+《Stata公開課》的夏季聯學營活動,無論您是初學者還是專家,歡迎加入我們,并利用這一獨特的機會來學習使用 Stata 的新方法。


演講主題 演講人
《Mastering Stata's datetime concepts and functions》 彭   華    StataCorp LLC
《動態隨機一般均衡模型的貝葉斯估計》 王群勇    南開大學
《合成控制法(SCM)的安慰劑檢驗、穩健性檢驗及可視化操作》 顏冠鵬    山東大學
《Stata中的標準誤》 陳   強    山東大學
《Creating Custom Estimation Tables》 呂   丹    StataCorp LLC
《模型平均化(Model Averaging)及其在經濟金融領域的應用》 連玉君    中山大學
《使用網絡方法研究經濟學問題》 神秘嘉賓
《綠色全要素生產率與高質量發展評估》 張   寧    山東大學

—> 前往下載大會資源


第五屆 Stata 中國用戶大會概況


第五屆 Stata 中國用戶大會暨“Stata 高級研究方法及新應用研討會”于2021年8月19-20日盛大召開。聚焦學術前沿,對話學界大咖,多層次解讀 Stata 17新應用。StataCorp LLC選派技術總工及開發者出席會議,與國內一線專家共襄盛舉,共享 Stata 應用新思路。


會議主題:Stata高級研究方法及新應用研討會

演講主題 演講人
《Stata 17 自定義表格新應用》 彭   華    StataCorp LLC
《Global VAR and Bayesian VAR in Stata》 王群勇    南開大學
《回歸控制法及Stata應用》 顏冠鵬    山東大學
《分位數控制法及Stata應用》 陳   強    山東大學
《因果推斷中的Stata應用》 王存同    中央財經大學
《Fitting Cox proportional hazards model for interval-censored event-time data in Stata》 楊   筱    StataCorp LLC
《雙邊隨機邊界模型的Stata應用》 劉   暢    中山大學學
《優質稿件 | songbl命令的使用介紹:stata推文與電腦文檔的檢索》 楊景院    深圳大學
《一個Stata用戶的若干思考》 連玉君    中山大學
《合成控制法的Stata應用和前沿研究》 陸嘉炫    芝加哥大學
《Mixed Regression with Macro and Micro Data in Stata》 王群勇    南開大學

—> 前往下載大會資源


第四屆 Stata 中國用戶大會概況


2020年隨著新冠疫情的蔓延,全球都投入到積極防控的大潮中,如何高效獲取和處理COVID-19數據,必然成為本屆會議的熱點主題 。第四屆“Stata中國用戶大會”(China Stata Users' Conference) 將以“新應用+智交互”為主題,力邀國內外行業領袖及學術專家,共同開啟全新主題單元。本次會議以線上直播的方式與大家見面,知識碰撞、經驗交流、共享Stata應用新思路。


會議主題:新應用+智交互研討會

演講主題 演講人
《使用Stata獲取與處理COVID-19數據》 彭   華    StataCorp LLC
《Call Stata from Python》 徐   朝    StataCorp LLC
《混頻回歸方法與Stata應用》 王群勇    南開大學
《基于Stata模擬的內生性來源及其應對》 陳傳波    中國人民大學
《跨度回歸、偏度回歸與峰度回歸及Stata應用》 陳   強    山東大學
《平滑轉換模型與Stata應用》 王群勇    南開大學
《Causal Mediation》 金承剛    北京師范大學
《合成控制法安慰劑檢驗改進研究——基于標準化處理效應和非拒絕域的統計推斷》 連玉君    中山大學
《Measuring technical efficiency and total factor productivity change with undesirable outputs in Stata》 王道平    上海財經大學

—> 前往下載大會資源




第三屆 Stata 中國用戶大會概況


第三屆 Stata 中國用戶大會暨“機器學習與計量方法應用研討會”于2019年8月20—21日在上海財經大學盛大召開并取得圓滿成功。會議得到了國內外專家學者及眾多用戶代表的一致肯定,同時今年也是 Stata 16發布年,在會議上我們也希望能夠更多的了解對新版本的認知,反映中國用戶在應用軟件過程中遇到的問題。通過廣泛的國際交流,幫助 Stata 中國用戶探索更深層次的理論和研究。


會議主題:機器學習與計量方法應用研討會

演講主題 演講人
《Introduction of latest reporting and language extension features in Stata》 彭   華    StataCorp LLC
《Stata在公司投融資研究中的應用》 覃家琦    南開大學
《分位數回歸:橫截面、面板與工具變量法》 陳   強    山東大學
《Inference after lasso model selection》 劉   迪     StataCorp LLC
《非參數計量經濟方法(核回歸,局部線性回歸)》 王群勇    南開大學
《Fixed effect panel threshold model for unbalanced panel》 王群勇    南開大學
《Stata在外匯市場實證中的應用》 丁劍平    上海財經大學
《人工智能+ Stata》 陳堰平    微軟中國


—> 前往下載大會資源



第二屆 Stata 中國用戶大會概況


2018年“第二屆 Stata 中國用戶大會”(2018China Stata Users' Conference)是由北京友萬信息科技有限公司(簡稱:友萬科技)主辦,順德職業技術學院承辦的聚焦 Stata 應用與技術落地的盛會。會議核心內容將圍繞計量經濟方法及應用方向展開廣泛的國際學術交流,內容覆蓋經濟學、金融學、會計學、計算語言學、新聞學、政治學、歷史學、醫藥衛生等微觀和宏觀計量分析的熱門應用領域。今年大會的主題是“Econometric Analysis Method and Application” 秉承“開放協作、技術共享”的宗旨,面對面真誠聆聽用戶的聲音。致力于為業界帶來最新技術、行業應用案例展示與最佳實踐單元。



會議主題:Econometric Analysis Method and Application

演講主題 演講人
《大數據、高維回歸與Stata》 陳   強    山東大學
《Spatial autoregressive models using Stata》 劉   迪    StataCorp LLC
《政策評估與因果推斷:Stata應用概述》 王群勇    南開大學
《斷點回歸》 連玉君    中山大學
《回歸分析集成輸出解決方案》 李春濤    華中科技大學
《內含資本成本的計算》 顧   俊    深圳大學
《樣本選擇問題與處理》 王群勇    南開大學
《DSGE在Stata中的應用》 許文立    安徽大學
《Report generation with putdocx, putexcel, putpdf, and dyndoc》 彭   華    StataCorp LLC

—> 前往下載大會資源


第一屆 Stata 中國用戶大會概況


2017年“第一屆 Stata 中國用戶大會”(2017 China Stata Users' Conference)是由北京友萬信息科技有限公司和爬蟲俱樂部,聯合StataCorp LLC發起第一屆Stata中國用戶大會。首屆Stata用戶會議的宗旨是“溝通和合作”,我們希望通過定期舉辦 Stata 用戶會議,形成中國用戶之間的技術、經驗交流平臺;建立和 Stata 原廠的溝通機制,反映中國用戶遇到的問題,讓未來的Stata版本更多地反映中國用戶的愿望;建立學界與企業界之間的溝通和聯系,讓 Stata 用戶有更多的機會服務于企業界;打造數據分析領域的高端智庫,服務于我國的大數據事業。


會議主題:Retrieving data from website, Cloud oriented empirical analysis, Using Chinese in Stata

演講主題 演講人
《Stata 15 新版本發布及新功能研討》 彭   華    StataCorp LP 軟件工程總監
《內生性問題:方法及進展》 連玉君    中山大學
《putdocx與格式化輸出》 李春濤    中南財經政法大學
《unicode與中文編碼》 彭   華    StataCorp LP 軟件工程總監
《Stata函數》 彭   華    StataCorp LP 軟件工程總監
《Subinfile,網頁源代碼分析的神器》 薛   原    爬蟲俱樂部
《Stata自動化報告與可重復研究》 陳堰平    雪晴數據網
《分詞與情感分析》 薛   原    爬蟲俱樂部
《文本分析在量化文史學研究中的應用—以<唐書>與<紅樓夢>為例》 俞俊利    上海交通大學
《Stata、cURL交互與網絡爬蟲:以微博API為例》 彭文威    香港科技大學
《Stata數據清洗常用技巧》 彭文威    香港科技大學
《Econometric convergence test and club clustering using Stata》 杜克銳    山東大學

—> 前往下載大會資源


印刷書籍 查看更多


Interpreting and Visualizing Regression Models Using Stata, Second Edition

作者: Michael N. Mitchell
出版商: Stata Press
版權: 2021
ISBN-13: 978-1-59718-321-5
頁數:610; paperback

Data Management Using Stata: A Practical Handbook, Second Edition

作者: Michael N. Mitchell
出版商: Stata Press
版權: 2020
ISBN-13:978-1-59718-318-5
頁數:532; paperback

Introduction to Time Series Using Stata, Revised Edition

作者: Sean Becketti
出版商: Stata Press
版權: 2020
ISBN-13: 978-1-59718-306-2
頁數:446; paperback

Generalized Linear Models and Extensions, 4th Edition

作者: James W. Hardin和Joseph M. Hilbe
出版商: Stata Press
版權: 2018
ISBN-13: 978-1-59718-225-6
頁數: 598; 平裝

A Gentle Introduction to Stata, 6th Edition

作者: Alan C. Acock
出版商: Stata Press
版權: 2018 ISBN-13: 978-1-59718-269-0
頁數: 570; 平裝

The Mata Book: A Book for Serious Programmers and Those Who Want to Be

作者: 威廉W.古爾德
出版商: Stata Press
版權: 2018
ISBN-13: 978-1-59718-263-8
頁數: 428; 平裝

Survey Weights: A Step-by-Step Guide to Calculation

作者: Richard Valliant和Jill A. Dever
出版商: Stata Press
版權: 2018
ISBN-13: 978-1-59718-260-7
頁數: 183; 平裝

A Course in Item Response Theory and Modeling with Stata

作者: Tenko Raykov和George A. Marcoulides
出版商: Stata Press
版權: 2018
ISBN-13: 978-1-59718-266-9
頁數: 270; 平裝

電子書籍 查看更多


Interpreting and Visualizing Regression Models Using Stata, Second Edition

作者: Michael N. Mitchell
出版商: Stata Press
版權: 2021
ISBN-13: 978-1-59718-321-5
頁數:610; paperback

Data Management Using Stata: A Practical Handbook, Second Edition

作者: Michael N. Mitchell
出版商: Stata Press
版權: 2020
ISBN-13:978-1-59718-318-5
頁數:532; paperback

Introduction to Time Series Using Stata, Revised Edition

作者: Sean Becketti
出版商: Stata Press
版權: 2020
ISBN-13: 978-1-59718-306-2
頁數:446; paperback

Discovering Structural Equation Modeling Using Stata, Revised Edition

Alan C. Acock

An Introduction to Stata for Health Researchers, Fourth Edition

Svend Juul and Morten Frydenberg

A Gentle Introduction to Stata, Sixth Edition

Alan C. Acock

The Workflow of Data Analysis Using Stata

J. Scott Long

An Introduction to Modern Econometrics Using Stata

Christopher F. Baum

Stata Journal 期刊


Stata Journal為每季發行的期刊,包含了統計、資料分析、教學方法、有效地使用Stata語言及書籍回顧…等相關內容。 使用者亦可選擇購買有興趣的單篇文章。

ISI Web of Knowledge 的最新期刊引用報告,將Stata期刊列為社會科學數學方法類別期刊中的第四位,僅次于結構方程模型, 計量經濟學和經濟學與統計學評論。


點擊了解更多相關期刊內容

Stata原廠相關鏈接


>>最終用戶授權許可協議(EULA)

>>中國Stata Prof+ Plan計劃的名單

>>Stata Maintenance介紹

>>教學視頻

>>在線培訓
>>更多學習資源
>>官方博客










為順應大數據時代要求,自開展Stata培訓以來,我司通過活動路演、創新講座、在線課程、線下培訓等系列活動已經在全國開展了包含Stata應用方法、統計分析、文本分析、數據分析、數據清洗、Stata、cURL交互與網絡爬蟲、內生性問題的方法及進展、Stata編程與Mata運算、Stata編程技術與爬蟲、Stata自動化報告與可重復研究、計量經濟方法及Stata應用等學習活動,有近千余名師生及業界愛好者參與了學習。通過此類學習活動極大的加強了大數據分析人才的理論和實踐能力。推進了大數據人才培養,以及學術成果的轉化,為大數據分析領域發展做出了貢獻。我司希望通過每年一屆的Stata中國用戶大會,深度推進國內青年學者學習熱情,提升高校學術交流氛圍,整合學界及業內的大量資源,進一步提高數據分析能力和科學決策的水平。

Stata 系列課程

高級現場班:"面板數據與因果推斷" 研討會

主講:陳 強
時間:2024年8月18日
地點:南開大學

課程概要
使用面板數據進行實證分析的一種常見情形式,處理組僅有一位或幾位個體(地區),而處理前的時期較多。此時,可使用合成控制法、回歸控制法或分位數控制法進行有效的因果推斷。其中,合成控制法最為流行(Abadie and Gardeazabal, 2003; Abadie et al., 2010, 2015),但需要協變量;而回歸控制法則無須協變量,且算法簡便(Hsiao et al., 2012)。然而,合成控制法與回歸控制法主要依賴于安慰劑檢驗進行統計推斷,在應用中有一定局限性。分位數控制法使用“分位數隨機森林”(quantile random forest)的機器學習方法,通過非參數的分位數回歸構造處理效應的穩健置信區間,在小樣本中表現優異(Chen et al., 2024)。本課程將深入淺出地介紹合成控制法、回歸控制法或分位數控制法,并通過經典案例演示相應的Stata操作。

點擊了解課程詳情

高級現場班:《計量經濟實證方法與論文寫作研討會》 一期

主講:王群勇
時間:2024年8月15-17日
地點:南開大學

課程概要
多種計量方法的綜合應用,包括:
?生產網絡與投入產出分析
?指數隨機圖模型(ERGM)和TERGM模型
?貝葉斯估計
?假設抽取法
?異質空間面板模型
?反事實分析與安慰劑分析

精讀經濟學、政治學等領域的前沿論文,包括:
?沖擊在國際生產網絡中的傳播特征與反事實分析
?美國貨幣政策通過生產網路在資本市場的溢出效應
?社會關系與政治支持
?一國的農業政策如何影響其他國家的貧困率
?網絡結構對經濟行為的影響
研究設計方面的主題包括:
?如何設計研究框架?
?如何寫創新點或貢獻?
?如何選擇適當的模型?
?影響研究結論的威脅來自哪里?
?如何提高論文方法的辨識度?

點擊了解課程詳情

高級現場班:《計量經濟實證方法與論文寫作研討會》 二期

主講:王群勇
時間:2024年8月21-23日
地點:南開大學

課程概要
介紹多種計量方法的綜合應用,包括:
?網絡效應的因果推斷
?廣義傾向得分與劑量響應函數
?截面相關檢驗
?截面相關情形下的面板ARDL與面板誤差修正模型
?雙向引力模型與內生引力模型
?貝葉斯估計
?反事實分析
涵蓋了經濟學領域的前沿話題,包括:
?農業政策與貧困
?氣候變化與長期經濟增長
?雙向引力模型與內生引力模型
研究設計方面的主題包括:
?如何設計研究框架?
?如何寫創新點或貢獻?
?如何選擇適當的模型?
?影響研究結論的威脅來自哪里?

點擊了解課程詳情

高級現場班:"面板數據與因果推斷" 研討會

主講:王群勇
時間:2023年8月09-11日
地點:哈爾濱商業大學

課程概要
基于面板數據 (Panel Data) 的因果推斷方法是目前實證分析的主流方法。回歸模型是因果推斷的最重要的基礎,是實證分析的起點和基準。面板數據對于解決不可觀測異質性導致的內生問題具有天然的優勢。內生性問題是觀測數據中普遍存在的問題,是對因果關系的致命威脅。匹配法是因果推斷的流行方法。雙重差分法DID,通常用于政策效應類研究。斷點設計(RD)適用于政策是某個驅動變量的函數的情形。
課程特色
(1)理論方法與軟件操作密切結合,通過復現論文的實證結果提高實證研究的科學性和規范性。
(2)為部分模型提供的專享程序包。
(3)為學員的論文提供點評與討論,以及適當可能的合作。
(4)提供電子版本講義及課件資源、Stata18正版軟件試用,確保用戶都能正常、安全的運行數據,保證上課質量!

點擊了解課程詳情

高級現場班:"異質性穩健DID及Stata應用" 研討會

主講:陳強
時間:2023年8月12日
地點:哈爾濱商業大學
課程概要
雙重差分法(DID)是最常見的因果推斷方法,近年來發展迅猛。估計多期DID的傳統方法為雙向固定效應估計量(TWFE),但此法依賴于處理效應的同質性假定;例如處理效應不隨時間而變。根據培根分解(Goodman-Bacon, 2021)可知,若存在異質性處理效應,則TWFE有偏差。在夯實截面處理效應與經典DID的知識后,本課程將重點介紹異質性穩健(在異質性處理效應情況下也成立)的主流估計方法及Stata應用,包括交互加權法(Sun and Abraham, 2021)、雙重穩健估計法(Callaway and Sant’Anna, 2021)、即時處理效應法(de Chasemartin and D’Haultfoeuille, 2020)與插補法(Borusyak et al., 2022);其中,前二者適用于交疊DID(staggered DID),而后二者也適用于政策可逆轉的一般DID(general DID)。
課程特色
(1)深入淺出介紹計量思想與原理。
(2)結合經典案例講解Stata實操。
(3)提供電子版本講義及課件資源、Stata18正版軟件試用,確保用戶都能正常、安全的運行數據,保證上課質量!

點擊了解課程詳情

高級現場班:"宏觀計量經濟模型" 研討會

主講:王群勇
時間:2023年8月09-11日
地點:哈爾濱商業大學

課程概要
宏觀數據典型地包括時間序列數據和長面板數據。與微觀數據不同,宏觀數據計量模型的分析方法更多地關注動態規律、平穩性與協整關系、以及截面相關或空間相關的問題。本期課程聚焦于宏觀數據的兩種因果推斷方法(干預時間序列分析和合成控制法)、變系數模型、動態異質面板的ARDL模型、空間計量經濟、以及全局VAR和面板VAR模型。
課程特色
(1)理論方法與軟件操作密切結合,通過復現論文的實證結果提高實證研究的科學性和規范性。
(2)為部分模型提供的專享程序包。
(3)為學員的論文提供點評與討論,以及適當可能的合作。
(4)提供電子版本講義及課件資源、Stata18正版軟件試用,確保用戶都能正常、安全的運行數據,保證上課質量!

點擊了解課程詳情

高級課程:蒙特卡洛模擬、貝葉斯分析與Stata應用

主講:王群勇
課程概要
蒙特卡洛方法是發展最為成熟的計算機模擬方法之一,最早是在1957年由Metropolis 和Ulam等針對中子輸運問題時提出的。蒙特卡洛方法在許多領域均有廣泛的應用,如統計物理、計算生物學、金融學以及人工智能等等領域。 貝葉斯統計為你提供了在新數據的證據中更新你的評估工具,這是一個在許多現實世界場景中常見的概念,如跟蹤大流行病,預測經濟趨勢,或預測氣候變化。貝葉斯統計是許多較著名的統計模型的支柱。

點擊了解課程詳情

高級課程:宏觀計量經濟分析與Stata、Mathematica應用

主講:王群勇
課程概要
宏觀經濟是從宏觀、總體上研究國民經濟水平、結構、均衡、運行、穩定、調控和增長等的一個經濟研究范疇或領域。從宏觀、總體上研究國民經濟或者其某一方面,必然要和一些宏觀經濟變量及其所反映出的數據資料打交道,研究這些經濟變量之間的相互關系及其所反映出的宏觀經濟或其某一方面所具有的規律性,而這就需要采用宏觀經濟計量分析方法,建立宏觀經濟計量分析模型,并應用之。

點擊了解課程詳情

高級課程:貝葉斯分析與Stata應用

主講:王群勇
課程概要
2021年4月20日Stata17全新發布,針對貝葉斯計量經濟學作出了全面升級,大部分更新圍繞貝葉斯進行了增強升級,主要包括:貝葉斯VAR模型 (Bayesian VAR models)、貝葉斯縱向/面板數據模型 (Bayesian longitudinal/panel-data models)、貝葉斯多層模型:非線性,聯合,SEM-like等(Bayesian multilevel models: nonlinear, joint, SEM-like, and more)、貝葉斯動態預測 (Bayesian dynamic forecasting)、貝葉斯IRF與FEVD分析 (Bayesian IRF and FEVD analysis)、貝葉斯線性與非線性DSGE模型(Bayesian linear and nonlinear DSGE models)。為了讓更多Stata用戶深入系統的學習貝葉斯分析理論,本次課程使用Stata 17最新版軟件授課,講述平凡而又神奇的貝葉斯分析方法。

點擊了解課程詳情

中級課程:面板數據計量分析與Stata應用

主講:王群勇
課程概要
課程主要內容涵蓋面板數據的經典模型、動態面板、非線性面板模型、利用面板數據進行因果推斷、面板數據受限因變量模型、貝葉斯面板數據分析、面板空間計量模型等。

點擊了解課程詳情

初級課程:Stata 17新功能介紹課程

主講:StataCorp LLC
課程概要
Stata 17 更新了可自定義的表格(table)可以很容易地創建表格 ,并通過靈活的表格命令輕松的收集結果。可將表格導出到MS Word?, PDF, HTML, LaTeX, MS Excel?, 并將它們插入到報告中。Stata 17還引入了PyStata的概念,涵蓋了Stata和Python可以交互的所有方式的術語。 本課程帶您快速了解Stata 17中的 table 和 PyStata 及其他一些新功能。

點擊了解課程詳情

初級課程:Stata 16軟件功能介紹課程

主講:StataCorp LLC
課程概要
Stata16 新功能入門視頻,新增16+項主要功能特征,兩分鐘快速入門Stata,帶您一賭為快!

點擊了解課程詳情

初級課程:實證方法與Stata應用專題課程

主講:王群勇
課程概要
從一個完整的案例掌握Stata操作技巧,適合新手小白的論文實證方法與Stata應用專題課程,緊緊圍繞實證研究中倍受困擾的問題進行詳細解讀。 每個模型結合經典論文進行案例分析和軟件操作。

點擊了解課程詳情

高級課程:“非線模型講述非常故事”專題課程

主講:王群勇
課程概要
世界的本質是非線性的。如果我們覺得世界是平的,那只是因為我們的視野太窄了。在實證研究中,線性模型往往作為基準模型描述變量之間的整體平均關系,但“線性模型總是相似的,非線性模型各有各的非線性”,每一種非線性都可以講述一個不同尋常的故事。當估計完一個線性模型之后,是不是總覺得缺少什么?! 如何擺脫線性模型的單調和千篇一律?本課程帶領你學會如何從數據中挖掘與他人不一樣的精彩故事。 本課程主要介紹非線性模型的基本思想與算法,并結合具體案例,介紹Stata實踐操作。

點擊了解課程詳情

高級課程:“自然實驗與因果推斷”專題課程

主講:王群勇
課程概要
因果推斷是微觀計量分析的重要特征之一。反事實是因果推斷的最基本框架,自選擇等問題導致的政策內生性給政策評估帶來諸多障礙。本課程介紹利用觀測數據進行因果推斷的幾大利器:如何利用自然實驗(或準實驗)推斷因果關系、如何克服政策的內生性問題、斷點設計如何減弱了政策內生性問題和模型錯誤設定問題、以及面板數據中如何利用雙重查分和合成控制構建反事實的策略。

點擊了解課程詳情




Stata 案例集


為強化示范引領效果,加快推動高校Stata科研實驗室建設,由北京友萬信息科技有限公司聯合授權高校共同編制的《Stata案例集》正式發布。Stata案例集根據客戶成功案例收集整理而成,介紹了應用Stata軟件在科研工作和教學人材培養以及豐碩的科研成果方面取得的突出成效和變化,旨在幫助更多教學和科研單位根據其所屬的專業領域,參考如何高效的部署Stata軟件產品及解決方案。

案例一:首都經濟貿易大學 國際經濟管理學院



案例二:南開大學 經濟學院



案例三:西南政法大學 經濟學院



Stata實驗室建設計劃

北京友萬信息科技有限公司自成為Stata中國授權經銷商及合作伙伴以來,已為國內數十所高等院校及科研院所完成了Stata科研實驗室采購計劃。幫助其在教學科研、人材培養,論文發表、學科建設方面取得了突破性的進展。解決了在數據分析、數據處理、可視化、統計分析和自動報告等多方面的業務問題和個性化需求。對提高科研人員與教師的科學研究能力和教學水平起到了尤為重要的作用,誠邀有意向的單位加入我們,共同建立適合您的實驗室定制建設方案。


立即獲取定制方案 >