Python作為一門面向對象的編程語言,簡潔的語法使得編寫數十行代碼即可實現爬蟲功能,獲取海量互聯網數據。使用Python來編寫爬蟲實現簡單且效率高,同時爬取的數據可以使用Python強大的第三方數據處理庫來進行分析,最重要的是學習成本低,如此之好的東西怎能不學習呢?為提升相關科技工作者的技術水平,北京理工大學大數據創新學習中心特聯合繪辰科技(北京)有限公司(即雪晴數據網)舉辦Python爬蟲與機器學習應用案例研討會的專題討論會議。
        Python爬蟲與機器學習應用案例研討會
        2017年6月2日-- 6月4日 北京理工大學,理工國際教育交流大廈
       (時間安排:外地參會人員6月1日報到,2日~4日正式會議,2日~3日晚上安排答疑)
主辦方:雪晴數據網
       雪晴數據網是以數據科學為主題的在線社區,運營實體為繪辰科技(北京)有限公司。網站包含視頻課程、問答、資訊等模塊。雪晴數據網專注于大數據、數據分析、數據挖掘、數據科學技術的普及和推廣,致力于向數據科學從業者提供溝通平臺。
雪晴數據網已成為Microsoft高級分析培訓團隊的在中國大陸地區唯一的合作伙伴,也是RStudio公司在中國大陸唯一的合作伙伴。
● 企業培訓介紹
● 線下培訓介紹
協辦方:北京友萬信息科技有限公司,北京理工大學大數據創新學習中心
合作出版社:清華大學出版社,中國人民大學出版社
       本次研討會采用全案例教學模式,通過理論知識+案例示范+練習,突出軟件學習的應用性,從應用案例入手講解知識點,既用簡潔易懂的語言講述理論方法,又同時進行實際數據挖掘分析演示。
       ● 體系完整科學,可以系統化學習;
       ● 課程通俗易懂,可以讓學員真正學會;
       ● 從零開始教學直到深入,零基礎的同學亦可以學習;
       ● 例教學,用一個案例貫通爬蟲到數據分析的整個流程,用多個案例來加深印象。
       從事金融、醫療、保險、生態、衛生、計量、統計、銀行、通信、環境、基金等與數據分析統計相關的企事業單位技術骨干、科研院所研究人員和大專院校相關專業教學人員及在校研究生、碩士、博士等相關人員,以及廣大Python愛好者。
曾有杰,人人車計算平臺架構師及策略小組負責人,前搜狐大數據平臺研發工程師,多年數據分析與開發的工作經驗,擅長網絡爬蟲技術和自然語言處理,對大數據平臺、數據挖掘有豐富的實戰經驗。
陳堰平,雪晴數據網創始人,北京理工大學大數據創新學習中心導師團成員,2017年1月獲“微軟最有價值專家”榮譽稱號。畢業于中國人民大學統計學院,曾獲CQF國際數量金融認證,先后任新華社指數中心技術總監、SupStat Analytics中國區首席技術官。在統計咨詢、數據挖掘、開發數據驅動的商業解決方案等領域有近十年的經驗,曾為國家統計局、微軟、惠普、德勤咨詢、聯想、豐田、招商銀行、花旗銀行、東方航空、中國移動、中國電信、中國聯通、國家檢察官學院等機構做過數據科學方面的培訓和咨詢。曾開發貝葉斯動態預測模型的R包ssDLM,譯作有《R語言編程藝術》、《實用數據分析》和《R語言臨床數據分析》,主講的在線公開課《R語言數據分析入門》、《R語言大規模數據分析實戰》已在多個平臺上發布,累積學習人數過萬人。
第一天
案例一
爬取某二手房網站某市在售二手房房源信息,然后分析該市二手房價格影響因素
第一講
Python環境的搭建與基礎語法
1. 安裝anaconda套件
2. Jupyter Notebook的使用
3. 基本數據結構(列表、字典、元組)
4. 基本語法(條件、循環、函數、類)
第二講
數據導入導出、數據整理與變換
1. 使用Pandas庫導入/導出數據
2. 使用Pandas篩選、整理數據,分組匯總
3. 數據變換,重編碼
第三講
可視化與描述性統計
1. 餅圖、柱形圖、折線圖、箱線圖
2. 列聯表與馬賽克圖
第四講
Python爬蟲技術初步
1. 網頁結構分析
2. 網絡協議
3. Beautiful Soup庫的介紹
4. 使用Beautiful Soup寫爬蟲
第二天
案例二
抓取全國PPP綜合信息平臺項目信息
案例三
二手車定價模型
案例四
小額貸款公司用戶信用評分
第五講
Python爬蟲技術進階
1. Ajax異步請求數據的抓取
第六講
Python機器學習
1. statsmodels庫和scikit-learn庫介紹
2. 主成分分析
3. 線性回歸/ Logistic回歸
4. 支持向量機
5. XGBoost算法
第三天
案例五
根據關鍵詞在社交網絡上抓取與汽車相關的新聞和評論,使用自然語言處理技術做汽車的輿情分析
第七講
爬蟲技術高級
1. 爬蟲框架scrapy介紹
2. 架構概覽
3. 使用xpath解析頁面元素
4. 數據持久化方案(文件/數據庫)
5. 爬取微博、知乎話題討論結果
第八講
機器學習與自然語言處理
1. 使用中文切詞,TF-IDF提取文章關鍵詞
2. 一種簡單的統計方法判斷文章的情感色彩
3. 使用樸素貝葉斯算法判斷文章情感色彩
       在職人員3200元/人,學生2500元/人。含會議注冊費、資料費、場地費。食宿費用自理。
       參與雪晴數據網獎學金計劃,更可以減免大筆學費,只要你足夠勤奮,可以免費學!!
       與會者可申請全國通信和信息技術創新人才培養工程《數據挖掘與分析應用高級工程師》職業技術水平證書,通過考核后即可獲得證書,需另交考試費、證書工本費共400元。
       1. 為雪晴數據網(www.xueqing.tv)投稿的用戶(原創或翻譯文章),可以獲得代金券(按文章質量,獎勵50到200元不等),以抵扣線上線下課程學費,投稿請聯系管理員 contact@xueqing.tv
       2. 參與北理工大數據創新學習中心的活動,表現優秀的學員,有機會免費學習。
       3. 注冊并登錄雪晴數據網,進入用戶中心,然后進入邀請頁面(http://www.xueqing.tv/me/invite ),獲得邀請鏈接后,轉發給好友,如果對方成功注冊,雙方都可獲得獎勵,可抵扣學費。
       4.累計五天(可不連續)轉發本課程通知到自己朋友圈,并附上推薦理由,截圖發給我們的工作人員,報名可優惠200元。
       1. 現場班老學員8折優惠
       2. 三人以上同時報名9折優惠
       3. 五人以上同時報名8折優惠
       請填寫表格后于5月26日前,發送“報名回執表(邀請函中的附件2)+支付截圖”至郵箱:peixun@uone-tech.cn或傳真至(010)56451128,郵件或傳真主題為:“Python20170602北京培訓+姓名+單位”。
方式一: 對公轉賬
       開戶名 繪辰科技(北京)有限公司
       開戶銀行 中國工商銀行股份公司北京大鐘寺東路支行
       賬號 0200151609100034763
方式二: 支付寶
       賬號 pay@xueqingtv.com
       戶名 繪辰科技(北京)有限公司
方式三: 現場繳費
       外地學員請于1號提前報到,北京學員可于2號早上8點~8點半報到,繳費并領取發票和紙質邀請函,以及上課教材。
       由于2號早上現場人比較多,鼓勵北京學員也于1號報到。
       問:是否能開正規發票?
       —— 答:我們是正規公司,可以開具增值稅普通發票和增值稅專用發票,用戶根據需要來選擇發票類型。
       問:我是高校老師,是否可以到現場刷公務卡?
       —— 答:可以,我們有POS機,可以打印小票。
       問:我是小白,完全不會編程,可以報名參加嗎?
       —— 答:你可以先看看我們網站的視頻課程入個門,再決定是否報名,另外,希望你有大學數學的基礎,否則會很吃力。
       問:是否提供紙質版會議邀請函?
       —— 答:提供,請與我們的工作人員聯系。
聯系人:陳潔老師
手機/微信:136-6072-3699
QQ :529698127       驗證信息請填寫友萬科技Python培訓
Email:peixun@uone-tech.cn
相關新聞鏈接:
Python爬蟲技術與機器學習實戰研討會(雪晴數據網)
                         Python爬蟲技術與機器學習實戰研討會邀請函+報名表下載
北京友萬信息科技有限公司,英文全稱:Beijing Uone Info&Tech Co.,Ltd ( Uone-Tech )是中國大陸領先的教育和科學軟件分銷商,已在中國300多所高校建立了可靠的分銷渠道。擁有最成功的教學資源和數據管理專家。如需申請軟件采購及老版本更新升級請聯系我們,咨詢熱線:010-56548231 ,咨詢郵箱:info@uone-tech.cn 感謝您的支持與關注。