[導讀]9月14日,清華大數據思享會之非結構化文本大數據分析的行業應用在清數D-LAB成功舉辦。本次思享會邀請了Stratifyd (目前公司已經拿到了包括騰訊、真格基金等資本共同投資) 創始人汪曉宇分享如何利用大數據智能分析平台,幫助企業級客戶如商業零售、金融、汽車、醫藥等行業,發掘非結構化數據和結構化數據潛在價值。現場三十餘位聽眾到場,就非結構化的數據分析展開了深入的交流和討論。
Stratifyd創始人汪曉宇
汪曉宇老師主要介紹了全球領先的增強智能數據分析平台(augmented intelligence),如何幫助管理層做出決策分析。汪總認為人工智慧的時代,並不是機器替代人類,而是需要人與機器互相合作,發揮出更大的價值。他分享了如何通過人工智慧和深度貝葉斯進行全自動語義分析和聚類分析,並按照業務需求規範文本內容進行數據的篩選和分析來找出最相關的洞見。人在其中是無法取代的,尤其是業務人員,機器通過數據篩選出可能相關的重點辭彙,業務人員根據機器的結果作出反饋,機器通過人的反饋后再次通過機器學習使之後的結果更加準確。汪總接著分享了非結構化文本大數據在金融、零售、汽車、醫藥行業的應用案例。
思享會現場
在思享會的交流討論環節,參會人員結合各自的工作經驗和思考,各自介紹了對非結構化文本大數據的認識與理解,並對行業種存在的問題進行了深入的討論。對大數據分析在不同行業的應用進行了討論。關於如何抓取數據,制定分析框架,數據處理和整合,還有數據聚類分析都需要重點關注。並在情感分析方面,就如何基於詞典和深度學習(Lexicon 和 Deep Learning (RNN))計算得出並根據特定的行業和業務場景調整情感分值進行交流。
部分參會人員合影
本期思享會的圓滿結束要特別感謝Stratifyd創始人汪曉宇的精彩分享以及其他參會朋友積極地交流和探討。思享會是面向清數大數據產業聯盟成員的思想交流平台,定位為小範圍內的深度交流,目標是希望通過思想交流與碰撞促進產業的數據創新,以及大數據與產業和資本的融合,為各參會嘉賓帶來數據創新方面的新靈感。後續思享會的安排,敬請關注公眾號THU數據派(ID:datapi)以及清數D-Lab服務號(Tsingdata)的內容。
校對:辛洪錄
為保證發文質量、樹立口碑,數據派現設立「錯別字基金」,鼓勵讀者積極糾錯。
若您在閱讀文章過程中發現任何錯誤,請在文末留言,或到後台反饋,經小編確認后,數據派將向檢舉讀者發8.8元紅包。
同一位讀者指出同一篇文章多處錯誤,獎金不變。不同讀者指出同一處錯誤,獎勵第一位讀者。
感謝一直以來您的關注和支持,希望您能夠監督數據派產出更加高質的內容。