庖丁科技首席科學家羅平:智能金融不只風控,語義理解才是真正的皇冠
于傳統金融領域而言,智能金融的領域還有待開拓與發掘,畢竟智能對于傳統金融的轉型升級是全方面的。
智能金融風起。迎向風口,大膽創業者以期成為下個獨角獸。
在獨角金融與中央財經大學發布的《2017中國智能金融產業發展報告》中,已經提到,金融被認為是人工智能落地最快的行業之一,智能金融也已經列入國家規劃。
然而,智能金融的項目,還多集中在互聯網金融領域,甚至根植在網貸這一垂直業務中。于傳統金融領域而言,智能金融的領域還有待開拓與發掘,畢竟智能對于傳統金融的轉型升級是全方面的。
比如,“讀懂”金融文檔就是細分領域一個難啃的骨頭。智能理解文檔甚至表格、圖表,對于智能技術的精度提出了挑戰。
庖丁科技這家創業公司迎難而上,想要從這一項目切入,幫助金融從業者提升工作效率,提升金融業的生產力。
羅平講述,最開始的創業構想,是庖丁科技的另一位創始人林得苗從身邊在投行工作的朋友所講述的工作痛點中想到的。在投行工作中,會有大量處理金融文檔的基礎工作,工作繁瑣,效率低,還很容易出錯。他們就想到,能不能用智能技術來讀懂文檔。
作為庖丁科技首席科學家的羅平,同時還是中科院計算所研究員、微信人工智能科學顧問,是AI技術大拿。但是于他而言,讀懂金融文檔,還是個不小的挑戰。
目前庖丁科技的主要核心技術是富格式文檔的語義理解(Semantic Extraction from Richly Formatted Data),其中大致包括兩部分的技術內容,一是Language semantic extraction(語言語義提?。荰able semantic extraction(表格語義提取)。
金融文檔是典型的富格式文檔,這類文檔的復雜性主要體現在如下三個方面:
1.表現形式復雜。文檔中的文本,除了沿襲傳統書籍中段落篇章形式以外,還往往摻雜有表格化、圖片化文本。在金融文檔中,蘊含的重要信息往往以無邊框表格的形式表現出來的。針對這類非扁平化數據進行有效的知識抽取和分析,是當前學界研究的難點和熱點之一。
2. 數據構成復雜。文本中的有效知識,除了蘊含在無線框表格中,其余部分是以自然語言的形式蘊含在文檔的字里行間。這些重要的知識型數據,以非結構化的形式保存,不利于計算機處理——傳統的算法只擅長處理結構化數據(鍵值對、詞袋等)。要處理這類非結構化數據,需要相關的自然語言語義提取算法,搭建原始數據到結構化數據之間的橋梁。
3. 信息渠道來源復雜。對于同一個實體或事件,人們往往可以從多個不同的來源找到描述它的文檔。這要求模型有能力從有矛盾數據、有噪音數據、有偽造數據的信道中辨別出真實的、可用的、有價值的信息,抽取其中的知識并形成分析報告和相應的知識圖譜。
羅平說,想要達到足夠的精度,需要利用有監督的深度學習方法,結合大量的標注數據去完成一套算法的訓練。
表格語義提取是庖丁科技的殺手锏,一般的表格是結構化的,但是很多財報里的表格并沒有邊框,計算機就無法讀懂。
羅平和團隊成員,通過技術,自動給沒有邊框的表格加上邊框,從而將非結構化的數據結構化。
整體而言,羅平和團隊所做的是,對富格式文本的語義理解和知識發現,讓計算機能夠讀懂其中的邏輯。這類問題,學術圈已經關注了很多年,但是由于精度問題,產品化的成功案例并不多。最后的這一步,需要算法、數據、工程化三方面的深厚積累。
作為AI專家,羅平對于當下的智能金融也有深入思考。以他的資歷看,中國的智能金融還需要更務實一些。
目前智能金融在風控領域的應用較多,利用大數據,金融機構,尤其是互聯網金融的風控水平已顯著提升。羅平也參與過相關項目,并大獲成功。但他認為,與智能風控相比,智能技術支持的語義理解才是皇冠。
羅平希望,有更多人,可以關注他們團隊所做的事兒。
“這是歷史性工作。”他很自豪,目前工作的價值,是讓金融工作者親身體驗到世界前沿技術。
小小文檔,讀懂不易。羅平和他的團隊,還在努力著,沖擊著全球最高水平。
DJ=獨角金融 L=羅平
DJ:為什么公司產品會從to C 轉向to B?
L:盡管AI概念很火,但是AI在大眾推廣存在兩個特性——一是實際落地產品少;二是深度應用場景少。
我們早期推出的測試級產品,其目的主要為培育市場,解決上述兩問題,B端客戶也是由每個個體組成,C端試用為專業化的B端場景提供了認知基礎。
DJ:公司的競爭壁壘在哪里?
L:世界最前沿技術是現在參與賽道的必備條件,技術日趨成熟,深挖垂直領域應用才是未來的壁壘。我們從一開始便深耕細分垂直實際應用,建立了領先于業界的競爭壁壘。
DJ:目前是否有對標的企業?
L:目前,國內還沒有一家人工智能公司,集Fintech 金融科技/Business Intelligence (BI 商務智能)/Data Asset Management platform (DAM 數據分析管理平臺)于一體的對標公司。美國的Palantir 公司更符合我們的模式。另外,斯坦福的教授Christopher Ré創辦的公司Lattice(已被Apple收購),在核心技術層面上與我們心心相惜。
DJ:企業在2018年有哪些計劃?
L:我們認為2017年是中國智能金融元年,我們作為首批AI+金融垂直領域公司參與開創了將AI技術落地于我國金融市場的歷史性工作,為金融從業者提供了親身體驗世界前沿技術的真實場景。
今年,隨著國家對智能監管的持續重視,我們將繼續深挖金融領域的變革性智能需求,大力發展更多應用領域,將技術延伸至銀行/券商/基金/保險/信托/期貨等各類依賴數據進行決策的金融細分領域。比如,智能關聯,智能因果,智能推理,智能撰寫等。我們會在二季度初公布公司的詳細計劃。
風險提示:
本網站內用戶發表的所有信息(包括但不限于文字、視頻、音頻、數據及圖表)僅代表個人觀點,僅供參考,與本網站立場無關,不構成任何投資建議,市場有風險,選擇需謹慎,據此操作風險自擔。
版權聲明:
此文為原作者或媒體授權發表于野馬財經網,且已標注作者及來源。如需轉載,請聯系原作者或媒體獲取授權。
本網站轉載的屬于第三方的信息,并不代表本網站觀點及對其真實性負責。如其他媒體、網站或個人擅自轉載使用,請自負相關法律責任。如對本文內容有異議,請聯系:contact@yemamedia.com