此为历史版本和 IPFS 入口查阅区,回到作品页
馬克解讀金融科技
IPFS 指纹 这是什么

作品指纹

Numer.ai:基於人工智慧的避險基金公司?

馬克解讀金融科技
·
·


你知道什麼是避險基金(Hedge fund)嗎?經過幾十年的演變,避險基金已失去其初始的風險對沖的內涵,而是基於最新的投資理論和極其複雜的金融市場操作技巧,充分利用各種金融衍生產品的槓桿效用,承擔高風險,追求高收益的投資模式,簡單來說就是沒有任何規則限制的基金。

然而,有太多避險基金都是秘密進行,結果是無止盡的重複研究,這種缺乏原創性且沒有靈感的表現讓擁有交易信號的人因為高進入障礙而被阻隔在外。為了消除這個痛點,理查.克雷布(Richard Craib)創立了 Numer.ai,這是一間結合人工智慧和群眾外包的新型避險基金公司,將股市的數據進行加密後轉為單純的數字,並開放給上萬名匿名資料科學家。他們可以根據預測結果的回報獲得適當的獎勵, Numer.ai 也能從中集合適當的預測然後投到真實的市場上營利,是個互利的網站。現在就一起來看看這間公司如何操作這些預測分析、擁有那些特色吧!



公司介紹

Numer.ai 成立於2015年,位於美國舊金山,是間基於人工智慧的群眾外包避險基金公司,結合了機器學習、數據科學競賽、群眾外包、密碼貨幣等概念。Numer.ai 將股市數據加密後轉為單純的數字,它們是乾淨、被規範且能立即使用的。這些金融數據集被用來構建機器學習模型以預測股票市場的地方。Numer.ai 會將預測結果整合成一個元模型,然後投放到真實的交易市場上營利。不過由於數據經過加密,所以外界並不知道這份資料是用於打擊恐怖份子、還是預測Google 下個月的股價。

Numer.ai 的創辦人理查.克雷布(Richard Craib)曾疑惑在科技產業中,不同人貢獻不同資源,一起合作打造一個互利的網路而非互相競爭,那麼金融產業為何不能也這樣呢?於是創立了這間公司。他們稱自己是地球上最困難的數據科學錦標賽,目前已累積5599個模型,支付給數據科學家的金額也超過兩千萬美金。

*群眾外包:是指企業或組織透過網路向大眾(非特定人士)取得企業所需的創新點子或是解決方案。

產品內容

Numer.ai 有兩個主要的比賽,分別是數據科學錦標賽和數位信號,後者是為更「高級」的用戶準備的。詳細介紹如下:

1.數據科學錦標賽(Data Science Tournament)

運作模式:

Numer.ai 提供了一個龐大的訓練數據集,每週也都會發布一批新的數據,世界各地的數據科學家和工程師都可以免費下載使用,訓練相應的機器學習模型,這些模型能夠預測相同格式的數據。將模型預測值提交至官網後,Numer.ai 會選擇最優秀、最具原創性、最穩定的若干個預測,將其整合為最終的交易策略,並投入到現實的交易市場中。根據這些預測在現實生活中的表現,Numer.ai 會給予用戶相應的報酬,以美元和 Numeraire(Numer.ai 所創建的代幣)的形式給出。傳統的機器學習競賽中,只有前三名才能獲得獎金,但在這裡只要符合上榜的標準,就有希望獲得或多或少的獎金。

比賽分為幾輪,從每個禮拜週六、週二、週三、週四和週五開始。每輪在一個月內經過 4 個階段,之後會得到兩個主要的分數,預測與目標相關程度的「相關分數」和預測對避險基金回報的貢獻的「真正貢獻分數」。

數據混淆:

上圖為Numer.ai 的混淆數據集,每行代表特定時間點的股票,其中id 是股票ID,era是日期,feature描述了當時股票的已知屬性(例如本益比),target 代表未來回報的衡量標準(例如20天後)。Numer.ai 提供的數據都是被混淆過的,這意味著我們不知道它代表什麼!即使每一行代表股票市場證券,數據科學家也無法發現它們代表哪些現實世界的股票。為什麼要將數據的所有資訊都隱藏呢?主要原因是高品質的財務數據非常昂貴,而且由於許可證的限制,Numer.ai 不能免費提供,但如果數據被混淆,以至於無法分辨是什麼股票或特徵,這樣就可以自由地提供數據。


入選標準與排行榜:

只要上榜,這個預測就會影響Numer.ai 最終的交易策略,為用戶帶來收入,但如果想要榜上有名,提交的預測必須通過協調性、一致性和原創性的檢驗。而原創性檢驗的存在,一方面阻止了部分用戶註冊多個帳戶、提交幾乎完全相同的預測,以圖獲利的作弊行為,另一方面則避免了 Numer.ai 發放冤望錢。錦標賽有兩個排行榜,普通提交和下注提交。兩者都會顯示預測的 logloss,也就是針對二分法問題的對數損失函數,logloss 越低則模型的預測力越強。而logloss 是由Validation 部分的數據決定,和測試環境與真實環境的表現無關,所以在排行榜上排名高不代表最終收入高。

2.數位信號(Digital Signal)

這是比數據科學錦標賽更困難的比賽。數位信號讓用戶上傳股票市場信號,並了解它們與 Numer.ai 上所有其他信號相比的原創性程度。信號適用於那些可以訪問或可以獲取自己數據的參與者,對大多數用戶來說將更加困難。這裡的股票市場信號會像是本益比、股息收益率、信用卡交易、社交媒體情緒等等。雖然用於生成這些信號的基礎數據可能非常不同,但每個股票代碼清單都有一個相關的數值。Numer.ai Signals 股票市場領域涵蓋了大約全球前5000隻最大的股票。每周都會更新。

運作模式:

用戶登入後將信號通過Numer.ai 的 API 上傳到 Numer.ai ,並進行信號歷史部分的性能、風險和盈利能力診斷。提交預測後會排隊等待診斷,這些診斷可作為評估信號是否足夠好以至於值得押注的指標。不過在歷史驗證期內具有出色特質的信號,不代表現在或未來也能獲得這麼高的評價。另外用戶可以對自己提交的信號進行押注,並根據相對於Numer.ai 自定義信號的表現來賺取獎勵或損失賭注,透過這項機制來確保信號在真實交易環境的準確度。

產品特色

作為既可以獲得報酬又能以低成本來訓練自己機器學習技術的Numerai ,在隱私權、數據的完整性和錦標賽執行的方法都有很突出的表現。

1.去中心化:

相較於一般的避險基金公司,Numer.ai 最大的特徵是去中心化。雖然公司的管理人員不超過10個,但它吸引了來自世界各國的數萬個用戶,他們不算是Numer.ai 的正式雇員,他們提供預測結果以換取Numer.ai 的獎勵。

2.完全匿名:

在Numer.ai,用戶完全匿名,除了一個郵件和暱稱外不需要提供任何其他個人訊息。而且為了保證的公正交易,Numer.ai的獎勵都是由自己的貨幣發放,而不是現金轉帳。與另一個較為成功的群眾外包在線交易平台Quantopian 不同,Numer.ai 的用戶擁有自己機器學習模型的全部智產權,用戶不需提供模型及程式碼,僅需上傳預測結果即可。這也意味著,用戶在訓練模型時,可以使用所有能取得的資源,時間也由自己分配。用戶使用的機器學習工具也不再受限於 Python 和R 語言。

3.大量且完整的數據集:

對於個人而言,及時收集完整的市場數據既耗時耗力又必須投入大量的資金。Numer.ai 提供大量、完整且多種形式的數據集。在官網上下載的數據除了常見的 Python 和 R 語言模型,還包括CSV 提交文件的範例、用戶需要預測的比賽數據和以用於擬合機器學習模型的訓練數據。

4. 自己的幣 Numeraire:

在一般數據競賽中,為了取得更高的獎勵,選手們會不斷提交新的預測,並根據公開排行榜上的排名調整自己的模型,這樣使得模型在公開排行榜上「過擬合(Overfitting)」。這種作法雖然能在比賽中獲得更高的名次和獎金,但無法提供一個實用的預測模型,一旦遇到新的數據,誤差就會高得離譜。因此Numer.ai 發明了自己的加密貨幣Numeraire,公開排行榜上的名次可以為用戶帶來Numeraire,但不會發放真實的現金。而且選手需要用Numeraire 對自己的預測進行下注,下注越多,損失的風險就越大,因此為了最大化利益,用戶們沒有「過擬合」公開排行榜的動機。

5.獎懲機制:

為了避免用戶為了取得更多獎勵而故意讓演算法符合用來分析的數據,以在測試時能獲得好成績,但在真正的股票市場上表現並不好;和避免大家為了排名互相競爭而非一起進步的情況,Numer.ai 發明了一種獎懲機制。再提交預測回報時要下注Numeraire 才能獲得獎勵,否則不會有任何收入。如果對自己的預測結果很有信心,可以多押注一點,若最後得分高則可以按押注比例獲得獎勵,並贖回代幣,但如果預測結果不好,則會失去那些賭注。Numer.ai 稱失去賭注為「燃燒」。這種有得有失的機制,成功解決上述的問題,同時也鼓勵了用戶間的合作,當整體模型表現越好,基金成長越快,分紅的基數也就越多,大家會更有動機網羅人才加入分析數據領域。

近況更新

根據Numer.ai 的官方Twitter,宣布為 AI 避險基金籌集了1億美元。創辦人Richard 表示 Numerai 得到了Renaissance Technologies(一家專門使用來自數學和統計分析的定量模型進行系統交易的避險基金公司)前高管Howard Morgan的支持,在獲得一筆捐贈基金和美國多重經理人的新撥款後,Numerai 目前管理著近3億美元的全部資金。除此之外,最近還從Union Square Ventures(一家風險投資公司)等投資者那裡籌集了1000萬美元。

馬克碎念

金融數據的價值在AI 的助攻之下正持續地放大價值,尤其在投資領域的應用,讓許多機構公司都投入大量資源研究。Numer.ai 的模式可以群聚相關專業領域的人士加入,所以社群的建構與維護也相對重要,雖然可以透過代幣的獎懲機制來吸引人才,但從初期要建立一定規模起來,還是需要相當多資源與努力。

過去群眾外包的優點就是集合大量的人力、比專家還便宜的價格、多樣性的想法、跨時區的服務,但仰賴好的設計才能讓一群人貢獻出最大的效力,否則只會變成一群烏合之眾。馬克認為未來資料價值探索的領域應該會有更多相關的應用會產生,大家可以持續關注這個議題。

CC BY-NC-ND 2.0 授权