此为历史版本和 IPFS 入口查阅区,回到作品页
郭偉文 Wyman Kwok
IPFS 指纹 这是什么

作品指纹

【量子科技】量子自然語言處理,QNLP

郭偉文 Wyman Kwok
·
·
「自然語言處理」的技術應用廣泛(如機器翻譯),而「量子自然語言處理」的技術加入了量子理論和量子計算的元素去改進效果,已經到了產品研發的階段,相信會為自然語言處理開闢一片新天地。
圖片來源:https://arxiv.org/pdf/2012.03755.pdf

「自然語言處理」(Natural Language Processing,NLP)的技術應用廣泛(如機器翻譯),影響著我們的日常生活。「量子自然語言處理」(Quantum Natural Language Processing,QNLP)的技術——當中加進了量子理論(Quantum Theory)和量子計算(Quantum Computing)的元素去改進效果——正在快速進步中,已到了產品研發的階段,勢必會為自然語言處理開拓一片新天地。我所說的QNLP技術是由量子科技初創公司Quantinuum所研發,其簡單介紹可參考相關網頁(除非另外說明,下面提到QNLP時,皆是指Quantinuum的QNLP)。

QNLP是怎麼回事呢?是如何與量子理論有關?QNLP的效果又如何呢?為什麼要以量子計算去處理?讓我們很初步地看看這些問題。

要處理自然語言,一個主要問題就是要處理語言意義:某個字是什麼意思?某個片語是什麼意思?某個句子是什麼意思?等等。QNLP用了數學中的「範疇論」(Category Theory)去建構其「組合語意學」(Compositional Semantics),從而分析語言组件的意思。他們用「弦圖」(String Diagram;這些圖背後有豐富、嚴謹的數學意義)去分析語言组件之間的語意關係,例如:

圖片來源:https://arxiv.org/pdf/2012.03755.pdf;Section 2.2

那麼與量子理論有什麼關係呢?據說(這裡Section 3.2),這樣以範疇論所建立的語言架構,和以範疇論所重構的量子力學,擁有共同的「Interaction Logic」,故此量子論的理論架構可以「某程度」應用於語意合成。在QNLP中,以上「Alice hates Bob」句子意思的合成便是按照以下算式:

圖片來源:https://arxiv.org/pdf/2012.03755.pdf;Section 2.2

懂得量子力學的讀者應該可以從中看到量子論的一些輪廓。

合理的疑問是,這樣應用了量子論的自然語言處理真的可行嗎?成效如何呢?據說(這裡Section 3.3),測試的結果是優秀的,為此進路打下了強心針。然而,這些測試其實是在經典電腦(即一直沿用的電腦,而非量子電腦)中進行的,致使測試只能局限於某程度複雜性的語言分析中,因為隨著要處理的複雜性的增加,QNLP理論的計算量是以指數(exponential)遞增的,是經典電腦所無法有效處理的。所以,QNLP中的Q其實有雙重意義:一是涉及自然語言的量子模型,二是適宜在量子電腦中處理。

由於量子電腦技術還遠遠未成熟,QNLP暫時未能在大型的量子電腦中執行,而現在是Noisy Intermediate-Scale Quantum(NISQ;意思大概是計算時維持量子態的技術遠未成熟,以致計算錯誤較多,未達高標準,而可用的量子位元(Qubit;量子計算的基本單位)的數目只達intermediate scale,即50至數百個)的年代,QNLP可以並且已經在NISQ機器中進行測試,結果被形容為有意思和成功(可參考這裡這裡)。

要進行剛提到的測試,當然涉及非常複雜的理論和技術問題,比如牽涉到以下轉換:

圖片來源:https://arxiv.org/pdf/2012.03755.pdf;Abstract
圖片來源:https://arxiv.org/pdf/2107.06776.pdf;此圖與上圖的右方有些少差別,但相信亦有參考價值

即要把該弦圖的量子語言分析轉換為一個可供測試用的「量子線路」(Quantum Circuit;即量子電腦運作的邏輯線路,類似於經典電腦運作的邏輯線路)。為了應付此等複雜問題,不少工具被發明了,如「ZX-calculus」。

最後值得一提的是,QNLP的研發者相信,QNLP背後是一套應用範圍更廣的的理念和進路——「組合智能」(Compositional Intelligence),可以用來處理更多的人類智能現象,如認知音樂

CC BY-NC-ND 2.0 授权