和GPT語音聊天:錄播客節目的實驗記錄
我一直在探索普通人通過創作來構建個人概念的途徑。其中,我覺得語音對談是門檻最低的途徑之一。我的第一本書就是關於這個主題,叫做《人人都是播客》。 GPT出來之後,日日工業革命,夜夜文藝復興的節奏,也讓我對未來充滿好奇。
用語音和GPT互動
大模型技術有關的信息,天天都看到非常強大的目錄,開源的技術探索,應用場景層出不窮,在這些新鮮事物中,我們想像未來各種科幻的、夢幻的、快樂的、或者恐懼的可能。
前期探索很多場景是實驗性的,未來哪些應用場景真的能改變我們的生活目前還不清晰。很多人都在討論作圖、還有文字符號的應用,但我個人最感性的,還是和語音互動有關。還是那個課題:普通人如何通過創作,構建個人概念;而語音對談交流,是門檻最低的途徑之一。
為此,當我發現有語音相關的GPT應用,就開始去嘗試了。
SpeechGPT & Call Annie
我自己測試了2個相關的語音互動的GPT應用,分別是SpeechGPT和Call Annie。
Call Annie來自國外的開發者Chris Frantz,能讓你直接與ChatGPT 開啟視頻聊天。 SpeechGPT來自github上的用戶hahahumble,是一個開源網絡應用程序,使用Azure 語音服務來做語音識別和語音合成,可讓用戶與ChatGPT 交談。
這兩個應用都還不能發出中文的語音,我只能跟它英文對話。無論是SpeechGPT還是AnnieGPT,他們的理解和總結能力很好,雖然我英語磕磕巴巴,但覺得它完全能get到我的點,語音直接交流沒有障礙。多幾個來回,結合prompt指令,能激發出有質量的對話。
SpeechGPT的交互是文字和語音同步進行,可以同時看到語音轉成文字以及文字轉成語音。但語音比較機械,幾乎沒有感情,比較難有對話的代入感。 Annie有一個比較接近自然人的人設,有形象,有表情,語音帶有情感,所以對話會比較有代入感。但是沒有相應的文字。
播客錄製場景和角色設定
無論是文字還是語音,和GPT交流,都最好做詳細的場景和角色設定,來保證交流的內容有針對性,有真實與自然的互動體驗。也就是,更像一個真實的人。
我選了一個語音交流的典型場景,播客錄製來和GPT進行對話。正好這也是我熟悉的內容領域。我設置的場景是:GPT是主持人,我是嘉賓,它來採訪我。我最近寫了一本書名字叫《人人都是播客》,我們對談的主題就是圍繞這本書展開。
在SpeechGPT裡,我假設它是知名主持人奧普拉,我在和Call Annie的對話裡,乾脆幫她編了一個角色,她是Annie,她有一檔播客叫《good reader》,節目的定位就是分享好的新書等等。
具體的prompt包括:
1. 角色設定:你是主播xx,你的節目是xx,我是你的嘉賓,我寫了一本新書,請你來採訪我。
2. 流程設定:請做一個節目的開場;請結束今天的節目。
3. 請它問我相關問題。例如:
- 請問我關於這本書的問題。
- 請再問我一個問題。
- 你怎麼看《人人都都是播客》?
4. 我向它發起相關問題。例如:
- 你覺得人在人工智能時代,創作的意義是什麼?
- 你喜歡的播客節目是什麼?
在讓對方給我提問的時候,她提的問題還是挺實用的,比如她問我為什麼會寫這本書?你最希望讀者從中獲得什麼?
她還會基於我的回答,我講述的經歷繼續提問,例如我說我曾經在一家音頻公司服務創作很多年,知道他們會遇到很多困難,我知道這些問題可以怎樣去解決。她接著就會說覺得我這段工作經歷很有意思,問我覺得新手做播客會遇到的困難是什麼?
在對話的過程中,除了回答問題本身,滿足我的要求本身,GPT會禮貌且溫情地對我們聊的內容進行總結,互相聊反饋和感受。這是體驗非常好的地方。 GPT有很強的共情能力,能讓人有“被聽見”和“被看見”的治愈體驗。
未來的想像
這是剛開始的體驗和嘗試,但其實可以探索的角色還很多。例如她可以成為你的英語口語教練,教給你練習英語的場景,例如閱讀、電影、生活等等。跟我交流。並且指出我在回答過程中,哪些用詞和用法,可以換成更好的詞,並告訴我原因,給我一個練習案例,去優化自己的表達。
它還可以成為你的life coach。你把你在生活或者個人職業發展中遇到的問題跟她傾訴,告訴她你的情況,感受和困惑,看他會給你什麼樣的答案,或者你可以讓她問你一些關鍵問題,是不是有些問題的角度在你的認知之外,然後真的啟發到了你,能幫助你做出一些突破。
有興趣也去嘗試一下體驗下吧。
我把這兩期節目都放在自己的實驗播客專輯《四季沙龍》裡了,可以通過喜馬拉雅、小宇宙還有蘋果播客app訂閱收聽,體驗我和GPT對話的效果。
喜歡我的作品嗎?別忘了給予支持與讚賞,讓我知道在創作的路上有你陪伴,一起延續這份熱忱!