Duckduckgo仍不好用,乾脆自架元搜尋引擎,保障隱私和自由
隱私真的重要嗎?如果連討論隱私權的文章都搜尋不到呢?
這個例子尚屬極端,卻是當下Duckduckgo中文使用者正在發生的事情。忽略事實是要不得的心態,灌輸隱私權有多重要,實際上並沒辦法解決使用者的迫切需求,那即是無用之物。
在試過Duckduckgo和Startpage後,還是回去用Google了。
個人意見認為,沒有搜尋引擎能跟Google比肩。不過被迫使用侵犯隱私的Google的時候,還是能有點反抗手段。
現階段,他們還是幹不過Google
Google什麼都找的到,問題是Google會時刻紀錄使用者點擊網頁的行為侵犯隱私,而內容農場問題又讓Google中文搜尋品質下降,此外某些網頁Google也不見得找的到。
那麼換成其他商業公司的搜尋引擎會解決這些問題嗎?否,這邊拿Duckduckgo和Startpage出來講。
首先Duckduckgo英文勉強能用,可中文不好用,搜尋結果會少很多,還容易搜到日文結果。
不過他們能搜尋的中文結果較少,所以常常盜文的內容農場在Duckduckgo就很少見到, 這是唯一的優點。
再來Duckduckgo最近的風波讓人不滿,被微軟糾纏一陣子才消滅追蹤器,還有高聲張揚他們會針對俄國媒體調整排序的行為。這裡不討論什麼「Google不給你看的網站」因為那很容易落入陰謀論的論調。拜託,Google還有什麼刻意不給你看的,有比百度自我審查還誇張嗎?因為政治意見不同,就可以封殺對方嗎?不喜歡的內容可以自行封鎖(取消文化這拿手好戲誰玩的最溜?),可這不應該由搜尋引擎來做。這邊有個有趣的審判:德國法院說Google沒有審查內容的義務。
最近Duckduckgo又嚴打18+內容,連一般的NSFW、非FBI重點關注的圖片都找不到,只要扯到邊都全部禁絕。Google都沒禁就你開始自我審查?
猜想:2020年以前Duckduckgo還不是很熱門的時候,PTT就有鄉民就在分享好康的關鍵字(暗示有未成年,台灣國內的幼幼廚不要太多),那時Duckduckgo的圖片搜尋宛如十年前Google,什麼都找得到,有牽扯到一點點關係的關鍵字也容易找到裸露內容。另外從當時的搜尋建議來看,中國人也很熱衷找這種好康的內容呢(畢竟是會大喇喇在Twitter上販售將日本AV假戲真做的片子的國家)。約2021年以後鄉民講的圖片關鍵字幾乎都封殺了,Duckduckgo落到了現在這個局面,封過頭了。
有人說Duckdcukgo的Bang!跳轉語法很好用,我幹嘛要多打一句話,如果我只是藉著Duckduckgo幫我跳到Google伺服器的話。
最後是Startpage,沒什麼好說的,它根本就只是代理Google搜尋而已。Startpage背後還是廣告公司在營運的,用這個跟Google不是沒差別嗎。用代理搜尋還給人賺是很蠢的行為,下面提及的Whoogle就屌打了。
再改用其他商業引擎只是換個姿勢餵給他們個人資料而已,所以沒有提的價值。就好像說用Edge能取代Chrome一樣,從一個坑跳到一個坑罷了,資料換家公司保管罷了,LibreWolf/Firefox笑而不語。
遙遠的理想鄉
以隱私當商品已經不是新聞,這年頭連保護隱私都能當商品販賣,而他們的品質都還不像Google那樣好。我在想,人們需要真正去中化的搜尋引擎,必須是開源的不受商業操控不受監管的,目前只有"YaCy"這種P2P搜尋引擎符合條件,還可以自架參與貢獻。
去中心化的還有"Presearch",搭上了虛擬貨幣熱潮。八卦是Presearch跟Duckduckgo一樣想當色情守門員,所以目前看了不想用。發行貨幣的話或許是營運下去的方式吧,但總有模糊焦點感覺,搜尋賺錢?看影片賺錢?學獅子頭用瀏覽器賺錢?那是重點嗎,好比搜尋種樹希冀能吸引到特定人士一樣。
YaCy其實出來很久了,一般使用者也能輕易安裝。結果是它還是像暗網一樣的存在,因為靠用戶自發貢獻,索引品質不穩定。所以YaCy硬要比的話很難打的過市面上的任何一款商業搜尋引擎。
用一種折衷的方式:自架代理搜尋伺服器
Duckduckgo樹立了新時代網路服務的典範:重視隱私。這是很好的企業理念,但是Duckduckgo仍不夠好,因此仍需參酌其他搜尋引擎方案,而目前Google仍是穩固選擇。
如果被迫要使用Google,我想還是有點反抗的方法的。
在YaCy的技術成熟前,所能做的便是當下流行的代理服務,用保護隱私的「前端」來進行搜尋,並最大化過隱私訊息。像針對Youtube的"Invidious"做的就是這種事情,它專門擷取Youtube上的影片,還你一個乾淨無追蹤的界面。你會覺得看Youtube影片根本不需要Google帳號才對。
這方面技術有"Whoogle"和"SearXNG",他們嚴格來說不是搜尋引擎,只是代理,並無爬蟲。Whoogle就單純是Google搜尋的代理伺服器,界面簡陋。而SearXNG格局大些,它的核心功能是「元搜尋引擎」,會一次搜尋Google、Duckduckgo、Bing等各大引擎,再將結果整理使用者。
SearXNG官方文件有列出如何保障使用者隱私,包括盡量減少傳遞給搜尋引擎的參數等,使用者也可以將部份搜尋重新導向到隱私前端網頁,例如Youtube導到Invidious,Reddit導到LibreReddit等。注意使用者的IP仍然會被那些搜尋引擎得知,對此敏感的建議是再串Tor網路。
SearXNG服務不難架設,在自己電腦用Docker架設SearXNG不是什麼難度,再將其整合至電腦、手機瀏覽器的預設搜尋引擎便可,各大搜尋引擎的功能都有了。
不想自己架的,在這裡也有很多外國的公共站點,找個信任的下去用用看便知道SearXNG的威力。
SearXNG搜尋回應速度平均約5秒是最大缺點,而且搜尋內容仍很依賴各大搜尋引擎。
另外這種間接存取Google的方法,內容農場問題還是會存在。除了仰賴Google定期自我整頓搜尋品質以外(例如今年說要加強過濾AI生成內容: "More content by people, for people in Search"),我們還是可以自己補強Google搜尋的不足。針對產生垃圾內容的網站,使用uBlacklist或uBlock Origin從搜尋結果移除內容農場便是。
隱私部份,除了仰賴代理的隱私過濾外,還要把瀏覽器換成Firefox/LibreWolf類的完全開源瀏覽器。Chrome和Edge這類商業產品普遍不推薦,至少那些強調隱私的網站都是這麼說的。接著安裝電子前哨基金會研發的Privacy Badger擴充元件,防止網站窺探隱私。搜尋的時候能不登Google帳號就不登入。
這樣大概是實用與隱私之間折衷的選擇。