Duckduckgo仍不好用,乾脆自架元搜尋引擎,保障隱私和自由

Ivon Huang
·
(edited)
·
IPFS
·
如果搜尋引擎被迫要使用Google,我想還是有點反抗的方法的。

隱私真的重要嗎?如果連討論隱私權的文章都搜尋不到呢?

這個例子尚屬極端,卻是當下Duckduckgo中文使用者正在發生的事情。忽略事實是要不得的心態,灌輸隱私權有多重要,實際上並沒辦法解決使用者的迫切需求,那即是無用之物。

在試過Duckduckgo和Startpage後,還是回去用Google了。

個人意見認為,沒有搜尋引擎能跟Google比肩。不過被迫使用侵犯隱私的Google的時候,還是能有點反抗手段。

現階段,他們還是幹不過Google

Google什麼都找的到,問題是Google會時刻紀錄使用者點擊網頁的行為侵犯隱私,而內容農場問題又讓Google中文搜尋品質下降,此外某些網頁Google也不見得找的到。

那麼換成其他商業公司的搜尋引擎會解決這些問題嗎?否,這邊拿Duckduckgo和Startpage出來講。

首先Duckduckgo英文勉強能用,可中文不好用,搜尋結果會少很多,還容易搜到日文結果。

Duckduckgo稍微複雜一點中文字詞組合搜尋結果就會爆炸

不過他們能搜尋的中文結果較少,所以常常盜文的內容農場在Duckduckgo就很少見到, 這是唯一的優點。


再來Duckduckgo最近的風波讓人不滿,被微軟糾纏一陣子才消滅追蹤器,還有高聲張揚他們會針對俄國媒體調整排序的行為。這裡不討論什麼「Google不給你看的網站」因為那很容易落入陰謀論的論調。拜託,Google還有什麼刻意不給你看的,有比百度自我審查還誇張嗎?因為政治意見不同,就可以封殺對方嗎?不喜歡的內容可以自行封鎖(取消文化這拿手好戲誰玩的最溜?),可這不應該由搜尋引擎來做。這邊有個有趣的審判:德國法院說Google沒有審查內容的義務


最近Duckduckgo又嚴打18+內容,連一般的NSFW、非FBI重點關注的圖片都找不到,只要扯到邊都全部禁絕。Google都沒禁就你開始自我審查?


猜想:2020年以前Duckduckgo還不是很熱門的時候,PTT就有鄉民就在分享好康的關鍵字(暗示有未成年,台灣國內的幼幼廚不要太多),那時Duckduckgo的圖片搜尋宛如十年前Google,什麼都找得到,有牽扯到一點點關係的關鍵字也容易找到裸露內容。另外從當時的搜尋建議來看,中國人也很熱衷找這種好康的內容呢(畢竟是會大喇喇在Twitter上販售將日本AV假戲真做的片子的國家)。約2021年以後鄉民講的圖片關鍵字幾乎都封殺了,Duckduckgo落到了現在這個局面,封過頭了。


有人說Duckdcukgo的Bang!跳轉語法很好用,我幹嘛要多打一句話,如果我只是藉著Duckduckgo幫我跳到Google伺服器的話。

最後是Startpage,沒什麼好說的,它根本就只是代理Google搜尋而已。Startpage背後還是廣告公司在營運的,用這個跟Google不是沒差別嗎。用代理搜尋還給人賺是很蠢的行為,下面提及的Whoogle就屌打了。

再改用其他商業引擎只是換個姿勢餵給他們個人資料而已,所以沒有提的價值。就好像說用Edge能取代Chrome一樣,從一個坑跳到一個坑罷了,資料換家公司保管罷了,LibreWolf/Firefox笑而不語。

遙遠的理想鄉

以隱私當商品已經不是新聞,這年頭連保護隱私都能當商品販賣,而他們的品質都還不像Google那樣好。我在想,人們需要真正去中化的搜尋引擎,必須是開源的不受商業操控不受監管的,目前只有"YaCy"這種P2P搜尋引擎符合條件,還可以自架參與貢獻。

圖片來自維基百科

去中心化的還有"Presearch",搭上了虛擬貨幣熱潮。八卦是Presearch跟Duckduckgo一樣想當色情守門員,所以目前看了不想用。發行貨幣的話或許是營運下去的方式吧,但總有模糊焦點感覺,搜尋賺錢?看影片賺錢?學獅子頭用瀏覽器賺錢?那是重點嗎,好比搜尋種樹希冀能吸引到特定人士一樣。

YaCy其實出來很久了,一般使用者也能輕易安裝。結果是它還是像暗網一樣的存在,因為靠用戶自發貢獻,索引品質不穩定。所以YaCy硬要比的話很難打的過市面上的任何一款商業搜尋引擎。

用一種折衷的方式:自架代理搜尋伺服器

Duckduckgo樹立了新時代網路服務的典範:重視隱私。這是很好的企業理念,但是Duckduckgo仍不夠好,因此仍需參酌其他搜尋引擎方案,而目前Google仍是穩固選擇。

如果被迫要使用Google,我想還是有點反抗的方法的。

在YaCy的技術成熟前,所能做的便是當下流行的代理服務,用保護隱私的「前端」來進行搜尋,並最大化過隱私訊息。像針對Youtube的"Invidious"做的就是這種事情,它專門擷取Youtube上的影片,還你一個乾淨無追蹤的界面。你會覺得看Youtube影片根本不需要Google帳號才對。

這方面技術有"Whoogle"和"SearXNG",他們嚴格來說不是搜尋引擎,只是代理,並無爬蟲。Whoogle就單純是Google搜尋的代理伺服器,界面簡陋。而SearXNG格局大些,它的核心功能是「元搜尋引擎」,會一次搜尋Google、Duckduckgo、Bing等各大引擎,再將結果整理使用者。

圖片搜尋可添加都多個搜尋來源

SearXNG官方文件有列出如何保障使用者隱私,包括盡量減少傳遞給搜尋引擎的參數等,使用者也可以將部份搜尋重新導向到隱私前端網頁,例如Youtube導到Invidious,Reddit導到LibreReddit等。注意使用者的IP仍然會被那些搜尋引擎得知,對此敏感的建議是再串Tor網路。

SearXNG服務不難架設,在自己電腦用Docker架設SearXNG不是什麼難度,再將其整合至電腦、手機瀏覽器的預設搜尋引擎便可,各大搜尋引擎的功能都有了。

SearXNG在手機上的搜尋效果

不想自己架的,在這裡也有很多外國的公共站點,找個信任的下去用用看便知道SearXNG的威力。

SearXNG搜尋回應速度平均約5秒是最大缺點,而且搜尋內容仍很依賴各大搜尋引擎。

另外這種間接存取Google的方法,內容農場問題還是會存在。除了仰賴Google定期自我整頓搜尋品質以外(例如今年說要加強過濾AI生成內容: "More content by people, for people in Search"),我們還是可以自己補強Google搜尋的不足。針對產生垃圾內容的網站,使用uBlacklist或uBlock Origin從搜尋結果移除內容農場便是。

隱私部份,除了仰賴代理的隱私過濾外,還要把瀏覽器換成Firefox/LibreWolf類的完全開源瀏覽器。Chrome和Edge這類商業產品普遍不推薦,至少那些強調隱私的網站都是這麼說的。接著安裝電子前哨基金會研發的Privacy Badger擴充元件,防止網站窺探隱私。搜尋的時候能不登Google帳號就不登入。

這樣大概是實用與隱私之間折衷的選擇。

CC BY-NC-ND 2.0

Like my work? Don't forget to support and clap, let me know that you are with me on the road of creation. Keep this enthusiasm together!

Ivon Huang自由軟體、航空、20世紀歷史愛好者。 這裡記載的東西究竟會成為未來的碎片,在那最果之處,反射出匯集各處思念的光芒。 My Blog: https://ivonblog.com
  • Author
  • More

將suckless.org極簡網頁設計哲學付諸實現

Linux電腦好用的必裝軟體,從文書處理到玩遊戲一次滿足

半回憶錄形式的2022年Matters回顧問卷