Zero to Hero - 用 Transduce 提升程式的效能
從一個簡單的問題開始
假設我們目前有一組長度為一百萬的陣列,需要將陣列內的每個數值乘三並且只保留偶數,那我們會如何實作這簡單的問題?
根據上面的問題,我們在實作前需要準備
#1 長度為一百萬的陣列
const makeArr = (randomCeil) => (len) => Array.from({ length: len }, (v, i) => Math.floor(Math.random() * randomCeil)); const arrOfMillion = makeArr(100)(1e6);
#2 將每個數值乘三的函式
const tripleIt = (num) => num * 3;
#3 只保留偶數的函式
const isEven = (num) => num % 2 === 0;
接來開始想實作方式吧!
在不認識 Transduce 以前
在我還不認識 Transduce 這個概念前,馬上想到的方法可能就是用
#1 Array.prototype.map
與 Array.prototype.filter
const result = arrOfMillion.map(tripleIt).filter(isEven);
#2 或是 forEach
const result = []; arrOfMillion.forEach((item) => {const tripleItem = tripleIt(item); if (isEven(tripleItem)) {result.push(tripleItem);} });
雖然這兩種方法都可以解決問題,但各自都有優缺點:
第一種方法
- 優點: 可讀性佳。
- 缺點: 執行速度慢。(由於會讓陣列跑了兩次迴圈。
map
,filter
都會各跑一次,最壞的時間複雜度可能是 O(n) + O(n),用更直覺一點的想,跑了兩次當然會拖慢程式的效能。)
第二種方法
- 優點: 執行速度快。(只需要跑一次迴圈)
- 缺點: 可讀性差,且不容易進行復用。
那有沒有一個解決方法是可以擁有第一種方法的可讀性,且程式的執行速度跟第二種方式一樣快!
Tranduce 就是集結了兩方法優點的概念。 其是一個比較進階的概念,筆者也是理解與消化了許久才了解其中的奧秘,接下來我們就一步一步探索著個有趣的概念吧!
如何使用 Transduce
與其先知道是如何實作,不如從如何使用開始,接下來使用的範例是使用 Ramda 提供的 tranduce
函式去解決一開始提到的問題。
Ramda 的 transduce
共需要放入四個參數
transducer
: compose 一個或多個 transformer 函式reducer
: 為一個函式須傳入 accumulator 跟 currentValue, 並將 currentValue 累加到 accumulator 的運算函式。initialValue
: 初始值。data
: 想要進行處理的資料。
const R = require('ramda'); const transducer = R.compose(R.filter(isEven), R.map(tripleIt)); const reducer = (acc, val) => (acc.push(val), acc); // same as (acc, val) => { acc.push(val); return acc } const result = R.transduce(transducer, reducer, [], arrOfMillion);
很清楚地可以看到,程式碼可讀性與第一種方法相差不遠。但如何去評測其是否也擁有第二種方法的效能?
效能評比
簡易的效能比較的程式
const timer = (marked, fn) => { console.time(marked);fn();console.timeEnd(marked); };
大家應該已經發現,用 transduce 這個概念不但可以兼顧鏈式寫法的可讀性,也可以具有比 imperative (forEach
) 寫法更好的效能,更不用說是本身就自帶 FP 的可複用性。
Transduce 這個概念到底是如何實作的!!
其實 Transduce 就是一個不斷抽象化的過程,而筆者整理出了其抽象化的四個步驟,但在解釋這四個步驟前,我們需要知道一些名詞
名詞解釋
reducer 為一個函式須傳入 accumulator 跟 currentValue, 並將 currentValue 累加到 accumulator 的運算函式。
而 JS 任意的資料結構都可以組成相對應的 reducer,從 字串 到 物件 都有自己的 reducer 函式。
const reducer = (acc, val) => acc + val; // string reducer('Hello', ', World'); // Hello, World // number reducer(5, 20); // 25 // object const objectReducer = (acc, val) => ({ ...acc, ...val }); const myInfo = {name: 'Jing',email: 'jingmultiplefive@gmail.com', }; objectReducer({ ...myInfo }, { phone: '0912345678' }); // {name: "Jing", email: "jingmultiplefive@gmail.com", phone: "0912345678"}
而為什麼會被稱為 reducer
呢? 大家想想看 Array.prototype.reduce
,所放入的第一個函式不就是 (acc, val) => {/** do something, then concat*/ }
嗎!!
const arrReducer = (acc, val) => [...acc, val]; [2, 3, 4].reduce(arrReducer, [1]); // [1, 2, 3, 4]
Transformer 函式為傳入 Array.prototype.map
,也就是將迴圈時傳入的值透過 transformer 去進行值的轉換。
[1, 2, 3, 4].map(tripleIt); // [3, 6, 9, 12]
tripleIt
這個就是 transformer,將其值進行三倍的轉換。
Predictor 函式為傳入 Array.prototype.filter
,在迴圈中篩選通過 predictor 函式的值。
[1, 2, 3, 4].filter(isEven); // [2, 4]
isEven
這個就是 predictor,篩選其為偶數的數值。
步驟一,用 reduce
實踐 map
與 filter
可以想像一下,如果現在 JS 語法已經不在支援, map
與 filter
也不能直接用 forEach
去實作,簡單來說就只能用 Array.prototype.reduce
那要如何用 reduce
去實作 map
跟 filter
呢?
const map = (transformer, array) =>array.reduce((acc, val) => [...acc, transformer(val)], []); const filter = (predicator, array) =>array.reduce((acc, val) => (predicator(val) ? [...acc, val] : acc)); const result = filter(isEven, map(tripleIt, [1, 2, 3, 4]));
但這樣若想要進行多次的 map
或 filter
不就會變得難以閱讀, 如
filter(isEven, map(tripleIt, filter(isEven, map(tripleIt, [1, 2, 3, 4]))));
這樣就沒辦法快速知道這段程式碼原來是將 array 各個 item 先乘 3 取偶數 再乘 3 再取偶數。
| 有沒有甚麼方法可以先將 array 的語法抽象畫出來,並用 reduce 進行鍊式 的寫法。
接下來我們就要再抽象化,達到下例的寫法
[1, 2, 3, 4].reduce((acc, val) => map(tripleIt)(acc, val), []).reducer(((acc, val) => filter(isEven)(acc, val), []); // [6, 12]
步驟二,將 Array 相關的語法 抽象化
要進化成上述的寫法,就需要將 map
跟 filter
進行將 array 語法的抽象化,讓 reduce
本身用鏈式的方法去執行。
const map = (transformer) => (acc, val) => [...acc, transformer(val)]; const filter = (predicator) => (acc, val) =>predicator(val) ? [...acc, val] : acc; const result = [1, 2, 3, 4].reduce(map(tripleIt), []) // same as `(acc, val) => map(tripleIt)(acc, val)`.reduce(filter(isEven), []); // same as `(acc, val) => filter(isEven)(acc, val)`
接下來大家應該都有注意到了, 第二步驟的 map
與 filter
好像都有相似之處,發現了嗎?
map
函式的 [...acc, transformer(val)]
與 filter
函式的 [...acc, val]
這不就是 reducer 嘛!
所以我們可以將其抽象出來,
步驟三,將 Reducer 抽象化
const map = (transformer) => (reducer) => (acc, val) =>reducer(acc, transformer(val)); const filter = (predicator) => (reducer) => (acc, val) =>predicator(val) ? reducer(acc, val) : acc; const reducer = (acc, val) => [...acc, val];
接下來我們就可以將我們的 map
與 filter
使用方法改寫成這樣
const transducer = map(tripleIt)(filter(isEven)(reducer)); const result = [1, 2, 3, 4].reduce(transducer, []); // [6, 12]
分析一下上述的函式
首先 reduce
的 callback 觸發了 (acc, val) => {/** your code */}
,進而啟動了 transducer 這個函式
第一個 acc 跟 val 傳入 reducer([], 1)
,先啟動了 map
, 經過數值乘 3 後,輸出 reducer([], 3)
接下來 filter
被啟動了,並且接收了 reducer([], 3)
,作為其輸入,但 3 不是偶數,故 filter 回傳 []
結束第一個數值的運算,之後以此類推。
到這裡大家不難發現:
Transducer 就是 reducer compose起來的方法,也可以稱它為 higher-order reducer, 其需要將 reducer 傳入,且輸出另一個 reducer。
如果還不是很清楚的,可以透過這個好用的視覺化網站,更清晰的理解過程。
步驟四,打造 composable 的 Reducer
相信到這裡大家應該都已經非常清楚地知道 transducer 整個運作流程,但還差臨門一腳
const transducer = map(tripleIt)(filter(isEven)(reducer));
這段程式碼好像可以進行 compose,我們先將這段程式碼整理一下
const tripleMapper = map(tripleIt); const isEvenFilter = filter(isEven); const transducer = tripleMapper(isEvenFilter(reducer));
而 compose 不就是將 f2(f1(x))
轉換成 compose(f2, f1)(x)
的概念嗎!
const compose = (...functions) =>functions.reduce((acc, fn) => (...args) => acc(fn(...args)),(x) => x,); const transducer = compose(isEvenFilter, tripleMapper); const result = [1, 2, 3, 4].reduce(transducer(reducer), []); // [6, 12]
再將其轉換成需要傳入 transducer
, reducer
, initialValue
與 array
的函式
const transduce = (transducer, reducer, initialValue, array) =>array.reduce(transducer(reducer), initialValue);
結論
終於大功告成了,看起來我們可以對比一下使用 Ramda 的 transduce
跟我們目前寫的樣子
Ramda 的 transduce
const R = require('ramda'); const transducer = R.compose(R.filter(isEven), R.map(tripleIt)); const reducer = (acc, val) => (acc.push(val), acc); // same as (acc, val) => { acc.push(val); return acc } const result = R.transduce(transducer, reducer, [], arrOfMillion);
我們的 transduce
const compose = (...fns) =>fns.reduce((acc, fn) => (...args) => acc(fn(...args)),(x) => x,); const map = (transformer) => (reducer) => (acc, val) =>reducer(acc, transformer(val)); const filter = (predicator) => (reducer) => (acc, val) =>predicator(val) ? reducer(acc, val) : acc; const transducer = compose(filter(isEven), map(tripleIt)); const reducer = (acc, val) => (acc.push(val), acc); const result = R.transduce(transducer, reducer, [], arrOfMillion);
看起來是成功的復刻了 Ramda 的 transduce 函式,這也讓我們體會到了 transduce 就是不斷的抽象化的一個過程的概念,並且濃縮到兼顧可讀性與複用。
下一篇會講到如何將現在的 transduce 寫成讓不同資料型別也可以使用的函式,以及用 functional programming 的寫法,寫出 Trans monad,並且體會它強大的威力。
Reference
July 22, 2021. Jing.