Zero to Hero - 用 Transduce 提升程式的效能

2021 年 7 月 22 日

從一個簡單的問題開始

假設我們目前有一組長度為一百萬的陣列，需要將陣列內的每個數值乘三並且只保留偶數，那我們會如何實作這簡單的問題?

根據上面的問題，我們在實作前需要準備

#1 長度為一百萬的陣列

const makeArr = (randomCeil) => (len) => Array.from({ length: len },   (v, i) => Math.floor(Math.random() * randomCeil));

const arrOfMillion = makeArr(100)(1e6);

#2 將每個數值乘三的函式

const tripleIt = (num) => num * 3;

#3 只保留偶數的函式

const isEven = (num) => num % 2 === 0;

接來開始想實作方式吧!

在不認識 Transduce 以前

在我還不認識 Transduce 這個概念前，馬上想到的方法可能就是用

#1 Array.prototype.map 與 Array.prototype.filter

const result = arrOfMillion.map(tripleIt).filter(isEven);

#2 或是 forEach

const result = [];

arrOfMillion.forEach((item) => {const tripleItem = tripleIt(item);

  if (isEven(tripleItem)) {result.push(tripleItem);}
});

雖然這兩種方法都可以解決問題，但各自都有優缺點:

第一種方法

優點: 可讀性佳。
缺點: 執行速度慢。(由於會讓陣列跑了兩次迴圈。 map, filter 都會各跑一次，最壞的時間複雜度可能是 O(n) + O(n)，用更直覺一點的想，跑了兩次當然會拖慢程式的效能。)

第二種方法

優點: 執行速度快。(只需要跑一次迴圈)
缺點: 可讀性差，且不容易進行復用。

那有沒有一個解決方法是可以擁有第一種方法的可讀性，且程式的執行速度跟第二種方式一樣快!

Tranduce 就是集結了兩方法優點的概念。其是一個比較進階的概念，筆者也是理解與消化了許久才了解其中的奧秘，接下來我們就一步一步探索著個有趣的概念吧!

如何使用 Transduce

與其先知道是如何實作，不如從如何使用開始，接下來使用的範例是使用 Ramda 提供的 tranduce 函式去解決一開始提到的問題。

Ramda 的 transduce 共需要放入四個參數

transducer: compose 一個或多個 transformer 函式
reducer: 為一個函式須傳入 accumulator 跟 currentValue，並將 currentValue 累加到 accumulator 的運算函式。
initialValue: 初始值。
data: 想要進行處理的資料。

const R = require('ramda');

const transducer = R.compose(R.filter(isEven), R.map(tripleIt));

const reducer = (acc, val) => (acc.push(val), acc); // same as (acc, val) => { acc.push(val); return acc }

const result = R.transduce(transducer, reducer, [], arrOfMillion);

很清楚地可以看到，程式碼可讀性與第一種方法相差不遠。但如何去評測其是否也擁有第二種方法的效能?

效能評比

簡易的效能比較的程式

const timer = (marked, fn) => {
  console.time(marked);fn();console.timeEnd(marked);
};

請開啟 console.log

大家應該已經發現，用 transduce 這個概念不但可以兼顧鏈式寫法的可讀性，也可以具有比 imperative (forEach) 寫法更好的效能，更不用說是本身就自帶 FP 的可複用性。

Transduce 這個概念到底是如何實作的!!

其實 Transduce 就是一個不斷抽象化的過程，而筆者整理出了其抽象化的四個步驟，但在解釋這四個步驟前，我們需要知道一些名詞

名詞解釋

reducer 為一個函式須傳入 accumulator 跟 currentValue，並將 currentValue 累加到 accumulator 的運算函式。

而 JS 任意的資料結構都可以組成相對應的 reducer，從字串到物件都有自己的 reducer 函式。

const reducer = (acc, val) => acc + val;

// string
reducer('Hello', ', World'); // Hello, World

// number
reducer(5, 20); // 25

// object
const objectReducer = (acc, val) => ({ ...acc, ...val });

const myInfo = {name: 'Jing',email: 'jingmultiplefive@gmail.com',
};

objectReducer({ ...myInfo }, { phone: '0912345678' }); // {name: "Jing", email: "jingmultiplefive@gmail.com", phone: "0912345678"}

而為什麼會被稱為 reducer 呢? 大家想想看 Array.prototype.reduce，所放入的第一個函式不就是 (acc, val) => {/** do something, then concat*/ } 嗎!!

const arrReducer = (acc, val) => [...acc, val];

[2, 3, 4].reduce(arrReducer, [1]); // [1, 2, 3, 4]

Transformer 函式為傳入 Array.prototype.map，也就是將迴圈時傳入的值透過 transformer 去進行值的轉換。

[1, 2, 3, 4].map(tripleIt); // [3, 6, 9, 12]

tripleIt 這個就是 transformer，將其值進行三倍的轉換。

Predictor 函式為傳入 Array.prototype.filter，在迴圈中篩選通過 predictor 函式的值。

[1, 2, 3, 4].filter(isEven); // [2, 4]

isEven 這個就是 predictor，篩選其為偶數的數值。

步驟一，用 `reduce` 實踐 `map` 與 `filter`

可以想像一下，如果現在 JS 語法已經不在支援， map 與 filter 也不能直接用 forEach 去實作，簡單來說就只能用 Array.prototype.reduce

那要如何用 reduce 去實作 map 跟 filter 呢?

const map = (transformer, array) =>array.reduce((acc, val) => [...acc, transformer(val)], []);

const filter = (predicator, array) =>array.reduce((acc, val) => (predicator(val) ? [...acc, val] : acc));

const result = filter(isEven, map(tripleIt, [1, 2, 3, 4]));

但這樣若想要進行多次的 map 或 filter 不就會變得難以閱讀，如

filter(isEven, map(tripleIt, filter(isEven, map(tripleIt, [1, 2, 3, 4]))));

這樣就沒辦法快速知道這段程式碼原來是將 array 各個 item 先乘 3 取偶數再乘 3 再取偶數。

| 有沒有甚麼方法可以先將 array 的語法抽象畫出來，並用 reduce 進行鍊式的寫法。

接下來我們就要再抽象化，達到下例的寫法

[1, 2, 3, 4].reduce((acc, val) => map(tripleIt)(acc, val), []).reducer(((acc, val) => filter(isEven)(acc, val), []); // [6, 12]

步驟二，將 Array 相關的語法抽象化

要進化成上述的寫法，就需要將 map 跟 filter 進行將 array 語法的抽象化，讓 reduce 本身用鏈式的方法去執行。

const map = (transformer) => (acc, val) => [...acc, transformer(val)];

const filter = (predicator) => (acc, val) =>predicator(val) ? [...acc, val] : acc;

const result = [1, 2, 3, 4].reduce(map(tripleIt), []) // same as `(acc, val) => map(tripleIt)(acc, val)`.reduce(filter(isEven), []); // same as `(acc, val) => filter(isEven)(acc, val)`

接下來大家應該都有注意到了，第二步驟的 map 與 filter 好像都有相似之處，發現了嗎?

map 函式的 [...acc, transformer(val)] 與 filter 函式的 [...acc, val] 這不就是 reducer 嘛!

所以我們可以將其抽象出來，

步驟三，將 Reducer 抽象化

const map = (transformer) => (reducer) => (acc, val) =>reducer(acc, transformer(val));

const filter = (predicator) => (reducer) => (acc, val) =>predicator(val) ? reducer(acc, val) : acc;

const reducer = (acc, val) => [...acc, val];

接下來我們就可以將我們的 map 與 filter 使用方法改寫成這樣

const transducer = map(tripleIt)(filter(isEven)(reducer));

const result = [1, 2, 3, 4].reduce(transducer, []); // [6, 12]

分析一下上述的函式

首先 reduce 的 callback 觸發了 (acc, val) => {/** your code */}，進而啟動了 transducer 這個函式

第一個 acc 跟 val 傳入 reducer([], 1)，先啟動了 map，經過數值乘 3 後，輸出 reducer([], 3)

接下來 filter 被啟動了，並且接收了 reducer([], 3)，作為其輸入，但 3 不是偶數，故 filter 回傳 [] 結束第一個數值的運算，之後以此類推。

到這裡大家不難發現:

Transducer 就是 reducer compose起來的方法，也可以稱它為 higher-order reducer，其需要將 reducer 傳入，且輸出另一個 reducer。

如果還不是很清楚的，可以透過這個好用的視覺化網站，更清晰的理解過程。

步驟四，打造 composable 的 Reducer

相信到這裡大家應該都已經非常清楚地知道 transducer 整個運作流程，但還差臨門一腳

const transducer = map(tripleIt)(filter(isEven)(reducer));

這段程式碼好像可以進行 compose，我們先將這段程式碼整理一下

const tripleMapper = map(tripleIt);
const isEvenFilter = filter(isEven);

const transducer = tripleMapper(isEvenFilter(reducer));

而 compose 不就是將 f2(f1(x)) 轉換成 compose(f2, f1)(x) 的概念嗎!

const compose = (...functions) =>functions.reduce((acc, fn) => (...args) => acc(fn(...args)),(x) => x,);

const transducer = compose(isEvenFilter, tripleMapper);

const result = [1, 2, 3, 4].reduce(transducer(reducer), []); // [6, 12]

再將其轉換成需要傳入 transducer, reducer, initialValue 與 array 的函式

const transduce = (transducer, reducer, initialValue, array) =>array.reduce(transducer(reducer), initialValue);

結論

終於大功告成了，看起來我們可以對比一下使用 Ramda 的 transduce 跟我們目前寫的樣子

Ramda 的 transduce

const R = require('ramda');

const transducer = R.compose(R.filter(isEven), R.map(tripleIt));

const reducer = (acc, val) => (acc.push(val), acc); // same as (acc, val) => { acc.push(val); return acc }

const result = R.transduce(transducer, reducer, [], arrOfMillion);

我們的 transduce

const compose = (...fns) =>fns.reduce((acc, fn) => (...args) => acc(fn(...args)),(x) => x,);

const map = (transformer) => (reducer) => (acc, val) =>reducer(acc, transformer(val));

const filter = (predicator) => (reducer) => (acc, val) =>predicator(val) ? reducer(acc, val) : acc;

const transducer = compose(filter(isEven), map(tripleIt));

const reducer = (acc, val) => (acc.push(val), acc);

const result = R.transduce(transducer, reducer, [], arrOfMillion);

看起來是成功的復刻了 Ramda 的 transduce 函式，這也讓我們體會到了 transduce 就是不斷的抽象化的一個過程的概念，並且濃縮到兼顧可讀性與複用。

下一篇會講到如何將現在的 transduce 寫成讓不同資料型別也可以使用的函式，以及用 functional programming 的寫法，寫出 Trans monad，並且體會它強大的威力。

Reference

July 22, 2021. Jing.

CC BY-NC-ND 2.0 授权

喜欢我的作品吗？别忘了给予支持与赞赏，让我知道在创作的路上有你陪伴，一起延续这份热忱！

jing