Revision history and IPFS entry, back to latest
為自己Coding
IPFS What is this

Content Hash

Coding 起來 — Python數據-Parse 教學

為自己Coding
·
·


Yo 今天來跟大家分享,我在工作上用到的一個Python套件Parse,在網路上搜尋幾乎沒有看到他的介紹文,我覺得很不錯用,而且很直覺,所以想寫一篇記錄一下,它跟re(正則表達)一樣都是用來抓我們想要的數據

Github教學連結


1. 首先當然要先下載這個package, 我是用anaconda 來載的(打開你的Anaconda prompt 打上下面那串)

pip install parse

2. parse()

只要打上一個{},它就會根據{}的位置,抓出你想要的數據,在{}中輸入你想要的名字,像是{name}它就會幫你parse 成一個dictionary的形式,非常好用
a. 警告: parse(a,b) a跟b的長度要一致,不然它抓不到
b. 中文也可以play

3. search()

我個人非常喜歡這個function,因為它超直覺,而且它沒有parse()會遇到的問題,你可以根據你想要data的前後pattern,輕鬆找到對應的data,但如果你沒加後面的pattern ,它只會抓一個字下來,像是Age:26, 如果你打Age:{}它只會抓下2, 這時有兩種方法解決,一個是改成{:d}或是加上後面的pattern,Age:{}, (多了一個逗號),它就抓起來了

4. findall()

1. 用這個方式,可以很快將我們要的data裝成list,以便後續要製成dataframe
、csv,非常好用

2. 很適合用來抓html的檔案

5. compile()

如果你覺得每次都要打上我們要找的數據很麻煩,只要用它就只要輸入一次就可以一直用在不同的text(type(str))上

希望有幫助到您~~

如果有什麼問題,也可以直接問我,我只怕幫不了你,因為我也可能不會,但我們可以一起研究,哈哈


參考來源:

https://pypi.org/project/parse/

CC BY-NC-ND 2.0