Python pandas 套件

markdown #介紹 - python 的一個數據分析套件,主要讓使用者可以簡易使用的資料格式 =>主要有兩種: Series 和 DataFram - Series 是時間序列相關的資料 (有點類似連續資料的概念) 例如 sensor 的資料 =>如:溫度感測器,每一分鐘的溫度資料 - DataFram 是結構化的資料,例如表格,也就是有行有列,如有索引的二維資料,例如 :CSV 所以 pandas 可以做資料分析,整合整理資料,資料的前處理 例如:排序,找出空值,合併表格...等。 #操作流程 1.套件安裝
2.讀取 csv ``` import pandas as pd encoding = 'unicode_escape' df = pd.read_csv('A.csv') print(df) ```
其中這行程式碼添加是因為資料的編碼會出現報錯 ``` encoding = 'unicode_escape' ``` 以及CSV 檔案存檔格式儲存時設定
3. 讀取成 Series ``` import pandas as pd a = [1,2,3,'QOO',3.14] b = pd.Series(a) print(b) ```
``` import pandas as pd cars = ["BMW", "BENZ", "Toyota", "Nissan", "Lexus"] select = pd.Series(cars) print(select) ```
4.讀取 dictionary 資料 ``` import pandas as pd dict = { "factory": "Taipei", "sensor1": "1", "sensor2": "2", "sensor3": "3", "sensor4": "4", "sensor5": "5" } select = pd.Series(dict, index = dict.keys()) # 排序與原 dict 相同 print(select[0]) print("=====") print(select['sensor1']) print("=====") print(select[[0, 2, 4]]) print("=====") print(select[['factory', 'sensor1', 'sensor3']]) ```
更詳細一點的圖
5. 建立 Datafram 資料為dictionary ``` import pandas as pd # 引用套件並縮寫為 pd groups = ["Movies", "Sports", "Coding", "Fishing", "Dancing", "cooking"] num = [46, 8, 12, 12, 6, 58] dict = {"groups": groups, "num": num } select_df = pd.DataFrame(dict) print(select_df) # 看看資料框的外觀 ```
參考: - https://oranwind.org/python-pandas-ji-chu-jiao-xue/

留言