markdown
#介紹
- python 的一個數據分析套件,主要讓使用者可以簡易使用的資料格式
=>主要有兩種: Series 和 DataFram
- Series 是時間序列相關的資料 (有點類似連續資料的概念)
例如 sensor 的資料 =>如:溫度感測器,每一分鐘的溫度資料
- DataFram 是結構化的資料,例如表格,也就是有行有列,如有索引的二維資料,例如 :CSV
所以 pandas 可以做資料分析,整合整理資料,資料的前處理
例如:排序,找出空值,合併表格...等。
#操作流程
1.套件安裝
2.讀取 csv
```
import pandas as pd
encoding = 'unicode_escape'
df = pd.read_csv('A.csv')
print(df)
```
其中這行程式碼添加是因為資料的編碼會出現報錯
```
encoding = 'unicode_escape'
```
以及CSV 檔案存檔格式儲存時設定
3. 讀取成 Series
```
import pandas as pd
a = [1,2,3,'QOO',3.14]
b = pd.Series(a)
print(b)
```
```
import pandas as pd
cars = ["BMW", "BENZ", "Toyota", "Nissan", "Lexus"]
select = pd.Series(cars)
print(select)
```
4.讀取 dictionary 資料
```
import pandas as pd
dict = {
"factory": "Taipei",
"sensor1": "1",
"sensor2": "2",
"sensor3": "3",
"sensor4": "4",
"sensor5": "5"
}
select = pd.Series(dict, index = dict.keys()) # 排序與原 dict 相同
print(select[0])
print("=====")
print(select['sensor1'])
print("=====")
print(select[[0, 2, 4]])
print("=====")
print(select[['factory', 'sensor1', 'sensor3']])
```
更詳細一點的圖
5. 建立 Datafram 資料為dictionary
```
import pandas as pd # 引用套件並縮寫為 pd
groups = ["Movies", "Sports", "Coding", "Fishing", "Dancing", "cooking"]
num = [46, 8, 12, 12, 6, 58]
dict = {"groups": groups,
"num": num
}
select_df = pd.DataFrame(dict)
print(select_df) # 看看資料框的外觀
```
參考:
- https://oranwind.org/python-pandas-ji-chu-jiao-xue/
留言
張貼留言