Pandas 教程-Pandas 索引
Pandas 教程-Pandas 索引
gh_1d7504e4dee1
回復(fù):python,領(lǐng)取Python面試題。分享Python教程,Python架構(gòu)師教程,Python爬蟲,Python編程視頻,Python腳本,Pycharm教程,Python微服務(wù)架構(gòu),Python分布式架構(gòu),Pycharm注冊碼。
整理: python架構(gòu)師
Pandas 索引被定義為從 DataFrame 中選擇特定行和列數(shù)據(jù)的重要工具。它的任務(wù)是組織數(shù)據(jù)并提供快速訪問數(shù)據(jù)的能力。它也可以稱為子集選擇。
索引中的值以粗體字體顯示,索引的各個值稱為標簽。
如果我們想比較有和沒有索引時的數(shù)據(jù)訪問時間,可以使用%%timeit來比較各種訪問操作所需的時間。
我們還可以將索引定義為通過它可以在整個 Series 或 DataFrame 中訪問任何數(shù)據(jù)的地址。DataFrame 是三個不同組件的組合,即索引、列 和 數(shù)據(jù)。
軸和軸
軸被定義為一種通用術(shù)語,指的是行和列,而軸則是這些行和列的集合。
創(chuàng)建索引
# importing pandas
package
import
pandas
as
pd
data
= pd.read_csv(
"aa.csv"
)
data
Name
Hire Date Salary Leaves Remaining
0
John Idle 03/15/14 50000.0 10
1
Smith Gilliam 06/01/15 65000.0 8
2
Parker Chapman 05/12/14 45000.0 10
3
Jones Palin 11/01/13 70000.0 3
4
Terry Gilliam 08/12/14 48000.0 7
5
Michael Palin 05/23/13 66000.0 8
資源分享
示例1
# importing pandas package
import pandas as pd
# making data frame from csv file
info = pd.read_csv(
"aa.csv"
, index_col =
"Name"
)
# retrieving multiple columns by indexing operator
a = info[[
"Hire Date"
,
"Salary"
]]
print(a)
Name
Hire Date Salary
0
John Idle 03/15/14 50000.0
1
Smith Gilliam 06/01/15 65000.0
2
Parker Chapman 05/12/14 45000.0
3
Jones Palin 11/01/13 70000.0
4
Terry Gilliam 08/12/14 48000.0
5
Michael Palin 05/23/13 66000.0
示例2
# importing pandas package
importpandas as pd
# making data frame from csv file
info =pd.read_csv(
"aa.csv"
, index_col =
"Name"
)
# retrieving columns by indexing operator
a =info[
"Salary"
]
print(a)
Name
Salary
0
John Idle 50000.0
1
Smith Gilliam 65000.0
2
Parker Chapman 45000.0
3
Jones Palin 70000.0
4
Terry Gilliam 48000.0
5
Michael Palin 66000.0
設(shè)置索引
info = pd.DataFrame({
’Name’
: [
’Parker’
,
’Terry’
,
’Smith’
,
’William’
],
’Year’
: [
2011
,
2009
,
2014
,
2010
],
’Leaves’
: [
10
,
15
,
9
,
4
]})
info
info.set_index(
’Name’
)
info.set_index([
’year’
,
’Name’
])
info.set_index([pd.Index([
1
,
2
,
3
,
4
]),
’year’
])
a = pd.Series([
1
,
2
,
3
,
4
])
info.set_index([a, a**
2
])
Name
Year Leaves
1
1 Parker 2011 10
2
4 Terry 2009 15
3
9 Smith 2014 9
4
16 William 2010 4
多重索引
數(shù)據(jù)中還可以有多個索引。
import
pandas
as
pd
import
numpy
as
np
pd.MultiIndex(levels=[[np.nan,
None
, pd.NaT,
128
,
2
]],
codes=[[
0
,
-1
,
1
,
2
,
3
,
4
]])
MultiIndex(levels=[[nan, None, NaT, 128, 2]],
codes=[[0, -1, 1, 2, 3, 4]])
重置索引
我們還可以使用 ’reset_index’ 命令重置索引。讓我們再次查看 ’cm’ DataFrame。
info
= pd.DataFrame([(
’William’
,
’C’
),
(
’Smith’
,
’Java’
),
(
’Parker’
,
’Python’
),
(
’Phill’
, np.nan)],
index=[
1
,
2
,
3
,
4
],
columns=(
’name’
,
’Language’
))
info
info
.reset_index()
index
name Language
0
1 William C
1
2 Smith Java
2
3 Parker Python
3
4 Phill NaN
-
為什么沒看到嘲笑外包的帖子了?網(wǎng)友:叫包哥~ -
Pandas 教程-Pandas 簡便手冊 -
“小而美”Tauri已支持iOS和Android,你還在用“技術(shù)毒瘤”Electron?
-
2023年血糖新標準公布,不是3.9-6.1,快來看看你的血糖正常嗎? 2023-02-07
-
2023年各省最新電價一覽!8省中午執(zhí)行谷段電價! 2023-01-03
-
PPT導(dǎo)出高分辨率圖片的四種方法 2022-09-22
-
2023年最新!國家電網(wǎng)27家省級電力公司負責(zé)人大盤點 2023-03-14
-
全國消防救援總隊主官及簡歷(2023.2) 2023-02-10
-
盤點 l 中國石油大慶油田現(xiàn)任領(lǐng)導(dǎo)班子 2023-02-28
-
我們的前輩!歷屆全國工程勘察設(shè)計大師完整名單! 2022-11-18
-
關(guān)于某送變電公司“4·22”人身死亡事故的快報 2022-04-26
