import pandas as pd

dict_data = {'a':1, 'b':2, 'c':3}
series_data = pd.Series(dict_data)

print(series_data)

a    1
b    2
c    3
dtype: int64

print(type(series_data))

<class 'pandas.core.series.Series'>

print(series_data.index)

Index(['a', 'b', 'c'], dtype='object')

print(series_data.values)

[1 2 3]

list_data = [2,4,6,8]

series_data = pd.Series(list_data)

print(series_data)

0    2
1    4
2    6
3    8
dtype: int64

print(series_data.index)

RangeIndex(start=0, stop=4, step=1)

print(series_data.values)

[2 4 6 8]

tuple_data = (2,4,6,8)

series_data = pd.Series(tuple_data)

print(series_data.to_dict())

{0: 2, 1: 4, 2: 6, 3: 8}

series_data = pd.Series(list_data, index = ['a','b','c','d'])

print(series_data)

a    2
b    4
c    6
d    8
dtype: int64

dict_data = {'c0':[1,2,3], 'c1':[4,5,6],'c2':[7,8,9], 'c3':[10,11,12], 'c4':[13,14,15]}
df = pd.DataFrame(dict_data)

print(df)
print(type(df))

   c0  c1  c2  c3  c4
0   1   4   7  10  13
1   2   5   8  11  14
2   3   6   9  12  15
<class 'pandas.core.frame.DataFrame'>

df = pd.DataFrame([[14,'남'],[17,'여']],
                  index = ['a','b'],
                  columns = ['나이','성별'])

print(df)
print('------')
print(df.index)
print('------')
print(df.values)
print('------')
print(df.to_dict())

   연령 남녀    키  지역  도시
a  14  남  170  서울  서울
b  17  여  155  분당  분당
------
Index(['a', 'b'], dtype='object')
------
[[14 '남' '170' '서울' '서울']
 [17 '여' '155' '분당' '분당']]
------
{'연령': {'a': 14, 'b': 17}, '남녀': {'a': '남', 'b': '여'}, '키': {'a': '170', 'b': '155'}, '지역': {'a': '서울', 'b': '분당'}, '도시': {'a': '서울', 'b': '분당'}}

city = ['서울', '분당']
df['지역'] = city

print(df)

   연령 남녀    키  지역  도시
a  14  남  170  서울  서울
b  17  여  155  분당  분당

df.insert(2,'키',['170','155'])

   나이 성별    키  지역
a  14  남  170  서울
b  17  여  155  분당

print(df)

   나이 성별    키  지역
a  14  남  170  서울
b  17  여  155  분당

df['키'] = ['170']

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-52-014fc9cae349> in <module>
----> 1 df['키'] = ['170']

/usr/local/lib/python3.6/site-packages/pandas/core/frame.py in __setitem__(self, key, value)
   3042         else:
   3043             # set column
-> 3044             self._set_item(key, value)
   3045 
   3046     def _setitem_slice(self, key: slice, value):

...

df = df.assign(도시 = city)
df.loc[:,'도시'] = city

print(df.index)

Index(['a', 'b'], dtype='object')

   나이 성별    키  지역  도시
c  14  남  170  서울  서울
d  17  여  155  분당  분당

   연령 남녀    키  지역  도시
a  14  남  170  서울  서울
b  17  여  155  분당  분당

print(df.index)

Index(['a', 'b'], dtype='object')

df.index = ['c','d']

print(df)

   나이 성별    키  지역  도시
c  14  남  170  서울  서울
d  17  여  155  분당  분당

df.rename(columns={'나이':'연령','성별':'남녀'}, inplace=True)

df2 = df.copy()

df2.drop(columns='키', inplace = True)
print(df2)

   나이 성별  지역  도시
c  14  남  서울  서울
d  17  여  분당  분당

df2.drop(index='d', inplace = True)
print(df2)

   나이 성별  지역  도시
c  14  남  서울  서울

df = pd.DataFrame([[14,'남'],[17,'여'],[24,'남'],[20,'여'],[15,'남'],[21,'여']],
                  index = ['a','b','c','d','e','f'],
                  columns = ['나이','성별'])

print(df)

   나이 성별
a  14  남
b  17  여
c  24  남
d  20  여
e  15  남
f  21  여

print(df['나이'] > 20)

a    False
b    False
c     True
d    False
e    False
f     True
Name: 나이, dtype: bool

print(df[df['나이'] > 20])

   나이 성별
c  24  남
f  21  여

Chapter 2. Pandas 3편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 (0)	2022.08.25
Chapter 2. Pandas 2편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 (0)	2022.08.25
Chapter 2. Numpy 2편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 (0)	2022.07.27
Chapter 2. Numpy 1편 : Time Series 머신러닝을 위한 Python 필수 라이브러리 (0)	2022.07.27
Chapter 1. 기초 선형대수 및 통계학 : Time Series 머신러닝을 위한 Python 필수 라이브러리 (0)	2022.06.27

Chapter 2. Pandas 1편 : Time Series 머신러닝을 위한 Python 필수 라이브러리

'엑셈 경쟁력 > 시계열 데이터처리 AI 알고리즘' 카테고리의 다른 글

댓글

티스토리툴바

Chapter 2. Pandas 1편 : Time Series 머신러닝을 위한 Python 필수 라이브러리

'엑셈 경쟁력 > 시계열 데이터처리 AI 알고리즘' 카테고리의 다른 글

관련글

댓글

티스토리툴바