본문 바로가기

파이썬 기초

(8)
[판다스 기초] 특정 행 선택, 값 찾기, 중복 제거까지 한 번에 끝내기 이번 포스팅에서는 판다스로 특정 행을 가져오거나, 특정 값이 있는지 확인하고, 중복 데이터를 제거하는 방법을 소개하겠습니다. 1. 특정 행 가져오기우선 고객정보 데이터가 있다고 가정해 봅시다.여기에서 예를들어 이영희 고객만 보고 싶다고 했을 때,판다스에서는 조건 필터링을 위해 df[df['이름'] == '이영희']로 가져올 수 있습니다.만약 id가 104번 이상만 보고 싶다고 하면, df[df.id >= 104]로 볼 수 있어요.보통은 등급별로 많이 볼텐데, 등급도 df[df['등급'] == '실버'] 이런식으로 가져올 수 있지요.만약, 두가지 이상의 조건을 넣고 싶다면, 성별이 여자이고 실버 고객만 보고 싶다면,df[(df['성별']] == '여') & (df['등급'] == '실버')] 로 작성할 수..
[Pandas] 판다스로 데이터프레임 만들기 이번 포스팅에서는 Pandas로 만들 수 있는 DataFrame 연습을 해보려고 해요. 1.  DataFrame의 기본판다스의 데이터 프레임을 만드는데 '이름' '나이' 는 key로 컬럼 이름, value로 들어가는 것은 리스트로 작성해 주었습니다. 2. 인덱스 지정하기인덱스는 기존 데이터 프레임의 데이터에 ,를 찍고 index=[1,2,3]이런식으로 넣을 수 있어요.index는 리스트나 배열 형태로 들어가면 된답니다. 3. 다중 인덱스 지정하기그렇다면 다중 인덱스는 어떻게 사용할 수 있을까요? 여기에서는 튜플이 사용 됩니다. data를 준비하고, data = {'인구수' : [100000,80000,70000]}다중 인덱스는 MutiIndex.from_tuples를 사용합니다.  4. 연습하기월지역카테..
[판다스] 판다스 처음 써봤다면? CSV 불러오고 편집하는 방법 정리 파이썬에서 가장 중요하면서 기본적인 라이브러리 중 하나인 판다스 라이브러리를 알아보겠습니다. 판다스(Pandas)는 엑셀처럼 표를 만드는 도구라고 이해하시면 됩니다.그리고 이렇게 표를 만들고, 표의 필요없는 칸을 지우거나, 이름을 바꾸거나, 수식을 사용해서 평균이나 합계 등을 내거나, 필요한 것만 골라서 보거나, 표를 합치거나, 그룹으로 묶거나, 비어있는 곳을 임의의 숫자로 채우거나, 차트로 보여주는 것까지 할 수 있습니다.결국 데이터를 처리하는데 여러가지 편집을 할 수 있으며 대용량 데이터에 활용이 가능해서 엑셀과 차이가 있다고 볼 수 있습니다. 1. DataFrame과 Series 판다스의 핵심 두가지 용어를 알아보자.1) Series숫자나 글자들을 한 줄로 모아놓은 것(열 하나짜리 표)index가 ..
[파이썬 기초] 파이썬 bool 타입과 그 활용 1. 데이터 타입으로써의 bool 파이썬에는 여러가지 데이터 타입이 있습니다. 다루어 보았던 숫자(int, float), 문자열(str), 컬렉션(list, tuple, dict, set)그리고 이번에 다룰 bool(true,false)가 있어요. bool(불리언)은 True, False 두가지 값만 가질 수 있습니다. 주로 진실/거짓 이라는 의미 보다는,"있다/없다" "성립하다/성립하지 않는다" 느낌이 조금 더 맞는 표현이라고 합니다. 2. 비교 연산자와 bool 비교 연산자로 불리는 것들은 두 값을 비교하여 True or False를 반환합니다.연산자의미==같다!=같지 않다작다>크다작거나 같다>=크거나 같다in포함되어 있다not in포함되어 있지 않다 이런식으로 값을 비교해서 성립하면 true, 성립..
[파이썬 기초] range()를 써야 하는 이유? slicing과 비교하며 쉽게 배워보기 1. range와 slicing?range와 slicing은 '어디서부터 어디까지'라는 특정 범위를 지정할 때 사용되요. 하지만 사용 방법과 출력 방식이 다르기 때문에 어떤 부분이 다른가 살펴보면 좋을 것 같습니다. 2. range와 slicing의 차이 1) 사용하는 괄호 그리고 구분 방법range(a,b,c) - 소괄호()를 사용하고, 값 사이를 ,(콤마)로 구분합니다.slicing[a:b:c] - 대괄호[]를 사용하고, 값 사이를 :(클론)로 구분합니다. 2) 출력 방식의 차이range()는 직접 출력시 range(0,5)처럼 숫자 목록을 볼 수 없습니다.slicing은 리스트에서 특정 범위를 잘라서 바로 숫자 목록을 볼 수 있습니다.3. range는 왜 list로 변환해야 할까요?range()의 ..
[파이썬 기초] 특정 요소의 일부를 가져오는 slicing 슬라이싱은 데이터의 일부분을 잘라서 가져올 때 사용합니다.마치 책에서 일부 페이지만 복사한다고 생각하시면 되요.  1. 슬라이싱은 어떻게 사용할까요? 시작 인덱스 : 끝 인덱스 형태입니다. 여기서는 fruit[1:4]니까 시작 인덱스가 1이고, 끝 인덱스는 4-1인 3까지 가져오는 거예요.그래서 배, 오랜지, 바나나 이렇게 1,2,3에 해당하는 3개의 과일을 가져오는 것입니다.* 끝 인덱스는 포함되지 않고 끝 인덱스-1 까지만 포함 된다는 점을 기억해야 합니다. 2. 처음부터 지정한 인덱스까지, 지정한 인덱스 부터 끝 인덱스까지.여기서 처음부터 지정한 인덱스까지 slicing을 한다고 하면, 처음은 생략하고 지정한 :3으로 바나나 전인 오렌지까지 가녀옵니다.반대로 지정한 인덱스부터 마지막까지는 2시작점을..
[파이썬 기초] 데이터를 찾는 방법1 indexing 인덱싱(indexing)이번 포스팅에서는 파이썬의 인덱싱에 대해서 알아보고자 합니다. index란? 일반적으로 찾아보기로 사용되는 개념인데책의 마지막에 가나다순으로 용어들이 정리된 것 한번쯤 보신적 있으시죠? indexing란? 인덱스를 이용해서 데이터를 찾는 것 입니다.예를들어, 과일가게에 사과, 배, 오렌지, 바나나가 있습니다. 원하는 과일을 찾는 방법이 바로 번호인데요.보통 프로그래밍에서는 0,1,2... 로 시작을 합니다.fruit = [사과, 배, 오렌지, 바나나] 이렇게 있을 때, A는 바나나를 B는 귤을 원한다고 하면,A : fruit[0].   B : fruit[3] 이렇게 불러야 원하는 과일을 찾을 수 있는 것입니다. 앞에서 읽을 때는 0부터 읽고, 뒤에서부터 읽을 때는 0 없이 읽습니다..
[파이썬 기본] 데이터를 담는 방법 변수에 여러개의 데이터를 담는 방법은 파이썬에서 크게 4가지로 나뉠 수 있습니다. 1. 리스트(list) - [ ]2. 튜플(tuple) - ( )3. 세트(set) - { }4. 딕셔너리(dictionary) - { : } 1. 리스트 ( list )- 여러 값을 넣고 싶을 때 사용합니다.- 데이터 변경(추가, 삭제, 교체 등)이 가능합니다.- 순서 변경이 가능합니다. score = [ 80, 20, 10, 50, 100 ] student = [ "김말자", "나미리", "이하늬", "박길동", "홍길동" ] *여기서 리스트 안의 각각의 데이터 80, 20, 10 ... , "김말자", "나미리".... 는 element(요소)라고 해요. - 데이터 변경(추가, 삭제, 교체 등)이 가능한 2번째 특징을..