Python

· Python
질적변수와 양적변수 질적변수 : 선택이 필요한 변수, 종류를 구별하기 위한 변수 - 명목형 변수라고도 불리며, 범주형 변수라고도 한다. - EX : 성별, 혈액형 등 양적변수 : 양을 표현하는 변수 - 수치형 변수라고도 불리며, 연속형 변수라고도 한다. - EX : 나이, 키, 몸무게, 시험 점수 등 - 질적 변수는 주로 빈도 분석, 범주 간 비교, 카이제곱 검정 등의 방법을 활용하여 분석 - 양적 변수는 주로 중심 경향성(평균, 중앙값), 분산성(표준편차, 분위수), 상관관계, 회귀 분석 등의 방법을 활용하여 분석 이산형변수와 연속형변수 이산형변수 : 하나하나의 값을 취하는 변수 - 서로 인접한 숫자 사이에 값이 존재하지 않음 - EX : 주사위의 눈, 결석 횟수, 결석 학생 수 등 연속형변수 : 연속..
· Python
In [2]: import pandas as pd import numpy as np import seaborn as sns import matplotlib as plt df = pd.read_csv("DataBreaches(2004-2021).csv", encoding='cp949') df.head() Out[2]: Entity Year Records Organization type Method 0 21st Century Oncology 2016 2200000 healthcare hacked 1 500px 2020 14870304 social networking hacked 2 Accendo Insurance Co. 2020 175350 healthcare poor security 3 Adobe Syst..
· Python
In [38]: import pandas as pd 두개의 dataframe 합치기 pd.merge(df1, df2, how= , left_index= , right_index) how : 병합 방법을 지정하는 문자열 inner : 두 데이터프레임에 모두 존재하는 경우에만 결과에 포함 outer : 두 데이터프레임의 합집합을 결과에 포함 left : 왼쪽 데이터프레임의 모든 행을 유지하며, 오른쪽 데이터프레임과 공통된 열의 값이 일치하는 경우에만 결과에 포함 right : 오른쪽 데이터프레임의 모든 행을 유지하며, 왼쪽 데이터프레임과 공통된 열의 값이 일치하는 경우에만 결과에 포함 left_index, right_index: 왼쪽과 오른쪽 데이터프레임의 인덱스를 병합 기준으로 사용할지 여부를 지정하는 매..
· Python
판다스 자료구조 - Series¶ 1차원 레이블링된 배열로, 일련의 값들을 가지고 있다. 인덱스와 값으로 구성 인덱스 : 각 값에 대한 고유한 식별자, 기본적으로 0부터 시작하는 정수 인덱스가 사용 series data 만들기¶ In [1]: import pandas as pd list를 series data로 만들기 In [2]: customer=['a','b','c'] pd.Series(customer) Out[2]: 0 a 1 b 2 c dtype: object dictionary를 series data로 만들기 In [3]: customer_no_name={ '10001':'홍인표', '10002':'김학동', '10003':'안은영', '10004':'고길동' } cust_info = pd.Se..
· Python
세트(set) 세트(set)는 고유한 값들을 저장하는 자료구조로 수학에서 배웠던 집합과 같다. 리스트와는 다르게 세트의 요소는 특정 순서로 저장되지 않으며 위치별로 엑세스할 수 없다. 세트_이름 = {항목1, 항목2, 항목3, ....} numbers = {1,2,3} #초기화된 세트를 생성한다. values = set() #공백 세트를 생성한다. #공백 세트가 {}가 아니다. 리스트↔세트 set()함수를 통해 리스트를 세트로 만든다. numbers=set([1,2,3,1,2,3]) print(numbers) #{1,2,3} 문자열을 분해하여 세트로 만들 수 있다. letters = set("abc") print(letters) #{'c', 'b', 'a'} 리스트의 중첩된 요소를 제외한 요소를 확인할 ..
· Python
시퀀스(sequence) 요소(element)로 구성 요소 간에는 순서가 있다. 시퀀스의 요소들은 번호가 붙어져 있다. 내장시퀀스(str, bytes, bytearray, list, tuple, range) 동일한 연산을 지원 내장함수 적용가능 : 시퀀스의 길이를 반환하는 len()함수, 최대값과 최소값을 찾는 max()와 min()함수 튜플(tuple) 튜플_이름 = (항목1, 항목2, ...) fruits=() #공백 튜플을 생성한다. fruits=("apple","banana","grape") #초기값을 가진 튜플을 생성한다. fruits="apple","banana","grape" result = fruits[1] #인덱스를 사용하여 요소에 접근한다. 쉼표가 끝에 있어야 한다. single_tup..
· Python
파이썬이란 파이썬의 특징 인터프리터 언어 : 파이썬 프로그래머는 자신이 작성한 명령문의 결과를 즉시 볼 수 있기 때문에 초보 프로그래머 한테 아주 바람직 라이브러리가 풍부하고 설치가 쉽다. 대화형모드(interactive mode) : 콘솔에서 문장을 한 줄씩 입력하여 실행 스크립트 모드(script mode) : 파일을 만들어서 저장한 후에 파이썬 인터프리터가 이 파일을 읽어서 한 번에 전부 실행 코드가 복잡해지면 인터프리트 모드는 번거롭다. print() 함수 파이썬 프로그램은 여러 줄의 명령문들로 이루어진다. 함수(function)는 특별한 작업을 수행하는 명령어들의 모임이다. print(문자열) print("HelloWorld") 여러 개의 값들을 화면에 차례대로 출력할 수 있다. print("결..
· Python
#1 사용자에게 7개의 영어 단어를 입력받습니다 알파벳순으로 정렬한 후 화면에 표시 합니다. 또한 정렬한 결과의 첫번째 있는 단어, 중앙에 있는 단어, 마지막에 있는 단어 를 표시합니다. 출력예시 : wordList=[] print("단어?") for i in range(7): word=input() wordList.append(word) wordList.sort() print("영어 단어 리스트 : ", end=" ") print(wordList) print("첫번째 단어:", wordList[0]) print("중앙의 단어:", wordList[3]) print("마지막 단어:", wordList[6]) #2 로또번호생성 원하는 숫자를 입력받는다.(1~10) 1번에서 입력받은 횟수만큼 로또 번호를 생..
제이지연
'Python' 카테고리의 글 목록