본문 바로가기

전체 글100

EDA(Exploratory data analysis)란? EDA EDA(Exploratory data analysis)란? 수집한 데이터를 다양한 각도(그래프, 통계, 모형, 차트 등) 에서 관찰하고 이해하는 과정 데이터는 보통 엑셀 같은 테이블 형태인데 이를 보고 인사이트를 내는 것은 쉽지 않기 때문에 전체적인 견적을 내기 위해 사용하는 분석법이다. EDA는 크게 2가지 방식으로 나뉘며 내용은 아래와 같다 Graphic : 차트 혹은 그래프를 이용하여 데이터를 이용하는 방식 Non-Graphic : Summary Statistics를 통해 확인하는 방식 EDA를 하는 이유? 다양한 모습으로 관찰하여 잠재적인 문제를 발견하기 위함 수집한 데이터를 좀 더 상세한 부분(새로운 패턴 등)을 보며 새로운 방면으로 인사이트를 도출하기 위함 Data Preproceess.. 2022. 1. 19.
지주택이란 뭘까? 남대전 힐스테이트는 대체..? 나는 성심당의 도시 대전에서 살고 있다. 대전이 작년, 재작년부터 부동산이 엄청나게 오르며 투기과열지구로 지정됨에도 불구하고 아파트를 사고 싶어도 못살 정도로 비싸지고 있고 거래가격이 하락하는 아파트는 정말 보기 어려운 그런 기이한 현상을 겪고 있다. 대전 어디든 분양 일정만 뜨면 정말 최소 20:1 정도의 경쟁률을 보여주며 무섭게 오르는 부동산 상황임에도 불구하고 요즘 돌아다니면서 남대전 힐스테이트 3억 5천 분양이라는 광고가 자주 보였다. 말도 안 돼 미분양 나는 곳이 있나? 싶어서 친구들이 있는 톡방에 왜 저런곳이 있나 얘기를 해보았더니 지주택 지역이라며 지주택은 도박이다. 하지만 브랜드가 힐스테이트이기 때문에 진행된다면 대박이라는 말을 해줬다. 그래서 부린이로써 이런 상식이 없다는 게 부끄럽고 궁.. 2022. 1. 17.
python Data structures 8.4 list 문제 8.4 Open the file romeo.txt and read it line by line. For each line, split the line into a list of words using the split() method. The program should build a list of words. For each word on each line check to see if the word is already in the list and if not append it to the list. When the program completes, sort and print the resulting words in alphabetical order. You can download the sample.. 2022. 1. 15.
Python Data Structures 3주차 파일 입출력에 관하여 배웠다. 과제 7.2 Write a program that prompts for a file name, then opens that file and reads through the file, looking for lines of the form: X-DSPAM-Confidence: 0.8475 Count these lines and extract the floating point values from each of the lines and compute the average of those values and produce an output as shown below. Do not use the sum() function or a variable named sum in your so.. 2022. 1. 14.
파이썬의 다양한 string 함수 예시 1. string() 함수 word = 'banana' fruit = word.replace('ban','apple') 이라 함은 banana의 ban을 apple로 바꿔주는 역할 즉 출력 값은 appleana 가 된다 여러 반복되는 글자들도 banana 의 a를 -> o를 바꾸고 출력한 값임 즉 bonono가 됨 2.strip() ,lstrip(),rstrip()함수 출력문만 봐도 바로 이해가 가듯 공백을 제거해주는 함수 strip은 왼쪽오른쪽 전부 제거 lstrip은 왼쪽 공백제거 rstrip은 오른쪽 공백제거 2022. 1. 14.
python data structures 1주차 -string 문자열에 대한 강의를 보았음 즉 바나나는 오퍼레이터가 0,1,2,3,4,5 임 이 말은 즉슨 word='banana' 라고 하면 w[0] -> b w[4] -> n 이란 의미 이 정도만 알아도 대부분 이해가 가서 바로 과제로 넘어간다 1주차 과제 6.5 Write code using find() and string slicing (see section 6.10) to extract the number at the end of the line below. Convert the extracted value to a floating point number and print it out. 6.5 find()와 스트링 슬라이싱(섹션 6.10 참조)을 사용하여 아래 줄 끝에 있는 숫자를 추출하는 코드를 작성하십시오.. 2022. 1. 14.
모두를 위한 프로그래밍 7주차 for 문을 이용하는 강의 파이썬은 복수형을 이해하지 못하기 때문에 아래 예시에서는 리스트 형으로 이해하여 오른쪽 처럼 출력하게 하게 된다 과제 5.2 Write a program that repeatedly prompts a user for integer numbers until the user enters 'done'. Once 'done' is entered, print out the largest and smallest of the numbers. If the user enters anything other than a valid number catch it with a try/except and put out an appropriate message and ignore the number. En.. 2022. 1. 13.
모두를 위한 프로그래밍 6주차 <함수> 4.6 퀴즈 4.6 Write a program to prompt the user for hours and rate per hour using input to compute gross pay. Pay should be the normal rate for hours up to 40 and time-and-a-half for the hourly rate for all hours worked above 40 hours. Put the logic to do the computation of pay in a function called computepay() and use the function to do the computation. The function should return a value. Use 45 .. 2022. 1. 13.
모두를 위한 프로그래밍 5주차 노란 코드에서는 'Something else' 문장이 오렌지 코드에서는 'Below 10' 문장이 출력되지 않는다 이미 위 'Below 20' 문장이 사실 값이 되었기 때문 이러한 코드에서 계속해서 코드를 진행시키기 싶거나 혹은 traceback을 발생시키기 싫다면 ? try와 execpt 를 사용하면 된다. 첫 try 문장에선 정수 값이여서 firtst -1 로 결과가 나오고 두번째 try 문장에선 정수형이여서 제대로된 결과를 볼 수 있다. 일반적인 decision은 if를 사용하고 양뱡향의 decisions는 if - then - else를 동반함 try/execpt는 원하는 에러를 찾는데 사용된다고 생각하면 된다. 2022. 1. 12.