본문 바로가기

전체 글

ML Regression 주가 예측 여러 회사의 주가 예측하기¶실습목표1. 주식 데이터셋을 야후로부터 불러와서 모델에 입력가능한 형태로 변환합니다.2. 시계열 데이터의 특징을 이해하고 EDA 및 F.E 를 진행합니다.3. Cross Validation 을 통해 Hyper Parameter Tunning 을 진행하여 성능을 높여봅니다.실습단계1. 라이브러리 임포트2. 데이터셋 로드 및 전처리3. EDA 및 F.E4. 모델 로드 및 학습5. 모델 평가 및 예측6. 모델 결과 시각화Mission : 아래 코드를 모두 수행하여 AAPL 의 주가를 예측합니다.¶(선택) ALL Stock 데이터에 대해서도 각각 종목별로 주가를 예측합니다.(선택2) 기존에 사용했던 WandB 를 활용하여 CV 시에 파라미터 별 성능을 기록합니다.1.라이브러리 임포트¶.. 더보기
코딩테스트를 위한 자료구조 및 알고리즘 개론 two-sum¶In [ ]:def twoSum(nums: list[int], target: int) -> list[int]: for i in range(0, len(nums)-1): for j in range(i+1, len(nums)): if nums[i] + nums[j] == target: print(nums[i], nums[j]) return [i, j]twoSum([3, 2, 4], 6)2 4Out[ ]:[1, 2]재귀함수 이용¶In [ ]:def solution(nums, target): n = len(nums) def recur(ans, start): if len(ans) == 2: if nums[ans[0].. 더보기
Python EDA - Pandas Pandas¶ In [ ]:# pandas 라이브러리 importimport pandas as pd In [ ]:pd.__version__ Out[ ]:'2.2.1'  pandas v1 vs v2¶현업에서 가장 많이 사용하는 pandas 버전은 1.5.3v1 에서는 numpy 모듈을 사용하는데 문제가 없음v2 에서는 numpy 모듈을 들어내서 numpy 종속 모듈에 영향을 미쳐 호환성에 문제가 있음 In [ ]:%pip install pandas==1.5.3  Collecting pandas==1.5.3 Downloading pandas-1.5.3-cp311-cp311-macosx_11_0_arm64.whl.metadata (11 kB)Requirement already satisfied: python.. 더보기
Python EDA - Numpy Numpy¶  https://www.numpy.orgNumerical computing with Python. 수치연산 및 벡터 연산에 최적화된 라이브러리최적화된 C code로 구현되어 있어 좋은 성능을 보이며 파이썬과 다르게 수치 연산의 안정성이 보장됨(numerical stable)  1. Numpy Array and Operation¶  numpy의 기본적인 사용법에 대해 학습numpy에서 numpy.array를 만드는 여러가지 방법과 지원하는 연산자에 대해 학습  1.1. Numpy Array creation¶ In [ ]:# numpy 라이브러리 importimport numpy as np  1.1.1 파이썬 리스트/튜플을 np.array로 변환¶ In [ ]:# 파이썬 리스트 선언data = .. 더보기
Linear Regression & Binary Classification 목차Linear RegressionLearningErrorLoss FunctionGradient DescentBinary ClassificationLogistic RegressionSigmoid FunctionLoss FunctionBinary Cross EntropyMaximum Likelihood EstimationLinear Regression[선형회귀]트레이닝 데이터를 사용하여 데이터의 특성과 상관관계를 분석하고모델을 학습시켜트레이닝 데이터에 포함되지 않은 새로운 데이터에 대한 결과를 연속적인 숫자 값으로 예측하는 과정주어진 트레이닝 데이터를 바탕으로 손실함수의 값이 최소가 되도록 가중치 W와 y절편 b를 구하는 것이 최종 목표Learning[학습]트레이닝 데이터의 분석을 통해 데이터의 분포를 가.. 더보기
Statistics - Correlation Analysis 목차Correlation AnalysisPearson's Correlation CoefficientCorrelation Analysis두 변수 간에 어느 정도의 선형적 관계가 있는지 파악하는 방법상관 관계의 정도를 나타내는 지수인 상관 계수를 통해 분석자료의 산점도에서 두 변량 사이의 상관관계를 판단하려면 자료의 경향을 나타내는 직선인 추세선 주위에 모여 있는지 살펴봐야 함$f(x) = ax + b$상관관계는 인과관계를 의미하지 않음Pearson's Correlation Coefficient두 데이터 X, Y 즉, $(x_1, y_1), (x_2, y_2), \dots, (x_n, y_n)$ 에 대해 X와 Y가 함께 변하는 정도를 X와 Y가 각각 변하는 정도로 나눈 것$r_{xy} = \frac{\dis.. 더보기
Statistics - ANOVA 목차ANOVA[ANalysis Of VAriance]F분포[카이제곱분포]One-way ANOVA사후분석Two-way ANOVA상호작용 효과Multi-way ANOVAMulti-variate ANOVAANOVA[ANalysis Of VAriance]분산의 원인이 어디에 있는가를 알아보는 통계적 방법통계학에서 두개 이상 다수의 집단을 서로 비교하고자 할 때 집단 내 분산, 집단 간 분산의 비교를 통해 만들어진 F분포를 이용해 가설검정 함3개 이상의 모집단에 대한 평균의 차이를 비교하는 분석방법평균의 차이를 분석하는 방법임에도 불구하고 분산분석이라 부르게 된 이유는 분산을 비교해 평균의 차이를 검정하기 때문F분포[카이제곱분포]분산의 비교를 통해 얻어진 분포 비율 의미, 두 개의 분산에 대한 추론정규분포로부터 .. 더보기
Statistics - 추리통계 분석된 자료를 근거로 모집단의 특성을 추론하는 것점추정구간추정가설검정통계량목차Estimation점추정[Point Estimation]구간추정[Interval Estimation]신뢰수준신뢰구간검정[Test]가설[Hypothesis]귀무가설대립가설가설검정[Hypothesis Test]가설검정 오류[Type 1, 2 Error]유의수준유의확률검정방법양측검정단츠검정t-testz분포t분포등분산과 이분산One sample t-testTwo dependent samples t-testTwo independent samples t-testEstimation정확하지 않지만 어떠한 정도를 가늠하는 방법으로 수치나 범위로 나타냄추정치모수를 추정하기 위해 선택된 표본으로부터 구체적으로 도출된 통계량추정량표본으로부터 관찰된 .. 더보기