본문 바로가기

분류 전체보기

(86)

무정보 사전분포(Non-informative prior distribution) 무정보 사전분포(Non-informative prior distribution)에 알아볼 것이다. 관심있는 모수에 대한 정보를 주고 싶지 않다면, 모수의 모든 가능한 값들에 동일한 가중치를 부여하는 것이 합리적일 것이다. 따라서 사전분포로 균등분포를 사용할 것이다. 이를 적용하여 다음의 상황에 대해 생각해보자. ▷ 균등분포는 베타분포의 특이한 경우이다. 이를 이용하여, ESS(Effective Sample Size)를 구할 수 있다. 즉, 2개의 샘플만큼 사후분포에 영향을 미치므로 완전한 무정보 사전분포라고 할 수 없다. 데이터에만 종속적인(Dependent) 사후분포를 추정하기 위해 ESS를 줄여보자. ▷ 사전분포의 두 모수를 0으로 정하여 ESS를 0으로 만들었다. ESS가 0인 무정보 사전분포를 사..

스파크(Spark) 설치 윈도우 10 환경에서 스파크(Spark) 설치 방법에 대해서 알아볼 것이다. 스파크를 설치하기 위해 자바(Java)와 스칼라(Scala)가 필요하다. 반드시 자바와 스칼라를 설치한 후, 스파크를 설치하도록 하자. 스칼라의 설치 방법은 아래의 링크를 통해 할 수 있으니, 필요하면 참고하도록 하자. [Scala & Spark] 01. 스칼라(Scala) 설치 윈도우 10 환경에서 스칼라(Scalar) 설치 방법에 대해서 알아볼 것이다. 스칼라는 자바(Java)를 기반으로 하기 때문에 자바(1.8 버전 이상)를 반드시 설치해야 한다. 반드시 자바를 설치한 후, 스칼라� rooney-song.tistory.com 1. 스파크 다운로드 및 설치 (1) 여기(http://spark.apache.org/downloa..

다양한 켤레사전분포(Conjugate prior distribution) 문제를 통해 다양한 켤레사전분포(Conjugate prior distribution)에 대해 알아보자. 문제 1) 10분동안 정류장에 도착하는 버스 수의 분포가 지수분포를 따르고, 지수분포의 모수가 감마분포(alpha = 100, beta = 1000)를 따른다. 10분동안 12대의 버스가 도착하였다. 이때, 사후분포와 사후평균을 구하여라. 풀이) ▷ 사후분포는 alpha가 101, beta가 1012인 감마분포이다. 사전분포와 사후분포가 감마 분포를 따르므로 켤레사전분포라고 할 수 있다. ▷ 사전분포의 ESS(Effective Sample Size)는 alpha와 beta의 합이므로, 1100이다. ▷ 사후평균은 0.0998로 거의 변화가 없는 것으로 나타났다. 이는 ESS가 데이터의 개수에 비해 압도..

스칼라(Scala) 설치 윈도우 10 환경에서 스칼라(Scalar) 설치 방법에 대해서 알아볼 것이다. 스칼라는 자바(Java)를 기반으로 하기 때문에 자바(Java)를 반드시 설치해야 한다. 자바는 Java SE 8, JDK 8, JRE8 중 하나를 설치하도록 하자. 자바를 설치한 후, 스칼라를 설치하도록 하자. 1. 스칼라 다운로드 및 설치 (1) 여기(https://www.scala-lang.org/download/)로 들어가 [Download the Scala binaries for windows]를 선택한다. (2) 다운받은 "scala-2.13.3.msi"를 실행하여 설치한다. (2-1) 만약 스파크(Spark)를 사용하기 위해 스칼라를 설치하는 경우, 경로 설정을 다르게 해주어야 한다. 경로를 직접 지정하지 않으면 ..

사후평균(Posterior mean)과 ESS(Effective Sample Size) 문제를 통해 사후평균(Posterior mean)과 ESS(Effective Sample Size)에 대해 알아보자. 문제 1) 사전분포가 베타분포를 따르고 가능도 함수가 베르누이 분포를 따를 때, 사후분포의 평균과 ESS를 구하여라. 풀이) ▷ 사후평균은 사전분포의 평균과 데이터 평균의 가중평균(Weighted average)으로 나타낼 수 있다. 데이터 가중치의 분자는 표본크기, 사전분포 가중치의 분자는 alpha와 beta의 합이다. 이때, ESS는 사전평균 가중치의 분자인 alpha와 beta의 합이다. 즉, ESS란 사전평균이 사후평균에 반영되는 비중을 샘플 개수로 나타낸 것이다. ▶ ESS가 커지면 사후평균에서 사전평균의 비중이 커지고 데이터 평균의 비중이 줄어든다. 즉, 사전정보가 사후분포에..

켤레사전분포(Conjugate prior distribution) 켤레사전분포(Conjugate prior distribution)에 대해 알아볼 것이다. 다룰 내용은 다음과 같다. 1. 켤레사전분포의 정의 2. 켤레사전분포의 예제 1. 켤레사전분포의 정의 켤레사전분포의 정의는 다음과 같다. ▷ 즉, 사전분포(Prior distribution)와 사후분포(Posterior distribution)가 동일한 분포족에 속하면 사전분포를 켤레사전분포라고 한다. ▷ 켤레사전분포를 사용하는 이유는 사후분포의 계산이 편리해지기 때문이다. 대표적 켤레사전분포는 다음과 같다. 2. 켤레사전분포의 예제 문제) 사전분포가 베타분포을 따르고 가능도 함수가 베르누이 분포를 따를 때, 이 사전분포가 켤레사전분포임을 보여라. 풀이) ▷ 위의 결과를 통해 사전분포와 사후분포가 베타분포를 따르는 ..

인공신경망(Artificial Neural Network) 구현 MNIST 데이터의 손글씨로 적힌 숫자 이미지를 분류하는 다중 분류(Multiclass classification) 문제를 다룰 것이다. 데이터는 여기(https://www.kaggle.com/c/digit-recognizer)에서 얻을 수 있다. 파이토치를 이용하여 인공신경망(Artificial Neural Network)을 구현할 것이다. 구현 과정은 다음과 같다. 1. 데이터 입력 및 확인 2. 데이터 전처리 3. 모델 설정 4. 데이터 학습 및 검증 1. 데이터 입력 및 확인 In: import numpy as np import pandas as pd from sklearn.model_selection import train_test_split import torch import torch.nn ..

사전예측분포와 사후예측분포(Prior and posterior predictive distribution) 사전예측분포(Prior predictive distribution)와 사후예측분포(Posterior predictive distribution)에 대해 알아볼 것이다. 다룰 내용은 다음과 같다. 1. 사전예측분포와 사후예측분포의 정의 2. 사전예측분포와 사후예측분포의 예제 1. 사전예측분포와 사후예측분포의 정의 ▷ 사전예측분포는 베이즈 정리를 이용하여 구하면, 사전분포와 가능도 함수의 곱을 적분한 형태로 정의된다. 즉, theta에 대한 가능도 함수의 평균이라 할 수 있다. ▷ 사후예측분포는 베이즈 정리를 이용하여 구할 수 있다. 이때, 일반적으로 관측 결과인 x와 확률 변수 x tilde의 관계는 독립이라 가정하기 때문에, theta의 사후분포와 가능도 함수의 곱을 적분한 형태로 정의된다. theta의..

신용구간(Credible interval) 신용구간(Credible interval)에 대해 알아볼 것이다. 다룰 내용은 다음과 같다. 1. 신용구간의 정의 2. 신용구간의 예제 1. 신용구간의 정의 신용구간의 정의는 다음과 같다. ▷ 빈도주의(Frequentist) 관점에서는 모수가 고정되어 있기 때문에 신뢰구간(Confidence interval)에 대한 해석이 우리의 직관과 맞지 않는 문제가 발생한다. 신용구간은 모수에 대한 사후분포를 가정하고 있기 때문에 신용구간의 해석이 우리의 직관과 일치한다. 즉, 모수가 해당 신용구간에 대해 존재할 확률에 대한 해석이 가능하다. 2. 신용구간의 예제 문제) 동전의 앞면이 나올 확률이 균일분포를 따르고, 가능도 함수는 베르누이 분포을 따른다. 이 때, 동전을 던졌더니 앞면이 나왔다. 이 결과를 이용하여..

클래스(Class)의 인자 및 메소드(Method) 파이썬의 자료 구조인 클래스(Class)의 인자 및 메소드(Method) 대해 알아볼 것이다. 다룰 내용으로는 다음과 같다. 1. self 인자 2. __init__() 메소드 3. super() 메소드 1. self 인자 In: class test_class: def test_fun_1(): print('Function 1') def test_fun_2(self): print('Function 2') t_c = test_class() t_c.test_fun_1() Out: --------------------------------------------------------------------------- TypeError Traceback (most recent call last) in 1 t_c =..

빈도주의 추론(Frequentist inference) 빈도주의(Frequentist) 관점의 추론(Inference)에 대해 알아볼 것이다. 다룰 내용은 다음과 같다. 1. 가능도(Likelihood)와 MLE(Maximum Likelihood Estimation) 2. 신뢰구간(Confidence interval) 1. 가능도와 MLE 베르누이 분포의 가능도 함수를 구해보자. ▷ P(X tilde)와 가능도 함수인 L(theta | X tilde)의 결과는 같지만, 가능도 함수는 y에 대한 함수가 아닌 theta에 대한 함수라는 점에서 다르다. 즉, 가능도란 모수에 대한 함수로써 모수가 주어졌을 때, 관측값에 대해 부여하는 확률을 의미한다. 빈도주의 관점에서 모수를 추정하기 위한 대표적인 방법으로는 MLE가 있다. MLE를 통해 베르누이 분포의 모수를 추..

자동 미분(Automatic differentiation) 사용법 파이토치의 자동 미분(Auto differentiation)을 이용한 변화도(Gradient) 계산 방법을 알아볼 것이다. 다룰 내용은 다음과 같다. 1. 자동 미분 준비 2. 변화도 계산 1. 자동 미분 준비 In: import torch x = torch.ones(2, 2, requires_grad = True) print(x) Out: tensor([[1., 1.], [1., 1.]], requires_grad=True) ▷ torch.ones()에 텐서 크기에 대한 인자와 requires_grad 인자를 주어 텐서를 생성하였다. 결과 창에 requires_grad=True가 나타난 것을 볼 수 있는데, 이는 이후 역전파 과정을 수행 후, 해당 텐서의 변화도를 구할 수 있도록 한다. In: y = ..

이전 1 ··· 4 5 6 7 8 다음

티스토리툴바