본문 바로가기

전체 글175

기계 학습 7. Ensemble Learning and Random Forests 서론 여러 개의 예측기(분류기 또는 회귀기와 같은)의 예측을 종합하면 종종 최상의 개별 예측기보다 더 나은 예측을 얻을 수 있다. 예측기들의 그룹은 앙상블이라고 하며, 이 기술은 앙상블 학습(Ensemble Learning)이라고 불리며, 앙상블 학습 알고리즘은 앙상블 방법(Ensemble method)이라고 한다. 예를 들어, 다른 훈련 세트의 무작위 하위 집합으로 나누어 각각 결정 트리 분류기를 훈련시킬 수 있다. 예측을 수행하기 위해 모든 개별 트리의 예측을 얻은 다음 가장 많은 투표를 받은 클래스를 예측한다. 이러한 결정 트리의 앙상블은 랜덤 포레스트(Random Forests)라고 불리며, 그 간단함에도 불구하고 현재 가장 강력한 머신 러닝 알고리즘 중 하나이다. Voting Classifier.. 2023. 10. 20.
기계 학습 6. 의사 결정 트리(Decision Trees) 서론 의사 결정 트리(Decision Tree)는 데이터를 특성에 따라 분할하여 관측치를 여러 개의 집단으로 나누는 지도 학습 알고리즘이다. 트리 구조에서 각 내부 노드는 특정 특성으로 나누는 분기점을 나타내며, 각 리프 노드는 해당 리프에 속하는 관측치가 특정한 클래스에 속할 확률을 나타낸다. 의사 결정 트리는 데이터를 분할하는 데 있어서 직관적이고 해석하기 쉽다는 장점이 있다. 또한 범주형 및 수치형 데이터를 모두 처리할 수 있는 다목적 알고리즘이기 때문에 널리 사용되는 머신 러닝 알고리즘 중 하나이다. 의사 결정 트리(Decision Tree) SVM과 마찬가지로 의사결정 트리는 분류 및 회귀 작업은 물론 다중 출력 작업까지 수행할 수 있는 다목적 기계 학습 알고리즘이다. 의사결정 트리는 현재 사용.. 2023. 10. 19.
기계 학습 5. Support Vector Machine(SVM) 서론 SVM(Support Vector Machine)은 지도 학습 알고리즘 중 하나로, 주어진 데이터를 기반으로 분류 또는 회귀 분석을 할 수 있는 알고리즘이다. 주로 분류 작업에 사용되며, 결정 경계를 찾고 데이터를 클래스로 분류하는 데 중점을 둔다. SVM은 주어진 데이터를 가장 잘 분류하는 경계를 찾는 것이 목표이며, 이를 위해 데이터 포인트 사이의 간격(마진)을 최대화하려고 노력한다. 이러한 알고리즘은 선형 및 비선형 문제에 모두 적용할 수 있으며, 커널 트릭을 사용하여 고차원 공간으로 데이터를 변환하여 분류 작업을 수행할 수 있다. SVM은 이상치에 강한 경향이 있고, 비교적 적은 데이터로도 잘 일반화될 수 있는 강력한 모델이다. Linear SVM Classification 선형 SVM 분류.. 2023. 10. 19.
기계 학습 4. 회귀(Regression) 분석 서론 학습 모델 중에서 가장 심플한 선형 회귀(Linear Regression) 모델에 대해 우선 살펴보자. 해당 모델은 크게 두 분류로 구분할 수 있다. 훈련 세트에 대해 모델을 가장 잘 맞게 하는 모델 파라미터를 직접 계산하는 "closed-form" 방정식을 사용하는 방식과 경사 하강법(Gradient Descent, GD)이라는 반복적인 최적화 접근 방식을 사용하여 점진적으로 모델 파라미터를 조정하여 훈련 세트 상의 비용 함수를 최소화하도록 하는 방식으로 나뉜다. 이외에 선형 회귀를 이용하여 다항 회귀(Polynomial Regression)를 이해하고 마지막으로 분류 작업에 흔히 사용되는 Logistic Regression과 Softmax Regression 두 가지 모델을 살펴볼 것이다. Li.. 2023. 10. 19.
혼자 가볍게 즐기는 스팀 게임 추천(퍼즐, 스토리) 서론 여가 시간에 친구와 시간이 맞지 않거나 스팀을 즐길 친구가 없을 때 가볍게 즐길 스팀 게임들을 추천한다. 스토리 중심 To the Moon 10,800원, 한국어 지원 임종을 앞둔 한 노인의 과거를 살펴보는 미스터리 롤 플레잉 게임이다. 쯔꾸르 게임의 형태를 지니고 있지만, 스토리와 ost가 뛰어나 2010년대 초 큰 인기를 가졌다. 스토리텔링에 집중된 플레이로 영화 한 편을 보는 듯하다. 감동적인 스토리를 보고 싶은 이들에게 추천한다. Undertale 10,500원, 한국어 지원 괴물들 세계에 떨어진 주인공이 지상으로 올라가기 위한 여정을 담은 퍼즐 게임이다. 일반적으로 플레이어는 싸울 수 있는 상대와는 모두 싸우고 목표를 위해 달려가지만 언더테일에서는 그 괴물들을 죽일지 살릴지를 선택할 수 있.. 2023. 10. 15.
C# 3. 변수와 입력문 서론 C# 프로그래밍에서 변수와 입력문은 중요한 개념으로, 변수는 데이터를 저장하고 처리하는 데 사용되며, 입력문은 프로그램 사용자로부터 데이터를 입력받는 데 도움이 된다. 변수와 입력문은 C# 프로그램을 작성하는 과정에서 핵심적인 부분을 차지하며, 이들을 효과적으로 다루는 것이 프로그램의 동작과 상호작용을 결정한다. 이제 변수와 입력문에 대해 자세히 알아보자. 변수 프로그램에서 값울 다루려면 데이터를 메모리에 잠시 보관해 놓고 사용할 수 있는 임시 저장 공간이 필요하다. 이때 변수를 사용한다. 변수를 사용하기 위해서 먼저 선언해야 한다. 선언할 때 "데이터 형식"과 "데이터 이름"(변수명) 그리고 ";"이 함께 있어야 한다. int number; 데이터 형식 설명 int, long 정수형 데이터 str.. 2023. 10. 4.
인코딩 문제와 해결 서론 팀원들과 협업을 하다보면 인코딩에 대한 문제가 생기곤 한다. 주로 한국어로 주석을 하거나 출력을 할 때 문제가 생긴다. 물론, 프로젝트 이전에 논의해야할 주제 중 하나이지만 늦게 문제를 찾았을 때 인코딩 문제를 해결할 방안에 대해 알아보자. 인코딩( encoding ) 인코딩은 정보나 데이터를 다른 형식으로 변환하는 프로세스로, 데이터 전송, 보안, 압축, 문자 인코딩, 영상 및 음성 처리, 데이터 형식 변환 등 다양한 목적으로 사용된다. 이를 통해 데이터를 정확하고 안전하게 효율적으로 다루고 전달할 수 있다. 이 블로그에서 다루는 문제는 문자 인코딩 문제를 다루고 있다. 인코딩 에러의 원인 팀원간에 협업에서 인코딩 에러의 원인은 주로 Mac, Window의 환경 차이에 있다. Mac은 UTF-8,.. 2023. 9. 27.
게임 리뷰] 원신 1년 플레이 리뷰(스포X) 서론 어느 한 게임을 1년 동안 플레이를 하면 게임 리뷰보다는 현지인의 주관적인 평가라고 볼 수도 있다. 그렇기에 자세한 글을 쓸 수 있다는 장점이 있다. 이 글이 쓰인 시점에서는 원신은 4.0 후반 버전이다. 소개 간단 소개 7가지의 원소를 다루는 세상에서 남매를 찾기 위해 여행을 하는 오픈월드 RPG 가격 무료(인앱결제) 장르 오픈월드 RPG, 판타지 개발사 HOYOVERSE/miHoYo 특징 스토리 원신을 플레이하는 이들에게 왜 원신을 하냐고 물어보면 대체로 스토리가 재미있다는 대답을 들을 수 있다. 현재 매출 1등 게임으로 게임으로 번 돈을 다시 게임이나 플레이어를 위한 이벤트 등에 투자함으로써 원신 초창기보다는 더욱 개선된 메인 및 이벤트 및 스토리를 보여주고 있다. 이러한 스토리의 강점과 원신.. 2023. 9. 22.
기계 학습 3. 분류(Classification) 서론 기계 학습에서 Classification(분류)은 데이터를 미리 정의된 클래스 또는 카테고리로 분류하는 작업을 의미한다. Classification은 데이터 분석, 패턴 인식, 예측 및 의사 결정 등 다양한 분야에서 중요한 역할을 하며, 기계 학습의 주요 응용 분야 중 하나이다. MNIST MNIST(엠니스트) 데이터셋은 70,000개의 손으로 쓴 작은 숫자 이미지로 구성된 데이터이다. 이 데이터셋은 미국 인구조사국의 고등학생과 직원들에 의해 손으로 쓰인 숫자 이미지로, 각 이미지는 해당하는 숫자로 레이블링 되어 있다. Scikit-Learn에서 로드한 데이터셋은 일반적으로 다음과 같은 딕셔너리 구조를 가지고 있으며, 이 안에는 다음과 같은 키(key)들이 포함되어 있다. from sklearn.d.. 2023. 9. 20.
반응형