Home
Syshin
Cancel

Sesac 혼공 머신러닝+딥러닝 정리

## #RMSE Root Mean Squared Error (RMSE) \(\sqrt{\frac{1}{n}\sum_{i=1}^{n}((y-\widehat{y})^2)}\) 해석: 예측 오차의 크기를 직관적으로 해석하기 쉽게 만드 값이 낮을수록 모델의 성능이 좋다 #MSE Mean Squared Er...

[SeSAC]혼공 머신러닝+딥러닝 Ch5. 트리 알고리즘

05-1 결정 트리 Information Gain (정보 이득) 정의: Information Gain은 어떤 속성을 기준으로 데이터를 분할했을 때 얻을 수 있는 엔트로피의 감소량이다. 결정 트리 알고리즘에서는 Information Gain이 최대가 되는 속성으로 데이터를 분할한다. 수식: \(\text{Information Gain} = ...

기술 정리

데이터베이스 (DB): 관계형 데이터베이스 (RDBMS): PostgreSQL: 오픈 소스 RDBMS: JSON 지원, 풀 텍스트 검색, 저장 프로시저 등의 고급 기능을 포함한다 대규모 데이터 처리: 복잡한 쿼리 처리와 대규모 데이터 저장에 적합하다 확장성: 여러 확장 기능과 플러그인을 통해 기능을 확장할 수 있다 안정성: 트랜잭션,...

[lvl3]합승 택시 요금

출처: [Programmers > 코딩테스트 연습 >2021 KAKAO BLIND RECRUITMENT > 합승 택시 요금 (https://school.programmers.co.kr/learn/courses/30/lessons/72413) 문제 설명: [본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.] 밤늦게 귀...

[PCCP]3일차

구구단 만드는 법 from pprint import pprint gugudan = [] for i in range(2, 10): temp = [] for j in range(1, 10): temp.append(j*i) gugudan.append(temp) pprint(gugudan) ...

[SeSAC]Roboflow

Roboflow 얀 르쿤(Yann LeCun): Convolutional Neural Network 창시자, 페이스북 FAIR 설립자 MNIST 특이점이 온다: 레이 커즈와일 책 딥러닝 영상처리 AI Project Cycle Problem Scoping Data Acquisition Data Exploration ...

[SeSAC]혼공 머신러닝+딥러닝 Ch3, 4

복습 인공지능의 세가지 지도학습 데이터와 라벨을 줌 비지도학습 라벨을 주지 않음 강화학습 데이터가 없음 지도학습 출력값에 따른 분류 회귀 연속적 수치 ...

빅데이터의 다음 단계는 예측 분석이다

빅데이터의 다음 단계는 예측 분석이다 기계학습 컴퓨터에 명시적으로 프로그래밍 하지 않고 학습할 수 있는 영역 (Arthur Samuel , 1959) 만약 작업 T에 대해 기준 P로 측정한 성능이 E로 인해 향상되었다면, 그 프로그램은 작업 T에 대해 P의 관점에서 경험 E로부터 “배웠다”라고 말할 수 있다. (Tom Mitchell, Mac...

[SeSAC]파이썬 라이브러리를 활용한 데이터분석-3

데이터분석 프로젝트 과정 EDA(Exploratory Data Analysis) “탐색적 데이터분석은 우리가 존재한다고” 데이터과학 과정의 핵심적인 부분으로 데이터에 대한 이해를 높이는것 모델링에 앞서 선행되는 작업으로 데이터의 분포나 변수간 관계 파악 EDA의 기본 도구는 도표(plot), 그래프(graph), 요약통계(...

[SeSAC]파이썬 라이브러리를 활용한 데이터분석-2

Intro: Chapter 4. 넘파이 기본: 배열과 벡터 연산 Chapter 5. Pandas 기초 개념 import numpy as np import pandas as pd logx = np.logspace(0, 1, 100) linx = np.linspace(0, 10, 100) df = pd.DataFrame() df['logspace...