전체 글(148)
-
0518목 ADsP 틀린 것
1. 데이터 이해 01. 데이터의 이해 (1) 데이터와 정보 # 데이터의 유형 정량적 데이터 : 수치, 도형, 기호 정상적 데이터 : 언어, 문자 # DIKW 피라미드 데이터 : 개별 데이터 자체로는 의미가 중요하지 않은 객관적 사실 정보 : 데이터의 가공, 상관관계 간 이해를 토대로 패턴을 인식하고 그 의미 부여한 데이터 지식 도출할 때 사용하는 데이터 지식 : 상호 연결된 정보의 패턴 이해를 기반으로 예측한 결과물 ex.사야겠다 지혜 : 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어 ex.대체로 (2) 데이터베이스의 정의와 특징 # DBMS 관계형 - 데이터 모델은 간단하여 이해하기 쉬우며 데이터의 저장 위치와 접근 방법은 DBMS가 결정 - 행과 열로 구성된 2차원 테이블에 데이터..
2023.05.18 -
230515 ADsP 틀린 것 모음
1. 데이터 이해 01. 데이터의 이해 (1) 데이터와 정보 # 데이터의 정의 개별 데이터 자체로서 의미가 중요하지 않은 객관적 사실 객관적 사실이라는 존재적 특성 있음 다른 데이터와의 상관관계 없음 추론과 추정의 근거를 이루는 사실 # 데이터의 유형 정량적 데이터 : 수치, 도형, 기호 정상적 데이터 : 언어, 문자 # DIKW 피라미드 데이터 : 개별 데이터 자체로는 의미가 중요하지 않은 객관적 사실 정보 : 데이터의 가공, 상관관계 간 이해를 토대로 패턴을 인식하고 그 의미 부여한 데이터 지식 도출할 때 사용하는 데이터 지식 : 상호 연결된 정보의 패턴 이해를 기반으로 예측한 결과물 지혜 : 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어 ex.대체로 # 데이터 비식별화 처리기법 가..
2023.05.15 -
[54일차] 군집 알고리즘
1. 군집 알고리즘 2. k-평균 3. 주성분 분석 1. 군집 알고리즘 1. 타깃을 모르는 비지도 학습 📌 비지도 학습 : 타깃이 없을 때, 사용하는 머신러닝 알고리즘 2. 과일 사진 데이터 준비하기 💻 넘파이에서 파일 읽기 위해 코랩으로 다운로드 !wget https://bit.ly/fruits_300_data -O fruits_300.npy 💻 넘파이와 맷플롯립 패키지 임포트 import numpy as np import matplotlib.pyplot as plt 📍 load() 메서드 : 넘파이에서 npy 파일 로드 fruits = np.load('fruits_300.npy') 💻 fruits 타입 확인 및 배열의 크기 확인 type(fruits) >>> numpy.ndarray print(fru..
2023.03.10 -
[53일차] 트리 알고리즘
1. 결정트리 1. 로지스틱 회귀로 와인 분류하기 💻 데이터 컴온 import pandas as pd wine = pd.read_csv('https://bit.ly/wine_csv_data') wine.head() 📍 info() : 데이터프레임 전체를 돌아다니면서 해당 요약값을 만들어줌 (pandas) wine.info() >>> RangeIndex: 6497 entries, 0 to 6496 Data columns (total 4 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 alcohol 6497 non-null float64 1 sugar 6497 non-null float64 2 pH 6497 non-null ..
2023.03.09 -
[52일차] 다양한 분류 알고리즘
1. 로지스틱 회귀 💻 데이터 준비 import pandas as pd fish = pd.read_csv('https://bit.ly/fish_csv_data') 📍 read_csv() : pandas의 CSV 파일을 데이터프레임으로 변환해주는 함수 📌 k-최근접 이웃 분류기의 단점 : 훈련 세트의 범위를 벗어나면, 예측이 불가하다. 📍 unique() 함수 : 열이 갖고 있는 값을 중복값을 제외하고 알 수 있음 💻 생선의 종류 확인 # 어떤 종류의 생선 있는지 확인 print(pd.unique(fish['Species'])) >>> ['Bream' 'Roach' 'Whitefish' 'Parkki' 'Perch' 'Pike' 'Smelt'] 💻 종류를 제외한 나머지를 훈련 데이터로 넘파이 배열로 생성 ..
2023.03.08 -
[51일차] 회귀 알고리즘과 모델 규제
1. k-최근접 이웃 회귀 2. 선형 회귀 3. 특성 공학과 규제 1. k-최근접 이웃 회귀 1. k-최근접 이웃 회귀 지도 학습 알고리즘 분류 : 샘플을 몇 개의 클래스 중 하나로 분류 회귀 : 클래스 중 하나로 분류하는 것이 아니라 임의의 어떤 숫자 예측 k-최근접 이웃 알고리즘 : 예측하려는 샘플에 가장 가까운 샘플 k개를 선택 ➡ 샘플들의 클래스 확인하여 다수 클래스를 새로운 샘플의 클래스로 예측 k-최근접 이웃 회귀 : 예측하려는 샘플에 가장 가까운 샘플 k개 선택 ➡ 이웃한 샘플들의 평균을 구해 수치 예측 2. 데이터 준비 💻 (농어 데이터) 훈련 데이터 준비 후 산점도 import numpy as np perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17..
2023.03.07