| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- #abc 프로젝트 멘토링 #유클리드소프트 #고용노동부 #대한상공회의소 #미래내일일경험사업 #공부일지 #멘토링일지
- #abc부트캠프 #유클리드소프트 #고용노동부 #대한상공회의소 #미래내일일경험사업
- Today
- Total
나른한 코딩 생활
[17일차] ABC 부트캠프 빅데이터 분석 및 기초 통계 & 딥러닝 본문
어제까지 장황했던 데이터 크롤링 파트가 끝이 났다
오늘부터는 '인공지능' 이라는 새로운 주제와 새로운 강사님과 함께 공부해볼 것이다.
Python의 활용
파이썬 - C 언어 기반의 언어
그럼 C 언어는?
-> 인터프린트 언어 ---> 느리다
머신러닝을 통해 뽑아내는것 : 파라매터
이를(웨이트) 뽑아낸 다음 다른 언어에서 공격적으로 사용
라이브러리가 많다는 특징
But 실무에서는 소스코드가 텍스트 형식이라 사용하기 힘들다
우선순위
1.명사
2.동사
Column 과 웨이터가 곱해져 나온 값이 급수
요즘 대세는 float 연산을 잘 쓰지 않는다
나눗셈 자체가 컴퓨터에는 부담되는 연산이기 때문 -> 부동소수점 연산이 오류가 심함
self 가 없다 : 함수
self 가 있다 : 메소드
argument : 전달인자
label == 정답 == target
머신러닝

DATA
- Tabular : 머신러닝에서 사용되는 데이터셋 ( ex. 엑셀 같은 테이블 형식, csv, tsv, xml, json )
- Image: Still Image / Video
- Sequential : Time-Series(주식, 번역) / Sound
- Data Procssing
- Exploratory Data Analysis
- Feature Engineering ( 확증을 얻기 )
- Machine Learning
머신러닝 : 최적화 알고리즘
딥러닝 : 다 때려박기 -> 수학적으로 완성된 모델은 아니다
통계학
= > 표본과 모집단
표본을 얻는 과정
- 확률변수
- 확률적 법칙에 따라서 변화하는 값
- 데이터는 수치화하는 것이 중요함
ex) 호수에서 물고기 잡기 예 -> 각기 다른 종의 5마리의 물고기중 하나를 잡을 확률
표본을 얻는 과정의 추상화
- 확률 probability Notation
- p(데이터) : 어떤 데이터를 얻을 수 있는 확률
- "물고기의 Length { 1/5, 1/5, 1/5m}"
변수의 종류
- 질적 변수 : 선택이 필요한 변수 , 종류를 구별하기 위한 변수
- 양적 변수 : 양을 표현하는 변수( 예 시험점수, 신장)
질적변수중에서 남성, 여성, 흡연여부 처럼 2개뿐인 변수 -2진변수
시험점수, 신장같은 양을 표현하는 변수 - 양적변수
좋은 데이터 표현방식 : 남성, 여성은 질적 변수이지만, 데이터에게 컴퓨터가 인식을 편하게 하기 위해서
남성:0, 여성:1 처럼 숫자로 표현 하는것이 더 좋다.
척도 수준
비례 척도를 해주는게 데이터 분석에 좋다
이산형 변수
- 하나하나의 값을 취하는 변수
- 서로 인접한 숫자 사이에 값이 존재하지 않음
- 주사위의 눈, 결석 횟수, 결석 학생 수
연속형 변수
- 연속적인 값을 취할 수 있는 변수
- 어떤 두 숫자 사이에도 반드시 숫자가 존재
- 길이, 무게, 시간
- (주의) 실제로 다루는 데이터들은 연속형 변수라도 정밀도에 한계가 있어 , 띄엄띄엄 떨어지는 이산형변수로 표현할 수 밖에 없음. 예를 들면 50.3kg 와 50.4kg 사이에는 숫자가 없으므로 이산형이지만, 이런경우는 연속형 자료로 표현
XOR
False XOR False = True
True XOR False = False
서로 다르면 1, 같으면 0
선을 한개 쓰려면 선형이라 불가 그래서 직선형 선을 2개 사용 ( 한개를 추가 )해서 XOR 완
Regression, 회귀
- 회귀(regression)는 주어진 입력-출력 쌍을 학습한 후에 새로운 입력값이 들어왔 을 때, 합리적인 출력값을 예측
- 회귀는 입력(x)과 출력(y)이 주어질 때, 입력에서 출력으로의 매핑 함수를 학습 하는 것이라 할 수 있다
함수
- 클래스 Class
- 함수 Function
- 모듈 Module
- 메모리 Heap
- 객체 함수형 프로그램 OOP
함수 안에 클래스가 들어가 있으면 함수 지향형
class Int :
def hello():
print(f"Hello")
a = Int()
a.hello()
# --------- 다른 파일
import a
a.hello()
# a -> 모듈 안에 있는 hello() 함수를 실행
오늘 포스트한 내용들은 수업 시간 동안 배웠던 많은 양의 정보를 간략화 해둔 것이다
적어도 이 내용들은 익히고 앞으로의 과정들을 수행할 필요가 있다
'ABC 부트캠프' 카테고리의 다른 글
| [19일차] ABC 부트캠프 머신러닝 - MachinLearning (0) | 2024.07.21 |
|---|---|
| [18일차] ABC 부트캠프 선형회귀 (0) | 2024.07.21 |
| [16일차] ABC 부트캠프 데이터 수집 시각화 조별 발표 (2) | 2024.07.20 |
| [15일차] ABC 부트캠프 취업역량강화 (1) | 2024.07.14 |
| [14일차] ABC 부트캠프 이미지 크롤링 (0) | 2024.07.13 |