나른한 코딩 생활

[17일차] ABC 부트캠프 빅데이터 분석 및 기초 통계 & 딥러닝 본문

ABC 부트캠프

[17일차] ABC 부트캠프 빅데이터 분석 및 기초 통계 & 딥러닝

GerHerMo 2024. 7. 20. 20:41

어제까지 장황했던 데이터 크롤링 파트가 끝이 났다

 

오늘부터는 '인공지능' 이라는 새로운 주제와 새로운 강사님과 함께 공부해볼 것이다.


Python의 활용

파이썬 - C 언어 기반의 언어

 

그럼 C 언어는?

-> 인터프린트 언어 ---> 느리다

 

머신러닝을 통해 뽑아내는것 : 파라매터

 

이를(웨이트) 뽑아낸 다음 다른 언어에서 공격적으로 사용

라이브러리가 많다는 특징

 

But 실무에서는 소스코드가 텍스트 형식이라 사용하기 힘들다

 

 

우선순위

1.명사

2.동사

 

Column 과 웨이터가 곱해져 나온 값이 급수

 

요즘 대세는 float 연산을 잘 쓰지 않는다

나눗셈 자체가 컴퓨터에는 부담되는 연산이기 때문 -> 부동소수점 연산이 오류가 심함

 

self 가 없다 : 함수

self 가 있다 : 메소드

argument : 전달인자

 

label == 정답 == target 


머신러닝

 

 

DATA

  • Tabular : 머신러닝에서 사용되는 데이터셋 ( ex. 엑셀 같은 테이블 형식, csv, tsv, xml, json )
  • Image: Still Image / Video
  • Sequential : Time-Series(주식, 번역) / Sound

 

  1. Data Procssing
  2. Exploratory Data Analysis
  3. Feature Engineering ( 확증을 얻기 )
  4. Machine Learning

 

머신러닝 : 최적화 알고리즘

딥러닝 : 다 때려박기 -> 수학적으로 완성된 모델은 아니다


통계학

= > 표본과 모집단

 

표본을 얻는 과정

  • 확률변수
  • 확률적 법칙에 따라서 변화하는 값
  • 데이터는 수치화하는 것이 중요함

ex) 호수에서 물고기 잡기 예 -> 각기 다른 종의 5마리의 물고기중 하나를 잡을 확률

 

표본을 얻는 과정의 추상화

  • 확률 probability Notation
  • p(데이터) : 어떤 데이터를 얻을 수 있는 확률
  • "물고기의 Length { 1/5, 1/5, 1/5m}"

변수의 종류

  • 질적 변수 : 선택이 필요한 변수 , 종류를 구별하기 위한 변수
  • 양적 변수 : 양을 표현하는 변수( 예 시험점수, 신장)

 

 

질적변수중에서 남성, 여성, 흡연여부 처럼 2개뿐인 변수 -2진변수

시험점수, 신장같은 양을 표현하는 변수 - 양적변수

 

좋은 데이터 표현방식 : 남성, 여성은 질적 변수이지만, 데이터에게 컴퓨터가 인식을 편하게 하기 위해서

남성:0, 여성:1 처럼 숫자로 표현 하는것이 더 좋다.

 

척도 수준

비례 척도를 해주는게 데이터 분석에 좋다

 

이산형 변수

  • 하나하나의 값을 취하는 변수
  • 서로 인접한 숫자 사이에 값이 존재하지 않음
  • 주사위의 눈, 결석 횟수, 결석 학생 수

 

연속형 변수

  • 연속적인 값을 취할 수 있는 변수
  • 어떤 두 숫자 사이에도 반드시 숫자가 존재
  • 길이, 무게, 시간
  • (주의) 실제로 다루는 데이터들은 연속형 변수라도 정밀도에 한계가 있어 , 띄엄띄엄 떨어지는 이산형변수로 표현할 수 밖에 없음. 예를 들면 50.3kg 와 50.4kg 사이에는 숫자가 없으므로 이산형이지만, 이런경우는 연속형 자료로 표현

XOR

False XOR False = True

True XOR False = False

 

서로 다르면 1, 같으면 0 

 

선을 한개 쓰려면 선형이라 불가 그래서 직선형 선을 2개 사용 ( 한개를 추가 )해서 XOR 완

 


Regression, 회귀

  • 회귀(regression)는 주어진 입력-출력 쌍을 학습한 후에 새로운 입력값이 들어왔 을 때, 합리적인 출력값을 예측
  • 회귀는 입력(x)과 출력(y)이 주어질 때, 입력에서 출력으로의 매핑 함수를 학습 하는 것이라 할 수 있다

함수

  • 클래스 Class
  • 함수 Function
  • 모듈 Module
  • 메모리 Heap 
  • 객체 함수형 프로그램 OOP

함수 안에 클래스가 들어가 있으면 함수 지향형

 

class Int : 
    def hello():
    print(f"Hello")
a = Int()
a.hello()

# --------- 다른 파일

import a 

a.hello()
# a ->  모듈 안에 있는 hello() 함수를 실행

 

오늘 포스트한 내용들은 수업 시간 동안 배웠던 많은 양의 정보를 간략화 해둔 것이다

 

적어도 이 내용들은 익히고 앞으로의 과정들을 수행할 필요가 있다