반응형

전체 글 23

머신 러닝(with Google Colab) - 3일차(1)

Chapter 03 회귀 알고리즘과 모델 규제앞서 머신러닝의 에는 지도학습과 비지도 학습이 있고  지도학습의 알고리즘에는 분류와 회귀가 있다,2일 차에 학습한 것은 데이터의 분류에 의해 데이터를 학습하여 결과를 추측하는 형태였다면회귀는 기존의 데이터의 규칙을 파악하여 임의의 결괏값을 예측하는 것이라고 볼 수 있다.3-1K 최근접 이웃 회귀KNN(K-Nearest Neighbors regression)을 이용하면 분류뿐 아니라 회귀 또한 가능하다.이는 주변값의 평균을 이용하여 회귀를 한다.오늘은 농어의 데이터 값을 바탕으로 농어의 무게를 추측하는 프로그램을 만들어 보자import numpy as np# 농어 데이터 : 회귀 이용perch_length = np.array([8.4, 13.7, 15.0, 16..

머신러닝 2024.10.14

머신 러닝(with Google Colab) - 2일차

계속해서 1일 차에 했던 물고기 분류 머신러닝에 더 자세히 대해 알아보자앞서 했던 머신러닝은 그저 정해진 답에 맞추는 것이었기 때문에 실제 사용하기에는 문제가 있다.이를 해결하기 위한 방법이 머신러닝 알고리즘에 학습을 해주는 것이다. 이를 지도학습이라고 하는데지도학습에서 데이터와 정답을 입력(input)과 타깃(target)이라고 하고 이 둘을 합쳐 훈련 데이터라고 부른다.지도학습을 위해 데이터를 훈련 세트, 테스트 세트로 나누어 주기 앞서 이전에  데이터를 불러와보자fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 3..

머신러닝 2024.10.11

머신 러닝(with Google Colab) - 1일차

본격적으로 머신러닝에 들어가서 간단한 도미와 빙어를 분류하는  머신러닝 예제를 학습해 보자.우선적으로 필요한 정보는  도미와 빙어의 데이터,  학습시킬 특성(피쳐)과 정답(target) 이 필요하다,하나씩 알아가보자도미와 빙어의 데이터#도미 데이터bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0]bream..

머신러닝 2024.10.11

머신 러닝(with Google Colab) - 0일차

머신러닝  0일 차  - Google Colab 사용법머신러닝의 기본 개념들어가기 앞서 우선 머신러닝의 기본 개념을 살펴보자.머신러닝은 알고리즘이 데이터를 분석하여 패턴을 찾아내고, 이를 바탕으로 예측이나 결정을 내리는 과정이다. 기본적으로 머신러닝은 데이터와 모델, 학습 알고리즘의 세 가지 요소로 구성된다.데이터: 머신러닝의 성과는 주어진 데이터의 품질과 양에 크게 의존합니다. 데이터는 다양한 형태(정형 데이터, 비정형 데이터)로 존재할 수 있으며, 필요한 경우 전처리 과정을 통해 분석에 적합한 형태로 가공해야 합니다.모델: 데이터로부터 패턴을 학습하기 위해 사용하는 수학적 구조입니다. 모델의 종류에 따라 예측 결과나 성능이 달라지며, 일반적으로 선형 회귀, 결정 트리, 신경망, 서포트 벡터 머신 등이..

머신러닝 2024.10.11

[응용]BeautifulSoup를 이용한 관심 종목 현재가 구하기

BeautifulSoup는 파이썬에서 웹 페이지 분석을 하는데 매우 유용하게 쓰이는 외부 모듈이다.BeautifulSoup는  웹페어지에서 데이터를 읽는 웹 크롤링에 매우 효과적으로 사용할 수 있다.웹 크롤링은 앞서 말했듯이 크롤링(crawling) 은 웹페이지를 그대로 가져와서 거기서 데이터를 추출해 내는 행위인데흑히 스크랩핑이라고도 부른다.  이는 특정 사이트의 정보를 가져와서 활용하는데 필수적이라고 할 수 있는 기능이다. 우선 관심 종목 현재가 구하기를 하기 위해서 필요한 것들을 생각해 보자1. 현재가 정보를 가져올 사이트2. 현재가 정보를 가져오는 방법으로 크게 2가지를 생각할 수 있다. 우선 1의 경우 우리가 사용하는 검색 사이트에서 쉽게 증권과 관련된 정보를 검색하면 찾을 수 있다. 그렇다면 ..

파이썬 2024.10.11

파이썬 4일차 - 함수

5-1 함수 만들기 함수란?  일반적으로 사용하는 함수는 만들어진 함수를 불러오는 형태이다. 즉 함수를 사용한다는 것은 기록을 불러오는 것이다. 대부분의 함수는 전달값을 요구한다. 전달값은 흔히 "매개변수"라고 불린다.함수를 호출하고 나면 ,함수 호출의 결과로 값이 생기는 경우가 있는데 이런 값을 "리턴값"이라고 한다.아래와 같이 식별자(함수이름) 뒤에 괄호에 넣은 매개변수 값이 함수 내부의 코드를 거쳐 리턴값을 준다.def 함수이름(매개변수):     내용 def는 defnition의 약자로 함수를 정의하겠다는 일종의 선언이다. ()에는 여려 개의 매개변수를 요구할 수 있다. 문장은 추후 함수를 호출했을 때 실핼할 동작을 의미한다. 가변 매개변수 : 매개변수의 개수가 정확히 정해 지지 않았을 때 사용하..

파이썬 2024.10.11

파이썬 GUI 학습(응용) - PyQt5 + 데이터 베이스

PyQt 와 데이터 베이스를 이용하여 아래와 같은과일의 정보를 입력 및 삭제를 할수 있는 인터페이스 생성을 해보자 해당 작업에 들어가기 이전에 가상환경을 통해 필요한 모듈을 설치해 두어야 한다. 가상환경에 설치에 관한 정보는 이전글에서 다루었으니 참고해보면 된다. 위에 인터페이스를 보면 그리드 형태에 인터페이스 창 , 라벨 2개, 입력창  2개,버튼 2개 의 요소가 있는것을 알수 있다.따라서 필요한 모듈을 입력하면 아래와 같다.import sysfrom PyQt5.QtWidgets import QApplication, QMainWindow,QWidget,\ QGridLayout,QLabel,QLineEdit, QPushButtonfrom PyQt5.QtCore import QCoreApplicati..

파이썬 심화 2024.10.08

Google Colab(구글 코랩) - Pandas + 데이터 시각화(matplotlib,seaborn)

Pandas 주로 데이터 분석 및 처리를 위해 쓰이는 오픈 소스 파이썬 라이브러리로, 행과 열로 이루어진 2차원 데이터를 효율적으로 가공/처리할 수 있는 다양한 기능을 제공한다. 판다스는 넘파이를 기반으로 작성되어 있어 넘파이 학습자라면 누구나 쉽게 접근할 수 있다. Pandas 또한 앞서 배운 Numpy와 마찬가지로 파이썬의 기본 패키지가 아니라 따로 설치가 필요하지만 구글 코랩은 지원함1차원 정보처리는 '시리즈'라면 2차원 정보처리는 데이터 프레임을 사용*중요* 데이터 프레임빅데이터 분석과 머신러닝 모델 구축시 주어진 데이터를 바로 사용하는경우보다 데이터를 원하는 형태로 변형하는  '전처리' 작업을 수행하는 경우가 더 많다. 해당작업을 통해 데이터를 사용하기 쉽고 이미지로 변환하기 쉬운 상태로 바꿀수..

Google Colab(구글 코랩) - NumPy

기본적으로 파이썬 학습을 어느정도 할줄 안다면 파이썬을 바탕으로 한 NumPy를 시도해 볼 수 있다. Nompy 넘파이는 오픈 소스 파이썬 라이브러리로 대규모 다차원 배열 테이터 처리를 위한 수치 연산 기능을 제공한다. 데이터 과학 분야 프로그램에서 처리하는 데이터는 대부분 숫자들의 배열로 이루어진 경우가 많기 때문에 넘파이는 무척 유용하게 쓰인다.넘파이는 파이썬 기본 패키지가 아님 따라서 import로 불러서 사용해야한다. 추가적으로 파이썬에서 실행시 설치를해줘야 하지만 colab은 다양한 데이터 사이언스 프로그램을 지원하기때문에 따로 설치가 필요 없다. import numpy as np#ndarray 생성 - 넘파이 배열#1차원 배열arr1 = np.array([1,2,3,4])print(arr1)a..

파이썬 3일차 - 반복문(2)

for 반복문컴퓨터가 사람보다 월등히 뛰어나다고 할 수 있는것은 반복과 관련된 영역일 것이다. 이런 컴퓨터에게 반복을 지시하는것이 반복문 이다.for 반복자 in 반복할수있는것 :(들여쓰기)  코드 *Tip*여기서 잠깐 컴퓨터 코드를 작성할 때 중의 해야 될 점 중 하나는 if문, for문 같은 문법을 사용할 때 그 문법의 내용은 들여 쓰기를 해주어야 해당되는 문법의 내용으로 인식하기 때문에 들여 쓰기를 사용해 주어야 오류를 방지할 수 있다. 들여 쓰기의 경우 보편적으로 4칸 혹은 tap을 이용한다.다시 for 문으로 돌아가서반복자 : 1회 반복을 수행할 때 만다 새로운 값을 저장할 변수반복할 수 있는 것 : 반복 횟수 및 반복자의 값을 정의하는 재료,  문자열이나 반복되는 데이터값반복자는 내가 원하는 ..

파이썬 2024.10.08
반응형