전체 글 381

SeSAC 7일차 / 자바 기초(변수, 연산)

SeSAC 7일차(2023-07-25) 자바 기초(변수, 연산) 컴퓨터 구조 - CPU 명령어를 해석하여 실행하는 하드웨어 - 주기억장치(Memory) 실행되고 있는 프로그램의 데이터를 저장하기 위한 기억장치 - 보조기억장치(Disk) 프로그램을 실행시키기 위해 각종 데이터를 저장하기 위한 기억장치 - GPU 그래픽 연산을 빠르게 처리하여 결과값을 모니터에 출력하는 연산 장치 - 운영체제 하드웨어, 시스템 리소스를 제어하여 사용자에게 인터페이스 제공 커널 영역에서 프로세스와 스레드, 스케줄러, 파일관리자 등을 통해 프로그램 실행 관리 Window, Max os, Linux 등이 대표적인 OS - 셸 프롬포트 운영체제 상의 다양한 기능과 서비스를 사용자가 사용할 수 있게 제공되는 인터페이스 자바의 실행 구..

SeSAC 6일차 / SQL 기본(SQL 문-5)

SeSAC 6일차(2023-07-24) SQL 기본(SQL 문-5) 데이터 조작 - INSERT 문 각 열에 대한 값이 포함된 새 행 삽입 기본 형태) INSERT INTO table [(column [, column…])] VALUES (value [, value…]); - UPDATE 문 테이블의 데이터 변경 기본 형태) UPDATE table SET column = value [, column = value, …] [WHERE condition]; - DELETE 문 테이블에서 행 삭제 ex) DELETE FROM table_name WHERE condition; DELETE FROM table_name; - TRUNCATE 문 테이블에서 모든 행을 제거하지만 테이블 구조는 그대로 존재한다. ex)..

혼자 공부하는 머신러닝+딥러닝 / Chapter 04 다양한 분류 알고리즘

Chapter 04-1 로지스틱 회귀 데이터프레임(dataframe): 판다스에서 제공하는 2차원 표 형식의 데이터 구조 데이터프레임에서 열을 선택하는 방법은 원하는 열을 리스트로 나열한다. 다중 분류(multi-class classification): 타깃 데이터에 2개 이상의 클래스가 포함된 문제 정렬된 타깃값은 classes_ 속성에 저장되어 있다. - 함수 모음 unique(): 열에서 고유한 값을 추출하는 함수 proba(): 클래스별 확률값을 반환하는 메서드 코랩 실습 화면 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler fr..

SeSAC 5일차 / SQL 기본(SQL 문-4)

SeSAC 5일차(2023-07-21) SQL 기본(SQL 문-4) Subquery를 사용하여 Query 해결 - Subquery Main query 전에 먼저 실행되고 결과는 main query에서 사용된다. Subquery는 괄호로 묶고 비교 조건 오른쪽에 배치한다. AND 절로 Subquery 두 개 이상 적을 수도 있다. ex) SELECT column1, column2 FROM table WHERE column1 = (SELECT column1 FROM table WHERE column3 = 166); - 단일 행 Subquery =, >, >=,

SeSAC 4일차 / SQL 기본(SQL 문-3)

SeSAC 4일차(2023-07-20) SQL 기본(SQL 문-3) 그룹 함수를 사용한 집계 데이터 보고 - 그룹 함수 행 집합 연산을 수행하여 그룹 별로 하나의 결과 산출 SELECT 절에서 사용, NULL 값 무시 AVG, COUNT, MAX, MIN, STDDEV, SUM, VARIANCE 등 ex) SELECT COUNT(column_name) => Null이 아닌 값을 가진 행의 수 반환 SELECT COUNT(*) => 중복, null 포함한 행의 수 반환 SELECT COUNT(DISTINCT column_name) => Null이 아닌 unique 값의 수 반환 GROUP BY 절, HAVING 절 - GROUP BY 테이블의 행을 더 작은 그룹으로 나눌 수 있다. HAVING 절로 조건을..

SeSAC 3일차 / SQL 기본(SQL 문-2)

SeSAC 3일차(2023-07-19) SQL 기본(SQL 문-2) - 오라클 연결 Run SQL Command Line 실행 후 conn hr/hr 입력 데이터 제한 WHERE 절 - 비교 연산자 =, , >, >=, SA_AAA 형태로 검색 AND, OR 연산자: WHERE 절 밑에 작성 데이터 정렬 ORDER BY 절 - ORDER BY 행을 정렬한다. SELECT 문의 마지막에 작성 ASC는 오름차순(기본값), DESC는 내림차순 치환변수: & 및 && 치환을 사용하여 값을 임시로 저장 변수 앞에 &를 붙이면 유저가 값을 입력하도록 할 수 있다. 유저가 매번 값을 입력할 필요 없이 변수 값 재사용 경우는 &&를 사용 DEFINE 명령어: 변수를 생성하고 값을 할당, UNDEFINE 명령을 사용하여..

SeSAC 2일차 / SQL 기본(커맨드 명령, SQL 문-1)

SeSAC 2일차(2023-07-18) SQL 기본(커맨드 명령, SQL 문-1) - 오라클 다운로드 및 연결 Run SQL Command Line 창에서 conn hr/hr SQL SQL(Structured Query Language): 관계형 데이터베이스 처리 언어 SQL*PLUS: SQL언어를 구현하여 오라클 RDBMS를 관리할 수 있는 CLEINT TOOL SQL 명령: 데이터베이스의 데이터 및 테이블 조작 모든 명령의 끝은 세미콜론으로 끝나야 한다. 가장 최근의 SQL 명령은 SQL 버퍼에 남아있다. (list 입력 시 최근 명령 출력) 비절차적 언어이다. Table 구조 - Table 구조 확인 SQL> DESC[RIBE] table_name Editing Commands - 직전 수행한 SQ..

SeSAC 1일차 / 데이터베이스 개론

SeSAC 1일차(2023-07-17) 데이터베이스 개론 데이터(Data): 관찰의 결과로 나타난 정량적 혹은 정성적인 실제 값 정보(Information): 데이터에 의미를 부여한 것 지식(Knowledge): 사물이나 현상에 대한 이해 데이터베이스(Database) - 데이터베이스(Database) 정보의 조직화된 집합체 논리적으로 연관된 데이터를 모아 구조적으로 통합해 놓은 것 검색과 변경 빈도가 적을수록 구축이 쉽고, 많을수록 어려움. - 데이터베이스의 개념 통합된 데이터(integrated data): 여러 곳에서 사용하던 데이터를 통합해서 하나로 저장한 데이터, 데이터 중복 최소화 저장된 데이터(stored data): 컴퓨터 보조기억장치에 저장 운영 데이터(operational data): ..

혼자 공부하는 머신러닝+딥러닝 / Chapter 03 회귀 알고리즘과 모델 규제

Chapter 03-1 k-최근접 이웃 회귀 - 회귀 (regression) 임의의 어떤 숫자를 예측하는 문제, 정해진 클래스가 없고 임의의 수치를 출력한다. ex) 경제 성장률 예측, 배달이 도착할 시간 예측 - k-최근접 이웃 회귀 가장 가까운 샘플 k개를 선택하고 해당 수치들의 평균을 구함. - 결정계수, R^2 (coefficient of determination) 회귀의 평가 점수 각 샘플의 타깃과 예측한 값의 차이를 제곱하여 더하고 타깃과 타깃 평균의 차이를 제곱하여 더한 값으로 나눈다. 예측이 타깃에 아주 가까워지면 1에 가까운 값이 된다. 코랩 실습 화면 import numpy as np import matplotlib.pyplot as plt from sklearn.model_select..

혼자 공부하는 머신러닝+딥러닝 / Chapter 02 데이터 다루기

Chapter 02-1 훈련 세트와 테스트 세트 - 지도 학습 (supervised learning) 입력(데이터)와 타깃(정답)으로 이루어진 훈련 데이터가 필요 정답을 맞히는 것을 학습한다. - 비지도 학습 (unsupervised learning) 타깃 없이 입력 데이터만 사용 데이터를 잘 파악하거나 변형하는 데 도움을 준다. - 훈련 세트와 테스트 세트 머신러닝의 알고리즘의 성능을 제대로 평가하려면 훈련 데이터와 평가에 사용할 데이터가 각각 달라야 한다. 테스트 세트(test set): 평가에 사용하는 데이터 훈련 세트(train set): 훈련에 사용되는 데이터 - 샘플링 편향 (sampling bias) 샘플링이 한쪽으로 치우쳤다는 의미 - 넘파이 (numpy) 파이썬의 대표적인 배열(array..