Study/SQL

[SQL로 맛보는 데이터 전처리 분석] SQL 문법 (1)

seongju 2024. 1. 4. 15:18

'SQL로 맛보는 데이터 전처리 분석'으로 공부한 내용을 정리하였다.

 

# SQL 구문

SELECT 컬럼, 계산식

FROM 테이블 명

WHERE 조건

GROUP BY 그룹화

HAVING 그룹화에 사용되는 조건

 

 

# SELECT

1) 컬럼 조회

해당 테이블에서 필요한 컬럼만 출력

SELECT 컬럼 명
FROM DB 명.테이블 명;

 

 

2) 집계 함수

데이터를 집계할 수 있는 함수 (COUNT, SUM, AVG 등)

SELECT 집계 함수
FROM DB 명.테이블 명;

 

 

3) *

해당 테이블의 모든 컬럼 출력

SELECT *
FROM DB 명.테이블 명;

 

 

4) AS

특정 컬럼의 컬럼 명을 변경해서 조회 가능 (AS 생략 가능)

SELECT 컬럼 명1 AS 변경 컬럼 명
FROM DB 명.테이블 명;

 

 

5) DISTINCT

중복을 제외하고 조회 가능

SELECT DISTINCT 컬럼 명
FROM DB 명.테이블 명;

 

 

# FROM

특정 테이블에 있는 정보를 호출하기 위해 FROM 절 에 테이블 명 지정해 주어야 함

SELECT 계산식 또는 컬럼 명
FROM DB명.테이블 명;

# DB 명 다음과 같이 처리 가능
USE DB 명;
SELECT 계산식 또는 컬럼 명
FROM 테이블 명;

 

 

# WHERE

WHERE 절을 추가해 조건 생성 가능

 

 

1) BETWEEN

특정 컬럼의 값이 시작점 ~ 끝점인 데이터만 출력

ex) 출시연도가 2010~2014년인 데이터만 조회

SELECT *
FROM DB 명.PRODUCT
WHERE 출시 연도 BETWEEN 2010 AND 2014;

 

 

2) 대소 관계 표현

대소 관계 연산자 (=, >, >=, <, <= <>) 를 이용하여 처리 가능

ex) 2014년 이후 출시된 상품 번호 조회

SELECT 상품 번호
FROM DB 명.PRODUCT
WHERE 출시 연도 > 2014;

 

 

3) IN / NOT IN

IN : 특정 값을 포함하는 데이터 출력 (OR 조건)

NOT IN : 특정 값을 포함하지 않는 데이터만 출력 

ex) 미국이나 영국에서 출시된 / 출시되지 않은 상품 번호 조회

# IN
SELECT 상품 번호
FROM DB 명.PRODUCT
WHERE 판매 국가 IN ('미국', '영국');

# NOT IN
SELECT 상품 번호
FROM DB 명.PRODUCT
WHERE 판매 국가 NOT IN ('미국', '영국');

 

 

4) IS NULL / IS NOT NULL

IS NULL : 특정 값이 비어 있는 (NULL) 데이터 출력

IS NOT NULL : 특정 컬럼의 값이 NULL이 아닌 데이터만 출력

# NULL
SELECT 컬럼 명 또는 계산식
FROM DB 명.테이블 명
WHERE 컬럼 명 IS NULL;

# NOT NULL
SELECT 컬럼 명 또는 계산식
FROM DB 명.테이블 명
WHERE 컬럼 명 IS NOT NULL;

 

 

5) LIKE '%TEXT%'

특정 컬럼에서 어떤 텍스트가 포함된 데이터를 출력

ex) 주소 컬럼에서 '부산'이라는 단어가 들어간 데이터 조회

SELECT *
FROM DB 명.CUSTOMERS
WHERE 주소 LIKE '%부산%';

 

 

# GROUP BY

- 컬럼의 값들을 그룹화하여 각 값들의 평균, 개수 등을 구할 때 GROUP BY 사용

- 보통 AVG, SUM, COUNT 등과 같은 집계 함수와 함께 사용됨

ex) 제조 국가별 평균 자동차 가격 조회

SELECT 제조 국가, AVG(가격)
FROM DB 명.CARS
GROUP BY 제조 국가;

 

 

 

출처 : SQL로 맛보는 데이터 전처리 분석

 
SQL로 맛보는 데이터 전처리 분석
데이터 분석을 하기 위해서는 데이터베이스에 존재하는 데이터를 직접 추출할 수 있어야 한다. SQL은 우리가 데이터베이스에 접근하여 필요한 데이터를 조회하고 조작할 수 있도록 해주는 언어이다. 즉 SQL은 사람이 데이터베이스와 소통할 수 있게 해주는 도구이자 데이터 분석의 시작점이라고 볼 수 있다. 이 책은 현업에서 서비스 분석에 자주 사용되는 KPI 지표들을 직접 추출하며 SQL을 익힐 수 있도록 구성되어 있다. 기존의 간단한 문법 수준을 다루는 SQL 저서와는 자동차 매출, 상품 리뷰, 식품 배송 데이터 등 실무에 가까운 자료를 분석하는 예제들을 포함하고 있어 SQL을 학습하는 데 보다 도움이 될 것이다.
저자
노수영
출판
비제이퍼블릭
출판일
2020.01.31

'Study > SQL' 카테고리의 다른 글

[SQL로 맛보는 데이터 전처리 분석] SQL 문법 (2)  (2) 2024.01.08