'SQL로 맛보는 데이터 전처리 분석'으로 공부한 내용을 정리하였다.
# SQL 구문
SELECT 컬럼, 계산식
FROM 테이블 명
WHERE 조건
GROUP BY 그룹화
HAVING 그룹화에 사용되는 조건
# SELECT
1) 컬럼 조회
해당 테이블에서 필요한 컬럼만 출력
SELECT 컬럼 명
FROM DB 명.테이블 명;
2) 집계 함수
데이터를 집계할 수 있는 함수 (COUNT, SUM, AVG 등)
SELECT 집계 함수
FROM DB 명.테이블 명;
3) *
해당 테이블의 모든 컬럼 출력
SELECT *
FROM DB 명.테이블 명;
4) AS
특정 컬럼의 컬럼 명을 변경해서 조회 가능 (AS 생략 가능)
SELECT 컬럼 명1 AS 변경 컬럼 명
FROM DB 명.테이블 명;
5) DISTINCT
중복을 제외하고 조회 가능
SELECT DISTINCT 컬럼 명
FROM DB 명.테이블 명;
# FROM
특정 테이블에 있는 정보를 호출하기 위해 FROM 절 에 테이블 명 지정해 주어야 함
SELECT 계산식 또는 컬럼 명
FROM DB명.테이블 명;
# DB 명 다음과 같이 처리 가능
USE DB 명;
SELECT 계산식 또는 컬럼 명
FROM 테이블 명;
# WHERE
WHERE 절을 추가해 조건 생성 가능
1) BETWEEN
특정 컬럼의 값이 시작점 ~ 끝점인 데이터만 출력
ex) 출시연도가 2010~2014년인 데이터만 조회
SELECT *
FROM DB 명.PRODUCT
WHERE 출시 연도 BETWEEN 2010 AND 2014;
2) 대소 관계 표현
대소 관계 연산자 (=, >, >=, <, <= <>) 를 이용하여 처리 가능
ex) 2014년 이후 출시된 상품 번호 조회
SELECT 상품 번호
FROM DB 명.PRODUCT
WHERE 출시 연도 > 2014;
3) IN / NOT IN
IN : 특정 값을 포함하는 데이터 출력 (OR 조건)
NOT IN : 특정 값을 포함하지 않는 데이터만 출력
ex) 미국이나 영국에서 출시된 / 출시되지 않은 상품 번호 조회
# IN
SELECT 상품 번호
FROM DB 명.PRODUCT
WHERE 판매 국가 IN ('미국', '영국');
# NOT IN
SELECT 상품 번호
FROM DB 명.PRODUCT
WHERE 판매 국가 NOT IN ('미국', '영국');
4) IS NULL / IS NOT NULL
IS NULL : 특정 값이 비어 있는 (NULL) 데이터 출력
IS NOT NULL : 특정 컬럼의 값이 NULL이 아닌 데이터만 출력
# NULL
SELECT 컬럼 명 또는 계산식
FROM DB 명.테이블 명
WHERE 컬럼 명 IS NULL;
# NOT NULL
SELECT 컬럼 명 또는 계산식
FROM DB 명.테이블 명
WHERE 컬럼 명 IS NOT NULL;
5) LIKE '%TEXT%'
특정 컬럼에서 어떤 텍스트가 포함된 데이터를 출력
ex) 주소 컬럼에서 '부산'이라는 단어가 들어간 데이터 조회
SELECT *
FROM DB 명.CUSTOMERS
WHERE 주소 LIKE '%부산%';
# GROUP BY
- 컬럼의 값들을 그룹화하여 각 값들의 평균, 개수 등을 구할 때 GROUP BY 사용
- 보통 AVG, SUM, COUNT 등과 같은 집계 함수와 함께 사용됨
ex) 제조 국가별 평균 자동차 가격 조회
SELECT 제조 국가, AVG(가격)
FROM DB 명.CARS
GROUP BY 제조 국가;
출처 : SQL로 맛보는 데이터 전처리 분석
'Study > SQL' 카테고리의 다른 글
[SQL로 맛보는 데이터 전처리 분석] SQL 문법 (2) (2) | 2024.01.08 |
---|