일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Python
- 생각
- reverse v.s. reversed
- 함수형 프로그래밍
- blinker
- pandas
- 순수함수
- [초급(예비) 개발자 오픈소스 실무 역량강화 교육]
- Airflow
- os.path
- ds_store
- timestamp
- decorator
- selenium-wire
- S3
- slicing [::-1]
- sort(reverse=True) v.s. reverse
- r-string
- boto3
- functools.wraps
- sort v.s. sorted
- 코딩 테스트
- OS
- 쿼리
- PIP
- CI/CD
- 고차함수
Archives
- Today
- Total
공부일지
[SQL]데이터베이스 용량 점검 쿼리문 본문
작성일 2024-08-21
상황
오늘 하둡에 대해 찾아보다가 어떤 블로그에서
비정형 데이터(Plain text, … 등)의 경우
Hadoop에 저장 가능하다는 걸 보고
그렇다면 html 소스도 저장이 가능하면
현재 쓰는 몽고DB 말고 하둡을 쓰는 게 더 낫겠다는 생각이 들었다.
왜냐하면 몽고DB에 데이터를 저장할 때는
bson 모듈을 이용해서 한 번 데이터 형태를 string으로 전환해주기 때문이다.
그 과정을 줄이면서 하둡도 경험하면 좋겠다고 생각했다.
점검
찾아보니 하둡의 경우에는
테라바이트 급의 데이터를 다룰 때 유의미하고
그 미만의 데이터는 RDS도 충분히 기능적인 역할을 한다고 했다.
하둡을 쓰는 게 오히려 고사양이랄까?
그래서 데이터베이스 용량을 확인하기로 한다.
아래 쿼리는 데이터베이스의 용량을 확인하는 내용이다.
SELECT table_schema AS "Database",
ROUND(SUM(data_length + index_length) / 1024 / 1024, 2) AS "Size (MB)"
FROM information_schema.tables
GROUP BY table_schema;
현재 내가 쓰는 쪽은
사진 상 알파벳 A에 해당 데이터인데
2기가정도 되기 때문에 별 문제 없어보인다.
결론
그렇다면 굳이 하둡을 쓸 이유는 없어졌다고 보면 된다.
엔지니어링 측면에서 필요없는데 고사양의 기술을 쓸 필요는 없기 때문에...
다소 아쉬운 결론이다.
그래도 추후에 경험 삼아서 해볼 생각은 있다.
'Computer > 공부정리' 카테고리의 다른 글
[Python] Decorator와 functools의 wraps (0) | 2024.09.24 |
---|---|
[MongoDB] '오늘' 수집한 데이터 전부 지우기(부제: ObjectId와 Unix Time의 timestamp와의 관계) (0) | 2024.09.23 |
[Git]git branch 배우기 (0) | 2023.11.29 |
[Python]logging 라이브러리를 이용한 log 남기기 (0) | 2023.11.24 |
[Python]UnboundLocalError: cannot access local variable 'result' where it is not associated with a value (0) | 2023.11.24 |