Gyuhoon Kim
  • Home
  • About
  • python
  • scala
  • hadoop
  • database
  • kubernetes
  • All Posts
  • Tag
Subscribe

Hadoop

A collection of 13 posts

Hadoop

Salting in Spark

Data Skewness를 해결하는 Spark Salting Key 기법에 대해서 알아봅니다.

GyuhoonK GyuhoonK 4 min read
Hadoop

non-deterministic UDF

non-determinitic UDF 구현하기

GyuhoonK GyuhoonK 3 min read
Hadoop

WITH절/VIEW 사용 시 쿼리 플랜에 대해서

WITH절/VIEW 사용은 효율적인 쿼리플랜과 관련이 없다

GyuhoonK GyuhoonK 3 min read
Hadoop

enableHiveSupport

Spark enableHiveSupport(Hive metaStore)

GyuhoonK GyuhoonK 2 min read
Hadoop

Parquet and Predicate PushDown

parquet 포맷과 predicate pushdown에 대해서

GyuhoonK GyuhoonK 5 min read
Hadoop

repartition in Spark

repartition 파헤치기

GyuhoonK GyuhoonK 5 min read
Hadoop

Partition, Spill in Spark

Partition, Spill in Spark

GyuhoonK GyuhoonK 5 min read
Hadoop

hadoop distcp

hadoop distcp 명령어

GyuhoonK GyuhoonK 3 min read
Hadoop

Overwrite Partition in Spark

Spark를 이용하여 특정 파티션만 overwrite하기

GyuhoonK GyuhoonK 3 min read
Hadoop

Melt in Pyspark

pyspark로 melt function 구현하기

GyuhoonK GyuhoonK 3 min read
Hadoop

Merge Files in HDFS

HDFS에서 작은 용량의 파일들을 합쳐보자

GyuhoonK GyuhoonK 5 min read
Hadoop

Bucket in Hive, Spark

Hive와 Spark에서 Bucket 차이점에 대하여

GyuhoonK GyuhoonK 3 min read
Hadoop

CREATE Statement in Hive

HiveQL - CREATE Statement구조에 대하여

GyuhoonK GyuhoonK 13 min read
Gyuhoon Kim © 2025
Proudly published with Jekyll & GitHub Pages using Jasper2
Latest Posts Ghost

Subscribe to Gyuhoon Kim

Stay up to date! Get all the latest & greatest posts delivered straight to your inbox