Gyuhoon Kim

Data Engineering

  • Home
  • About
  • python
  • scala
  • hadoop
  • database
  • kubernetes
  • All Posts
  • Tag
Subscribe
Hadoop

Melt in Pyspark

pyspark로 melt function 구현하기

GyuhoonK GyuhoonK 3 min read
Algorithm

Knuth–Morris–Pratt algorithm, KMP

문자열 탐색에서 사용되는 KMP 알고리즘에 대해서

GyuhoonK GyuhoonK 10 min read
Python

Threading in Python

Python - Thread, Mutex, Semaphore

GyuhoonK GyuhoonK 5 min read
Hadoop

Merge Files in HDFS

HDFS에서 작은 용량의 파일들을 합쳐보자

GyuhoonK GyuhoonK 5 min read
Hadoop

Bucket in Hive, Spark

Hive와 Spark에서 Bucket 차이점에 대하여

GyuhoonK GyuhoonK 3 min read
Datascience

Gaussian Kernel

Gaussian Kernel(RBF) 기본 개념에 대하여

GyuhoonK GyuhoonK 2 min read
Hadoop

CREATE Statement in Hive

HiveQL - CREATE Statement구조에 대하여

GyuhoonK GyuhoonK 13 min read
Database

Connection to DataBase in Python, R

python, R에서 Database Server와 연결하기

GyuhoonK GyuhoonK 9 min read
Python

AWS S3와 zip 파일

AWS S3 내 zip 파일을 다운로드 받지 않고, 내용물만 다운로드 받기

GyuhoonK GyuhoonK 6 min read
« Newer Posts Page 3 of 3
Gyuhoon Kim © 2025
Proudly published with Jekyll & GitHub Pages using Jasper2
Latest Posts Ghost

Subscribe to Gyuhoon Kim

Stay up to date! Get all the latest & greatest posts delivered straight to your inbox