Skip to main content

Hyoung-Kyu Song


Technical Skills

Language Python, C/C++, JavaScript, Java, Scala

DL PyTorch (+PyTorch Lightning), Tensorflow, TensorRT

Serving gRPC, Docker, Flask

Others MATLAB, Markdown, LaTeX, HTML/CSS, Adobe Illustrator, Adobe Premiere Pro


Education

KAIST(Korea Advanced Institute of Science and Technology)

  • 바이오및뇌공학과 및 전산학부 복수전공
  • 한국장학재단 선정 국가 이공계 장학생 (총 4학기)


Experience


AI Scientist @MINDsLab, Inc.

Brain팀 수석 연구원 (Vision)

  • 20명 가량의 Audio/NLP/Vison 연구 조직 운영
  • Image/3D Recognition, Image/Video/3D Vision 파트 알고리즘 연구 총괄
  • Brain팀 HR Process를 총괄 및 기술테스트, 면접 문항 디자인
  • 업무 및 연구 프로세스 정립
  • 기간 중 Vision 논문 2편 출판

Talking Face Generation 알고리즘 연구 총괄 및 엔진 구축

  • 512 x 512 영상을 30 FPS 이상의 속도 (RTX 3080 기준) 로 생성하는 GAN 기반 알고리즘 구축
  • 국내 은행사 도입을 통해 상용 기기 탑재 및 20억 매출 기여
  • Windows PC에서 TTS와 얼굴 생성 및 영상 렌더링까지 25FPS 이상의 속도로 영상 생성되도록 구현 및 구축
  • 은행에 상용 도입된 Windows 기반 AI Banker 컨시어지 CES 2022 전시
  • 다국어 TTS 연동을 통한 Multilingual Talking Face System 구축으로 CVPR 2022 Demo Paper 출판
  • AI Human 사업 및 코스닥 상장 기여

Face Translation 및 Face Swap 알고리즘 연구 총괄

  • Face Translation, Face Swap 연구 관련 동향 분석 및 방향 제시
  • 자체 Face Swap 알고리즘 연구로 Paper 제출
  • Face Translation 관련 미구현된 논문에 대해 pytorch lightning 기반 구현으로 Open-Source 프로젝트 진행

SW Engineer @Nota, Inc.

  • Factorization 기반 경량화 연구 조사
  • 복수의 생체 정보를 활용한 DL 기반 사람 식별 모델 개발 및 구축으로 CIKM Workshop Paper 출판

SW Engineer @Mindlogic, Inc.

  • 실시간성이 보장되는 Tacotron2 기반 한국어 TTS 시스템 및 Vocoder 개발

Research Intern @Brain and Machine Intelligence Laboratory

  • 가우시안 프로세스(Gaussian Process) 회귀법을 활용한 불확실성 측정
  • 멀티 에이전트 환경 상 TD3 강화학습 알고리즘 활용 액션 페어링(Action Pairing)

Research Intern @Bio-Information System Laboratory

  • 면역 치료 약물 Pembrolizumab 에 대한 CODA 시스템 기반 약리학적 분석


Publications


2022

Talking Face Generation with Multilingual TTS


2020

Deep User Identification Model with Multiple Biometrics[1]



Award


2015

2015 DB(DongBu) GAPS Challenge (ETF Investment)[2]

  • ETF 대상 모의 투자 대회 수익률 부문 1위
  • KAIST 새내기과정학부 1500만원 기부


Activity


Student Council of Bio & Brain Engineering

  • 학과 학생회장(2017) 및 4학년 과대표(2018)
  • 학과 소식지 발간
  • 학과 대표 캐릭터 뉴로니 디자인

CMS Pioneer Program


@Nota, Inc.

  • 2019 MWC 참여 리플렛 디자인

@MINDsLab Inc.

  • Brain팀 로고 디자인 및 Team Culture 구축
  • Jekyll, Docusaurus 기반 Tech Blog 블로그 구축



References

  1. Song, HK., AlAlkeem, E., Yun, J. et al. Deep user identification model with multiple biometric data. BMC Bioinformatics 21, 315 (2020). https://doi.org/10.1186/s12859-020-03613-3
  1. https://www.kaist.ac.kr/news/html/news/?mode=V&mng_no=1907