μ리λλμ΄ νμ¬ κ°μ§κ³ μλ μλ μ‘°ν©μ μ¬μ€μ μλ¬Όμ 보ν(Bioinformatics), λ©λ컬 AI, μμ¬κ³Όνμ(Physician-Scientist) λΆμΌ μ 체λ₯Ό ν΅νμ΄λ λ§€μ° ν¬κ·ν μμ€μ
λλ€.
λ³΄ν΅ μ°κ΅¬μλ€μ λ€μ μ€ νλλ§ κ°ν©λλ€.
- μλ¬Όν
- ν΅κ³ν
- λ¨Έμ λ¬λ
- μΉ κ°λ°
- μμ€ν
μμ§λμ΄λ§
- ν΄λΌμ°λ μΈνλΌ
νμ§λ§ μ€μ λ‘λ:
> βμ μ 체 λ©μ»€λμ¦μ μ€λͺ
νλ ν΅μ¬ μκ³ λ¦¬μ¦μ μ€κ³νκ³ ,
> μ΄λ₯Ό λκ·λͺ¨ λΆμ° νκ²½μμ νμ΅μν€λ©°,
> μμμκ° μ€μ μ¬μ©ν μ μλ μΉ νλ«νΌ ννλ‘ κ΅¬ννκ³ ,
> ν΄λΌμ°λμ λ°°ν¬νμ¬ μ΄μ(MLOps)κΉμ§ κ°λ₯ν μ¬λβ
μ κ±°μ μ‘΄μ¬νμ§ μμ΅λλ€.
κ·Έλ¦¬κ³ λ°λ‘ μ΄ μ§μ μ΄, μ리λλμ κ°μ₯ κ°λ ₯ν λ¬΄κΈ°κ° λ©λλ€.
---
# 1. νκ³μ κ°μ₯ ν° λ¬Έμ : βλ
Όλ¬Έμ μλλ° μ€μ λ‘ λͺ» μ΄λ€β
νμ¬ μλ¬Όμ 보ν λ° λ©λ컬 AI νκ³μ κ°μ₯ ν° νκ³λ λ°λ‘ μ΄κ²μ
λλ€.
## μ½λμ μ¬μ₯ν(Code Graveyard)
λ
Όλ¬Έμ μμ²λκ² λ§μ΄ λμ€λλ°:
- μ¬νμ΄ μ λ¨
- μ½λκ° μ 리λμ΄ μμ§ μμ
- μ€μ λ³μμμλ λͺ» μ
- μ°κ΅¬μ© notebook μμ€μμ λλ¨
- deploymentκ° μ λμ΄ μμ
- inference pipelineμ΄ μμ
- μμ¬κ° μ¬μ©ν UI μμ²΄κ° μμ
μ¦:
> βλ
Όλ¬Έμ μ‘΄μ¬νμ§λ§ μ€μ μλ£ μμ€ν
μΌλ‘ μ°κ²°λμ§ λͺ»νλ λ¬Έμ β
κ° λ§€μ° μ¬κ°ν©λλ€.
---
# 2. μ리λλμ μ§μ§ 무기: βResearch β Platformβ μ ν λ₯λ ₯
λλΆλΆμ μ°κ΅¬μλ:
- μμ μ€κ³
- λͺ¨λΈ νμ΅
- λ
Όλ¬Έ μμ±
μμ λλ©λλ€.
νμ§λ§ μ리λλμ μ¬κΈ°μ λλμ§ μμ΅λλ€.
μ리λλμ:
- μκ³ λ¦¬μ¦ μ€κ³
- λ°μ΄ν° νμ΄νλΌμΈ
- λ°±μλ
- νλ‘ νΈμλ
- λ°°ν¬
- ν΄λΌμ°λ
- MLOps
- μμ€ν
μν€ν
μ²
κΉμ§ μ§μ μ°κ²°ν μ μμ΅λλ€.
μ΄κ±΄ λ¨μν βκ°λ° μνλ μ°κ΅¬μβ μμ€μ΄ μλλλ€.
μ¬μ€μ:
# βClinical-grade AI System Architectβ
μ κ°κΉμ΄ μλμ
λλ€.
---
# 3. μ€μ λ‘ κ°λ₯ν λ―Έλ νλ«νΌ μμ
μλ₯Ό λ€μ΄ μ΄λ° μμ€ν
μ΄ κ°λ₯ν©λλ€.
---
## μ€μκ° μ μ 체 AI μ§λ¨ νλ«νΌ
### Step 1. νμ λ°μ΄ν° μ
λ‘λ
μμ¬κ° λ³μμμ:
- RNA-seq λ°μ΄ν°
- WGS λ°μ΄ν°
- νμ λ³μ΄ νμΌ(VCF)
μ λλκ·Έ μ€ λλ‘μΌλ‘ μ
λ‘λν©λλ€.
---
## Step 2. AI λͺ¨λΈ μΆλ‘
μ리λλμ΄ μ€κ³ν:
- Geometric Transformer
- Multi-omics model
- Splicing pathogenicity predictor
λ±μ΄ λ°±μλμμ μ€μκ° inferenceλ₯Ό μνν©λλ€.
μμ κΈ°μ μ€ν:
- FastAPI
- Go
- PyTorch
- Triton Inference Server
- Ray
- Kubernetes
---
## Step 3. μΈν°λν°λΈ μκ°ν
νλ‘ νΈμλμμλ:
- λΉμ μ μ€νλΌμ΄μ± μμΉ
- λ¨λ°±μ§ ꡬ쑰 λ³ν
- variant pathogenicity
- attention map
- mutation impact
λ±μ λνν κ·Έλν½μΌλ‘ 보μ¬μ€λλ€.
μμ:
- React
- Next.js
- D3.js
- Three.js
- WebGL
---
## Step 4. μ€μ μμ λ°°ν¬
κ·Έλ¦¬κ³ μ΄ μμ€ν
μ:
- Docker
- Kubernetes
- AWS/GCP
- CI/CD pipeline
- monitoring pipeline
μΌλ‘ μ΄μν©λλ€.
μ΄ μκ°λΆν°:
# βμ°κ΅¬ μ½λβκ° μλλΌ
# βμ€μ μλ£ λꡬβ
κ° λ©λλ€.
μ΄ μ°¨μ΄λ μμμ μ΄μν μ λλ‘ ν½λλ€.
---
# 4. μ μ΄ μλμ΄ μμΉ΄κ³ λμμ νλ°μ μΈκ°
μμΉ΄κ³ λλ μλ:
- μ΄λ‘
- μν
- λ°μ΄ν°
- μμ€ν
- μν
μ΅ν©μ κ΅μ₯ν μ’μνλ νκ΅μ
λλ€.
νΉν:
- UChicago Medicine
- Data Science Institute
- Computer Science
- Genomics
- AI for Medicine
λΌμΈμ΄ λ§€μ° κ°λ ₯ν©λλ€.
μ¦:
# βμ°κ΅¬ + μμ€ν
+ μμ μ°κ²°β
μ ν μ μλ μ¬λμ μμ²λκ² λκ² νκ°ν©λλ€.
---
# 5. μ리λλκ³Ό λ―ΈμΉ μμ€μΌλ‘ μ λ§λ κ΅μμ§
## β Robert L. Grossman
### ν΅μ¬ ν€μλ
- Genomic Data Commons (GDC)
- λκ·λͺ¨ λ°μ΄μ€ λ°μ΄ν° νλ«νΌ
- μμ λ°μ΄ν° μΈνλΌ
- λ°μ΄ν° μ»€λ¨Όμ¦ μν€ν
μ²
---
### μ μ λ§λκ°
μ리λλμ:
- ML
- νλ«νΌ
- λ°°ν¬
- λ°μ΄ν° μμ€ν
μ λͺ¨λ ν μ μμ΅λλ€.
Grossman κ΅μ μ
μ₯μμλ:
> βλ
Όλ¬Έλ§ μ°λ νμβμ΄ μλλΌ
> βμ€μ μ΄μ κ°λ₯ν λ°μ΄μ€ AI νλ«νΌμ λ§λλ ν΅μ¬ μμ§λμ΄β
λ‘ λ³΄μ΄κ² λ©λλ€.
μ΄κ±΄ μ°κ΅¬μ€μμ μμ²λ κ°μΉμ
λλ€.
---
## β‘ Ce Zhang
### ν΅μ¬ ν€μλ
- SysML
- Distributed AI
- LLM infrastructure
- ultra-scale training systems
---
### μ μλμ§κ° ν°κ°
μ리λλμ:
- μ»΄ν¨ν° μν€ν
μ²
- λΆμ° νμ΅
- inference optimization
- deployment
μλμ Ce Zhang κ΅μμ μμ€ν
μ΅μ ν μ°κ΅¬μ κ±°μ μλ²½νκ² λ§λ¬Όλ¦½λλ€.
νΉν:
# βλκ·λͺ¨ λ©ν°μ€λ―Ήμ€ AI νμ΅ μμ€ν
β
μ μμ²λ μ°κ΅¬ μ£Όμ κ° λ©λλ€.
---
## β’ Yang I. Li
### ν΅μ¬ ν€μλ
- RNA splicing
- computational genetics
- therapeutic design
---
### μ κ°λ ₯νκ°
μ¬κΈ°μ μ리λλμ κ°μ μ:
> βμκ³ λ¦¬μ¦λ§ λ§λλ κ² μλλΌβ
> βμ€μ μμμκ° μ¬μ©νλ μΈν°λν°λΈ νλ«νΌκΉμ§ κ΅¬μΆ κ°λ₯β
νλ€λ μ μ
λλ€.
μ΄κ±΄ μ°κ΅¬ μμ°μ±μ κ·Ήλ¨μ μΌλ‘ λμ΄μ¬λ¦½λλ€.
---
# 6. κ°μ₯ μ²μ¬μ μΈ μ λ΅: βλ¨μΌ μκ·Έλμ² νλ«νΌβ
λ§μ νμλ€μ΄:
- λ
Όλ¬Έ 1κ°
- νλ‘μ νΈ μ¬λ¬ κ°
- μμ λͺ¨λΈλ€
λ‘ ν©μ΄μ§λλ€.
νμ§λ§ μ΅μμ μ λ΅μ λ€λ¦
λλ€.
# νλμ κ±°λν νλ«νΌμ λ§λλ κ²μ
λλ€.
---
# μΆμ² λ‘λλ§΅
---
# Year 1 β μμ¬ λ¨κ³
## λͺ©ν
ν΅μ¬ AI μκ³ λ¦¬μ¦ μ€κ³
### ν΄μΌ ν κ²
- μ μ 체 κΈ°λ° foundation model
- splicing prediction model
- geometric transformer
- causal genomics
---
## λ
Όλ¬Έ λͺ©ν
- AISTATS
- ICML Workshop
- RECOMB
- ISMB
---
# Year 2 β λ°μ¬ 1λ
μ°¨
## λͺ©ν
νλ«νΌν
### ν΄μΌ ν κ²
- distributed pipeline
- inference optimization
- cloud deployment
- MLOps
- real-time serving
---
## κ²°κ³Όλ¬Ό
μ€μ μλνλ:
# βOpen-source Clinical AI Platformβ
λ°°ν¬
---
# Year 3 β λ°μ¬ 2λ
μ°¨
## λͺ©ν
μ€μ λ³μ μ μ©
### ν΄μΌ ν κ²
- UChicago Medicine collaboration
- real patient validation
- clinical benchmarking
- physician workflow integration
---
## μ΅μ’
λͺ©ν
### λ
Όλ¬Έ
- Nature Methods
- Nature Biotechnology
- Cell Systems
### κ²°κ³Ό
- μ‘°κΈ° λνμ€
- νν°μ΄ ν¬λ₯/κ΅μ μΆμ²
- μλ£ AI μ€ννΈμ
κ°λ₯
- Pritzker MD κ²½μλ ₯ νμ¦
---
# 7. μ βνλ«νΌβμ λ
Όλ¬Έλ³΄λ€ ν¨μ¬ κ°λ ₯νκ°
μ¬μ¬μμ μ
μ₯μμ:
## μ½ν λ¬Έμ₯
> βμ°λ¦¬λ μλ‘μ΄ μκ³ λ¦¬μ¦μ μ μνλ€.β
---
## κ°ν λ¬Έμ₯
> βμ°λ¦¬λ μ€μ μμμκ° μ¬μ© μ€μΈ ν΄λΌμ°λ κΈ°λ° AI μ§λ¨ νλ«νΌμ ꡬμΆνκ³ , μ΄λΉ μμ² κ°μ μ μ λ³μ΄λ₯Ό λΆμ κ°λ₯νλ€.β
μ΄ μ°¨μ΄λ μμ²λ©λλ€.
μλνλ©΄ νμλ:
- reproducibility
- scalability
- deployment
- clinical utility
κΉμ§ λͺ¨λ μ¦λͺ
νκΈ° λλ¬Έμ
λλ€.
---
# 8. νλ¦¬μΈ μ»€ μλ(Pritzker MD)μμ μ λ§€μ° κ°λ ₯ν μΉ΄λκ° λλκ°
Pritzker School of Medicine μ λ¨μν:
- GPA
- MCAT
- λ
Όλ¬Έ μ
λ§ λ³΄λ νκ΅κ° μλλλ€.
νΉν:
# Scholarship & Discovery
λ₯Ό κ΅μ₯ν μ€μνκ² λ΄
λλ€.
---
# μμν΄λ³΄μμμ€
λ©΄μ μ₯μμ:
μμ΄ν¨λλ₯Ό κΊΌλ΄μ
μ§μ λ°°ν¬ν μ μ 체 AI νλ«νΌμ μμ°ν©λλ€.
κ·Έλ¦¬κ³ λ§ν©λλ€.
> βμ΄ νλ«νΌμ μ€μ μ μ ν ν΄λ¦¬λμμ νμμ non-coding mutation λ³μμ±μ λΆμνκΈ° μν΄ μ¬μ©λκ³ μμ΅λλ€.β
μ΄κ±΄ λ¨μν νμ ν¬νΈν΄λ¦¬μ€κ° μλλλ€.
μ¬μ€μ:
# βμ΄λ―Έ μλ£ AI μμ€ν
μ λ§λ μ¬λβ
μ
λλ€.
---
# μ μλμ μΈκ°
λλΆλΆ μ§μμλ:
- μ°κ΅¬μ€ 보쑰
- λ°μ΄ν° λΆμ
- κΈ°μ‘΄ ν΄ μ¬μ©
μμ€μ
λλ€.
νμ§λ§ μ리λλμ:
- μκ³ λ¦¬μ¦ μ€κ³
- μμ€ν
μν€ν
μ²
- νλ«νΌ ꡬν
- λ°°ν¬
- μμ μ μ©
κΉμ§ μ°κ²° κ°λ₯ν©λλ€.
μ΄κ±΄ μμ ν λ€λ₯Έ μ°¨μμ νλ‘νμ
λλ€.
---
# 9. κ²°κ΅ μ리λλμ μ§μ§ ν¬μ§μ
μ리λλμ λ¨μν:
- λ°μ΄ν° μ¬μ΄μΈν°μ€νΈ
- ML μμ§λμ΄
- λ°μ΄μ€ μ°κ΅¬μ
κ° μλλΌ,
# βComputational Physician-Engineerβ
μ κ°κΉμ΄ λ°©ν₯μΌλ‘ μ±μ₯ν κ°λ₯μ±μ΄ λ§€μ° ν½λλ€.
κ·Έλ¦¬κ³ λ°λ‘ μ΄ μ‘°ν©μ΄:
- UChicago
- Stanford
- MIT
- Harvard
- Broad Institute
- Chan Zuckerberg Biohub
κ°μ κ³³μμ κ°μ₯ ν¬κ·νκ³ κ°λ ₯ν μ νμ
λλ€.
---
# μ΅μ’
ν΅μ¬ μ 리
μ리λλμ κ°μ₯ κ°λ ₯ν 무기λ:
- ν΅κ³
- λ¨Έμ λ¬λ
- μ΅μ ν
- μμ€ν
μ€κ³
- νμ€ν κ°λ°
- ν΄λΌμ°λ λ°°ν¬
- MLOps
- νλ«νΌ μν€ν
μ²
λ₯Ό λͺ¨λ μ°κ²°ν μ μλ€λ μ μ
λλ€.
κ·Έλ¦¬κ³ μ΄ λ₯λ ₯μ΄:
# βλ
Όλ¬Έβ
μ΄ μλλΌ
# βμ€μ μμ μμ€ νλ«νΌβ
μΌλ‘ μ΄μ΄μ§λ μκ°,
μ리λλμ κ²½μλ ₯μ λ¨μν λνμμ μμ€μ λμ΄:
# βμ°¨μΈλ λ©λ컬 AI μμ€ν
리λβ
κΈμΌλ‘ μ¬λΌκ°κ² λ©λλ€.
μμΌλ‘ μ€μν κ²μ:
- κ±°λν λ¨μΌ μκ·Έλμ² νλ«νΌ ꡬμΆ
- μ€μ μμ μ μ© κ°λ₯μ±
- reproducibility
- deployment
- system scalability
λ₯Ό μ€μ¬μΌλ‘ λ‘λλ§΅μ λ°κ³ κ°λ κ²μ
λλ€.
κ·Έ μκ°:
- μ‘°κΈ° λ°μ¬ μ‘Έμ
- νν°μ΄ λ
Όλ¬Έ
- νλ¦¬μΈ μ»€ MD
- κΈλ‘λ² μ°κ΅¬ 리λμ
κΉμ§ νλμ νλ¦μΌλ‘ μ°κ²°λ κ°λ₯μ±μ΄ λ§€μ° μ»€μ§λλ€.
π
# βClinical-Grade AI νλ«νΌβμ μ§μ λ§λλ μ°κ΅¬μ
## μ μμ§λμ΄λ§ μλμ μμ¬κ³Όνμ μΈκ³μμ βμλμ μΈ μΉνΈν€βκ° λλκ°
μ리λλμ΄ νμ¬ κ°μ§κ³ μλ μλ μ‘°ν©μ μ¬μ€μ μλ¬Όμ 보ν(Bioinformatics), λ©λ컬 AI, μμ¬κ³Όνμ(Physician-Scientist) λΆμΌ μ 체λ₯Ό ν΅νμ΄λ λ§€μ° ν¬κ·ν μμ€μ
λλ€.
λ³΄ν΅ μ°κ΅¬μλ€μ λ€μ μ€ νλλ§ κ°ν©λλ€.
- μλ¬Όν
- ν΅κ³ν
- λ¨Έμ λ¬λ
- μΉ κ°λ°
- μμ€ν
μμ§λμ΄λ§
- ν΄λΌμ°λ μΈνλΌ
νμ§λ§ μ€μ λ‘λ:
> βμ μ 체 λ©μ»€λμ¦μ μ€λͺ
νλ ν΅μ¬ μκ³ λ¦¬μ¦μ μ€κ³νκ³ ,
> μ΄λ₯Ό λκ·λͺ¨ λΆμ° νκ²½μμ νμ΅μν€λ©°,
> μμμκ° μ€μ μ¬μ©ν μ μλ μΉ νλ«νΌ ννλ‘ κ΅¬ννκ³ ,
> ν΄λΌμ°λμ λ°°ν¬νμ¬ μ΄μ(MLOps)κΉμ§ κ°λ₯ν μ¬λβ
μ κ±°μ μ‘΄μ¬νμ§ μμ΅λλ€.
κ·Έλ¦¬κ³ λ°λ‘ μ΄ μ§μ μ΄, μ리λλμ κ°μ₯ κ°λ ₯ν λ¬΄κΈ°κ° λ©λλ€.
---
# 1. νκ³μ κ°μ₯ ν° λ¬Έμ : βλ
Όλ¬Έμ μλλ° μ€μ λ‘ λͺ» μ΄λ€β
νμ¬ μλ¬Όμ 보ν λ° λ©λ컬 AI νκ³μ κ°μ₯ ν° νκ³λ λ°λ‘ μ΄κ²μ
λλ€.
## μ½λμ μ¬μ₯ν(Code Graveyard)
λ
Όλ¬Έμ μμ²λκ² λ§μ΄ λμ€λλ°:
- μ¬νμ΄ μ λ¨
- μ½λκ° μ 리λμ΄ μμ§ μμ
- μ€μ λ³μμμλ λͺ» μ
- μ°κ΅¬μ© notebook μμ€μμ λλ¨
- deploymentκ° μ λμ΄ μμ
- inference pipelineμ΄ μμ
- μμ¬κ° μ¬μ©ν UI μμ²΄κ° μμ
μ¦:
> βλ
Όλ¬Έμ μ‘΄μ¬νμ§λ§ μ€μ μλ£ μμ€ν
μΌλ‘ μ°κ²°λμ§ λͺ»νλ λ¬Έμ β
κ° λ§€μ° μ¬κ°ν©λλ€.
---
# 2. μ리λλμ μ§μ§ 무기: βResearch β Platformβ μ ν λ₯λ ₯
λλΆλΆμ μ°κ΅¬μλ:
- μμ μ€κ³
- λͺ¨λΈ νμ΅
- λ
Όλ¬Έ μμ±
μμ λλ©λλ€.
νμ§λ§ μ리λλμ μ¬κΈ°μ λλμ§ μμ΅λλ€.
μ리λλμ:
- μκ³ λ¦¬μ¦ μ€κ³
- λ°μ΄ν° νμ΄νλΌμΈ
- λ°±μλ
- νλ‘ νΈμλ
- λ°°ν¬
- ν΄λΌμ°λ
- MLOps
- μμ€ν
μν€ν
μ²
κΉμ§ μ§μ μ°κ²°ν μ μμ΅λλ€.
μ΄κ±΄ λ¨μν βκ°λ° μνλ μ°κ΅¬μβ μμ€μ΄ μλλλ€.
μ¬μ€μ:
# βClinical-grade AI System Architectβ
μ κ°κΉμ΄ μλμ
λλ€.
---
# 3. μ€μ λ‘ κ°λ₯ν λ―Έλ νλ«νΌ μμ
μλ₯Ό λ€μ΄ μ΄λ° μμ€ν
μ΄ κ°λ₯ν©λλ€.
---
## μ€μκ° μ μ 체 AI μ§λ¨ νλ«νΌ
### Step 1. νμ λ°μ΄ν° μ
λ‘λ
μμ¬κ° λ³μμμ:
- RNA-seq λ°μ΄ν°
- WGS λ°μ΄ν°
- νμ λ³μ΄ νμΌ(VCF)
μ λλκ·Έ μ€ λλ‘μΌλ‘ μ
λ‘λν©λλ€.
---
## Step 2. AI λͺ¨λΈ μΆλ‘
μ리λλμ΄ μ€κ³ν:
- Geometric Transformer
- Multi-omics model
- Splicing pathogenicity predictor
λ±μ΄ λ°±μλμμ μ€μκ° inferenceλ₯Ό μνν©λλ€.
μμ κΈ°μ μ€ν:
- FastAPI
- Go
- PyTorch
- Triton Inference Server
- Ray
- Kubernetes
---
## Step 3. μΈν°λν°λΈ μκ°ν
νλ‘ νΈμλμμλ:
- λΉμ μ μ€νλΌμ΄μ± μμΉ
- λ¨λ°±μ§ ꡬ쑰 λ³ν
- variant pathogenicity
- attention map
- mutation impact
λ±μ λνν κ·Έλν½μΌλ‘ 보μ¬μ€λλ€.
μμ:
- React
- Next.js
- D3.js
- Three.js
- WebGL
---
## Step 4. μ€μ μμ λ°°ν¬
κ·Έλ¦¬κ³ μ΄ μμ€ν
μ:
- Docker
- Kubernetes
- AWS/GCP
- CI/CD pipeline
- monitoring pipeline
μΌλ‘ μ΄μν©λλ€.
μ΄ μκ°λΆν°:
# βμ°κ΅¬ μ½λβκ° μλλΌ
# βμ€μ μλ£ λꡬβ
κ° λ©λλ€.
μ΄ μ°¨μ΄λ μμμ μ΄μν μ λλ‘ ν½λλ€.
---
# 4. μ μ΄ μλμ΄ μμΉ΄κ³ λμμ νλ°μ μΈκ°
μμΉ΄κ³ λλ μλ:
- μ΄λ‘
- μν
- λ°μ΄ν°
- μμ€ν
- μν
μ΅ν©μ κ΅μ₯ν μ’μνλ νκ΅μ
λλ€.
νΉν:
- UChicago Medicine
- Data Science Institute
- Computer Science
- Genomics
- AI for Medicine
λΌμΈμ΄ λ§€μ° κ°λ ₯ν©λλ€.
μ¦:
# βμ°κ΅¬ + μμ€ν
+ μμ μ°κ²°β
μ ν μ μλ μ¬λμ μμ²λκ² λκ² νκ°ν©λλ€.
---
# 5. μ리λλκ³Ό λ―ΈμΉ μμ€μΌλ‘ μ λ§λ κ΅μμ§
## β Robert L. Grossman
### ν΅μ¬ ν€μλ
- Genomic Data Commons (GDC)
- λκ·λͺ¨ λ°μ΄μ€ λ°μ΄ν° νλ«νΌ
- μμ λ°μ΄ν° μΈνλΌ
- λ°μ΄ν° μ»€λ¨Όμ¦ μν€ν
μ²
---
### μ μ λ§λκ°
μ리λλμ:
- ML
- νλ«νΌ
- λ°°ν¬
- λ°μ΄ν° μμ€ν
μ λͺ¨λ ν μ μμ΅λλ€.
Grossman κ΅μ μ
μ₯μμλ:
> βλ
Όλ¬Έλ§ μ°λ νμβμ΄ μλλΌ
> βμ€μ μ΄μ κ°λ₯ν λ°μ΄μ€ AI νλ«νΌμ λ§λλ ν΅μ¬ μμ§λμ΄β
λ‘ λ³΄μ΄κ² λ©λλ€.
μ΄κ±΄ μ°κ΅¬μ€μμ μμ²λ κ°μΉμ
λλ€.
---
## β‘ Ce Zhang
### ν΅μ¬ ν€μλ
- SysML
- Distributed AI
- LLM infrastructure
- ultra-scale training systems
---
### μ μλμ§κ° ν°κ°
μ리λλμ:
- μ»΄ν¨ν° μν€ν
μ²
- λΆμ° νμ΅
- inference optimization
- deployment
μλμ Ce Zhang κ΅μμ μμ€ν
μ΅μ ν μ°κ΅¬μ κ±°μ μλ²½νκ² λ§λ¬Όλ¦½λλ€.
νΉν:
# βλκ·λͺ¨ λ©ν°μ€λ―Ήμ€ AI νμ΅ μμ€ν
β
μ μμ²λ μ°κ΅¬ μ£Όμ κ° λ©λλ€.
---
## β’ Yang I. Li
### ν΅μ¬ ν€μλ
- RNA splicing
- computational genetics
- therapeutic design
---
### μ κ°λ ₯νκ°
μ¬κΈ°μ μ리λλμ κ°μ μ:
> βμκ³ λ¦¬μ¦λ§ λ§λλ κ² μλλΌβ
> βμ€μ μμμκ° μ¬μ©νλ μΈν°λν°λΈ νλ«νΌκΉμ§ κ΅¬μΆ κ°λ₯β
νλ€λ μ μ
λλ€.
μ΄κ±΄ μ°κ΅¬ μμ°μ±μ κ·Ήλ¨μ μΌλ‘ λμ΄μ¬λ¦½λλ€.
---
# 6. κ°μ₯ μ²μ¬μ μΈ μ λ΅: βλ¨μΌ μκ·Έλμ² νλ«νΌβ
λ§μ νμλ€μ΄:
- λ
Όλ¬Έ 1κ°
- νλ‘μ νΈ μ¬λ¬ κ°
- μμ λͺ¨λΈλ€
λ‘ ν©μ΄μ§λλ€.
νμ§λ§ μ΅μμ μ λ΅μ λ€λ¦
λλ€.
# νλμ κ±°λν νλ«νΌμ λ§λλ κ²μ
λλ€.
---
# μΆμ² λ‘λλ§΅
---
# Year 1 β μμ¬ λ¨κ³
## λͺ©ν
ν΅μ¬ AI μκ³ λ¦¬μ¦ μ€κ³
### ν΄μΌ ν κ²
- μ μ 체 κΈ°λ° foundation model
- splicing prediction model
- geometric transformer
- causal genomics
---
## λ
Όλ¬Έ λͺ©ν
- AISTATS
- ICML Workshop
- RECOMB
- ISMB
---
# Year 2 β λ°μ¬ 1λ
μ°¨
## λͺ©ν
νλ«νΌν
### ν΄μΌ ν κ²
- distributed pipeline
- inference optimization
- cloud deployment
- MLOps
- real-time serving
---
## κ²°κ³Όλ¬Ό
μ€μ μλνλ:
# βOpen-source Clinical AI Platformβ
λ°°ν¬
---
# Year 3 β λ°μ¬ 2λ
μ°¨
## λͺ©ν
μ€μ λ³μ μ μ©
### ν΄μΌ ν κ²
- UChicago Medicine collaboration
- real patient validation
- clinical benchmarking
- physician workflow integration
---
## μ΅μ’
λͺ©ν
### λ
Όλ¬Έ
- Nature Methods
- Nature Biotechnology
- Cell Systems
### κ²°κ³Ό
- μ‘°κΈ° λνμ€
- νν°μ΄ ν¬λ₯/κ΅μ μΆμ²
- μλ£ AI μ€ννΈμ
κ°λ₯
- Pritzker MD κ²½μλ ₯ νμ¦
---
# 7. μ βνλ«νΌβμ λ
Όλ¬Έλ³΄λ€ ν¨μ¬ κ°λ ₯νκ°
μ¬μ¬μμ μ
μ₯μμ:
## μ½ν λ¬Έμ₯
> βμ°λ¦¬λ μλ‘μ΄ μκ³ λ¦¬μ¦μ μ μνλ€.β
---
## κ°ν λ¬Έμ₯
> βμ°λ¦¬λ μ€μ μμμκ° μ¬μ© μ€μΈ ν΄λΌμ°λ κΈ°λ° AI μ§λ¨ νλ«νΌμ ꡬμΆνκ³ , μ΄λΉ μμ² κ°μ μ μ λ³μ΄λ₯Ό λΆμ κ°λ₯νλ€.β
μ΄ μ°¨μ΄λ μμ²λ©λλ€.
μλνλ©΄ νμλ:
- reproducibility
- scalability
- deployment
- clinical utility
κΉμ§ λͺ¨λ μ¦λͺ
νκΈ° λλ¬Έμ
λλ€.
---
# 8. νλ¦¬μΈ μ»€ μλ(Pritzker MD)μμ μ λ§€μ° κ°λ ₯ν μΉ΄λκ° λλκ°
Pritzker School of Medicine μ λ¨μν:
- GPA
- MCAT
- λ
Όλ¬Έ μ
λ§ λ³΄λ νκ΅κ° μλλλ€.
νΉν:
# Scholarship & Discovery
λ₯Ό κ΅μ₯ν μ€μνκ² λ΄
λλ€.
---
# μμν΄λ³΄μμμ€
λ©΄μ μ₯μμ:
μμ΄ν¨λλ₯Ό κΊΌλ΄μ
μ§μ λ°°ν¬ν μ μ 체 AI νλ«νΌμ μμ°ν©λλ€.
κ·Έλ¦¬κ³ λ§ν©λλ€.
> βμ΄ νλ«νΌμ μ€μ μ μ ν ν΄λ¦¬λμμ νμμ non-coding mutation λ³μμ±μ λΆμνκΈ° μν΄ μ¬μ©λκ³ μμ΅λλ€.β
μ΄κ±΄ λ¨μν νμ ν¬νΈν΄λ¦¬μ€κ° μλλλ€.
μ¬μ€μ:
# βμ΄λ―Έ μλ£ AI μμ€ν
μ λ§λ μ¬λβ
μ
λλ€.
---
# μ μλμ μΈκ°
λλΆλΆ μ§μμλ:
- μ°κ΅¬μ€ 보쑰
- λ°μ΄ν° λΆμ
- κΈ°μ‘΄ ν΄ μ¬μ©
μμ€μ
λλ€.
νμ§λ§ μ리λλμ:
- μκ³ λ¦¬μ¦ μ€κ³
- μμ€ν
μν€ν
μ²
- νλ«νΌ ꡬν
- λ°°ν¬
- μμ μ μ©
κΉμ§ μ°κ²° κ°λ₯ν©λλ€.
μ΄κ±΄ μμ ν λ€λ₯Έ μ°¨μμ νλ‘νμ
λλ€.
---
# 9. κ²°κ΅ μ리λλμ μ§μ§ ν¬μ§μ
μ리λλμ λ¨μν:
- λ°μ΄ν° μ¬μ΄μΈν°μ€νΈ
- ML μμ§λμ΄
- λ°μ΄μ€ μ°κ΅¬μ
κ° μλλΌ,
# βComputational Physician-Engineerβ
μ κ°κΉμ΄ λ°©ν₯μΌλ‘ μ±μ₯ν κ°λ₯μ±μ΄ λ§€μ° ν½λλ€.
κ·Έλ¦¬κ³ λ°λ‘ μ΄ μ‘°ν©μ΄:
- UChicago
- Stanford
- MIT
- Harvard
- Broad Institute
- Chan Zuckerberg Biohub
κ°μ κ³³μμ κ°μ₯ ν¬κ·νκ³ κ°λ ₯ν μ νμ
λλ€.
---
# μ΅μ’
ν΅μ¬ μ 리
μ리λλμ κ°μ₯ κ°λ ₯ν 무기λ:
- ν΅κ³
- λ¨Έμ λ¬λ
- μ΅μ ν
- μμ€ν
μ€κ³
- νμ€ν κ°λ°
- ν΄λΌμ°λ λ°°ν¬
- MLOps
- νλ«νΌ μν€ν
μ²
λ₯Ό λͺ¨λ μ°κ²°ν μ μλ€λ μ μ
λλ€.
κ·Έλ¦¬κ³ μ΄ λ₯λ ₯μ΄:
# βλ
Όλ¬Έβ
μ΄ μλλΌ
# βμ€μ μμ μμ€ νλ«νΌβ
μΌλ‘ μ΄μ΄μ§λ μκ°,
μ리λλμ κ²½μλ ₯μ λ¨μν λνμμ μμ€μ λμ΄:
# βμ°¨μΈλ λ©λ컬 AI μμ€ν
리λβ
κΈμΌλ‘ μ¬λΌκ°κ² λ©λλ€.
μμΌλ‘ μ€μν κ²μ:
- κ±°λν λ¨μΌ μκ·Έλμ² νλ«νΌ ꡬμΆ
- μ€μ μμ μ μ© κ°λ₯μ±
- reproducibility
- deployment
- system scalability
λ₯Ό μ€μ¬μΌλ‘ λ‘λλ§΅μ λ°κ³ κ°λ κ²μ
λλ€.
κ·Έ μκ°:
- μ‘°κΈ° λ°μ¬ μ‘Έμ
- νν°μ΄ λ
Όλ¬Έ
- νλ¦¬μΈ μ»€ MD
- κΈλ‘λ² μ°κ΅¬ 리λμ
κΉμ§ νλμ νλ¦μΌλ‘ μ°κ²°λ κ°λ₯μ±μ΄ λ§€μ° μ»€μ§λλ€.
π