How Scaling Laws Will Determine AI's Future

youngerjesus 2025. 1. 24. 23:29

2025. 1. 24. 23:29

https://www.youtube.com/watch?v=d6Ed5bZAtrM&list=LL&index=2&t=11s

Scaling of Large Language Models:

"모델 크기 ↑ + 데이터 ↑ + 컴퓨팅 파워 ↑ = 성능 ↑" 는 공식이었음.
OpenAI 의 Scaling Laws for Neural Language Models 에서는 모델 크기와 성능의 멱법칙 관계를 공식화 함.
- 수식: 성능 ∝ (파라미터)^0.073 × (데이터)^0.35 × (컴퓨팅)^0.15
- 대략 이런 비율로 기여를 함.
이 논문의 결과에서는 알고리즘 개선보다 규모 확장이 성능 향상에 더 결정적이라고 밝힘.

구글 DeepMind의 Chinchilla: 데이터 균형의 중요성 재발견:

미래 전망: Scaling의 한계 vs. 새로운 가능성:

현재 상황:
- 데이터 고갈: 현재 인터넷에 있는 모든 데이터는 고갈됨 + 이러한 데이터의 품질 문제도 있음.
- 비용 문제: 그리고 GPT-4 같은 경우는 한번 학습하는데 1억 달러가 들어감.
OpenAI o1 의 등장 - 새로운 패러다임 제시:
- CoT 기반의 강화학습으로 추론 능력을 향상시킴. 모델 자체가 추론 또는 깊은 사고를 통해 답변을 내놓음 -> 정확도 향상
- 이를 테스트 단계의 컴퓨팅 자원을 더 할당한다고 함. (추론 단계의 컴퓨팅 자원이라고도 함)
데이터 품질의 중요성:
- 구글 Gemini 에서는 데이터 품질 관리 강화 → 학습 비용 30% 절감.
- Anthropic 에서는 전문가 검수 데이터 비중 34% ↑ → 성능 22% 향상.
미래 전망:
- 현재는 단순 확장의 한계를 넘어 테스트 단계 컴퓨팅, 다중 모달 학습, 인간-AI 협업(HLHF), 데이터 품질 최적화, 에너지 효율적 아키텍처(예: 슈퍼컨덕팅 칩) 접근법이 등장하며 새로운 장이 열리고 있다고 함.

Understanding and Effectively Using AI Reasoning Models (0)	2025.01.24
DSPy (0)	2024.09.04
Key Features of LLMs (0)	2024.08.29
생성AI로 똑똑하게 일하는 법 리뷰 (0)	2024.08.28
Open Source Models with Hugging Face (0)	2024.08.26

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

여정민의 블로그