Listen

Description

"LLM은 세상을 배우는 게 아닙니다. 이미 세상을 이해하고 있는 존재인 '사람'을 흉내 낼 뿐이죠. 물리적 세계에서 실제로 어떤 일이 벌어질지 예측하는 능력은 없습니다."

수억 명이 매일 쓰는 ChatGPT가 지능이 아닐 수 있다고 선언한 사람 — 강화학습의 창시자이자 2024 튜링상 수상자, 리처드 서튼이 드와르케시 파텔의 PODCAST 무대에 앉았습니다.
목표도, 세계 모델도, 자기수정 능력도 없는 LLM. 그렇다면 진짜 지능은 어디서 오는가 — 아기의 손짓부터 MuZero의 승리, 복제에서 설계로 넘어가는 우주적 전환까지, 서튼의 논증은 끝까지 멈추지 않습니다( ͡° ͜ʖ ͡°)

#리처드서튼 #강화학습 #LLM

Science Adam Manifesto_
???? 본 콘텐츠는 원 발언의 단순 직역이 아니라, 화자의 기업 보고서·논문·강연·인터뷰·저서를 리소스로 삼아 논의된 개념과 사고 흐름을 재구성한 해설 콘텐츠입니다. 한글 및 한국어 화자의 이해를 돕기 위해 맥락 보완, 구조 재편, 표현 최적화가 이루어졌으며, 원 출처에 대한 존중을 바탕으로 제작되었습니다.

한국어 더빙: KBS 레전드 성우 이규화(Dwarkesh Patel), 과읽남(Richard Sutton)
내레이터·기획·번역·해설·편집: 사이언스 아담(과학책 읽어주는 남자)

✔ 원본 채널명: @DwarkeshPatel
✔ 원본 에피소드: • Richard Sutton – Father of RL thinks LLMs are a dead end https://youtu.be/21EYKqUsPfg?si=gc7vvZ5l-KbzI5N7

[Timeline]
00:00 Highlight
00:10 SADAM_one
03:28 [1] 막다른 골목길
15:48 SADAM_two
19:33 [2] 배움은 베낌인가
26:34 SADAM_three
29:49 [3] 쓰디쓴 교훈
36:22 SADAM_four
40:25 [4] 그 다음 인류

Synopsis_
???? 인간은 20시간이면 운전을 익힙니다. AI는 수백만 번의 시행착오로도 버겁습니다. 강화학습의 창시자 서튼은 그 이유가 '목표의 부재'에 있다고 진단합니다.

1st. 막다른 골목길_
LeCun은 AI가 세계를 이해하는 게 아니라 인간의 말을 따라할 뿐이라 진단했고, Pearl은 아무리 방대한 빅데이터도 인과 모델 없이는 관찰 단계를 영원히 못 벗어난다고 선언했습니다. 서튼의 결론은 더 단호합니다 — LLM에는 목표도, 실측 자료도, 스스로를 수정하는 능력도 없다고.

2nd. 배움은 베낌인가_
아기는 모방으로 배우는가, 경험으로 배우는가. 파텔은 인간의 문화적 진화가 모방 위에 서 있다고 밀어붙이고, 서튼은 다람쥐도 학교 없이 자기 세계를 완벽히 익힌다고 맞받습니다. Alison Gopnik의 '철학적 아기'와 Karl Friston의 '능동적 추론'이 이 충돌 한가운데 끼어듭니다.

3rd. 쓰디쓴 교훈_
규칙조차 모른 채 57개 Atari 게임에서 인간 점수의 50배를 찍은 MuZero. 외부에서 주입된 지식이 오히려 지능의 상한을 인간 수준으로 억눌러 왔다는 서튼의 주장이 알고리즘으로 증명된 순간이었을까요. 동시에 옥스퍼드 연구진은 경고합니다 — AI가 만든 데이터로 다음 AI를 훈련시키면, 모델은 반드시 붕괴한다고.

4th. 그 다음 인류_
서튼은 AI로의 계승을 피할 수 없는 단계로 봅니다. 복제의 시대가 끝나고 설계의 시대가 온다 — 우주의 먼지가 별이 되고, 별이 생명을 낳고, 생명이 마침내 설계된 지능을 탄생시키는 4대 전환. 그 낯선 후손을 인류의 일부로 품을지, 두려운 타자로 밀어낼지 — 결정권은 아직 우리 손에 있습니다.

#리처드서튼 #강화학습 #인공지능 #LLM #AGI #ChatGPT #쓰디쓴교훈 #AI #머신러닝 #딥러닝 #드와르케시파텔 #인공일반지능 #한글더빙 #사이언스아담