AI 혁명기의 선각자들 Ep.7 – 페이페이 리, 컴퓨터 비전의 기반을 만든 연구자

페이페이 리는 AI가 세상을 이해하는 방식을 근본적으로 바꾼 연구자로, ImageNet을 통해 컴퓨터 비전의 기초를 정립했습니다. 이 글은 그녀가 어떻게 ‘시각 지능’이라는 개념을 현대 AI의 중심으로 끌어올렸는지, 그리고 그 변화가 오늘의 기술에 어떤 영향을 남겼는지 쉽게 설명합니다.

[Ep6 요약 3줄 – 데니스 홍]
1) 지난 편에서는 데니스 홍이 로봇공학에서 ‘실험·실패·도전’을 통해 혁신을 만들어온 과정을 살펴보았다.
2) 그는 인간형 로봇, 보행 로봇, 재난 대응 로봇 등 다양한 프로젝트를 통해 “로봇은 어떻게 세상을 이해하고 움직일 수 있는가?”라는 근본 질문을 탐구했다.
3) 이번 Ep7에서는, 이러한 로봇 지능의 기반이 되는 ‘시각적 세계 이해’를 구축한 연구자, 페이페이 리를 소개한다.

Fei-Fei Li 페이페이 리 ImageNet 컴퓨터비전 혁신 연구자 초상

사진 출처: TED Conferences, LLC

1. 베이징에서 뉴저지 세탁소까지, 그리고 스탠퍼드로

페이페이 리(Fei-Fei Li)는 1976년 중국 베이징에서 태어나 쓰촨성 청두에서 어린 시절을 보냈다. 10대 중반 가족과 함께 미국 뉴저지로 이민을 왔고, 부모님의 작은 세탁소 일을 도우며 학업을 이어갔다. 이 과정에서 “지능이란 무엇인가?”라는 질문이 그녀의 삶에 오래 남았고, 그 질문은 결국 연구의 핵심 주제가 된다.

프린스턴에서 물리학을 전공한 후, 캘텍(Caltech)에서 전기공학 박사를 취득했다. 이후 스탠퍼드대학교 컴퓨터과학과 교수가 되었고, 지금은 Stanford Human-Centered AI Institute(HAI)의 공동 설립자이자 공동 디렉터로 활동하며 AI·사회·윤리·정책을 아우르는 연구를 이끌고 있다. 또한 AI 교육의 다양성을 높이기 위해 AI4ALL을 공동 창립한 인물이기도 하다.

2. ImageNet – AI에게 세상을 처음으로 ‘보여준’ 데이터

2000년대 중반까지 AI가 이미지를 이해하는 능력은 매우 제한적이었다. 알고리즘은 존재했지만, 학습할 만한 충분한 이미지 데이터가 없었다. 이는 마치 한 사람이 단 몇 장의 사진만 보고 세상을 이해하려 하는 것과 같았다.

페이페이 리는 문제의 본질을 이렇게 정의했다.
“AI도 사람처럼, 폭넓은 시각 경험을 통해 세상을 배워야 한다.”

이 생각 아래 시작된 프로젝트가 ImageNet이다. 1,400만 장 이상의 이미지에 꼼꼼하게 라벨을 붙이고, WordNet 기반의 계층 구조를 이용해 세상을 체계적으로 정리한 데이터셋이다. 당시에는 지나치게 큰 프로젝트라는 비판도 있었지만, 결과는 모든 의문을 뒤집었다.

2012년, 딥러닝 모델(AlexNet)이 ImageNet 대회에서 기존 기법을 압도하는 성능을 보여주자 학계와 산업은 즉시 ‘이미지 기반 딥러닝 시대’로 전환하게 된다. 이 장면은 오늘날 자율주행, 얼굴 인식, 로봇 비전, 의료 영상 분석 등 대부분의 시각 AI 기술의 출발점이 되었다.

3. “시각 지능은 지능의 코너스톤이다”

페이페이 리는 여러 인터뷰에서 시각 연구를 평생의 과제로 삼은 이유를 이렇게 설명한다.

“시각 지능(visual intelligence)은 인간과 동물 지능의 핵심 요소입니다. 세상을 이해하려면, 먼저 볼 수 있어야 합니다.”

또한 대학원 시절 자신의 목표를 이렇게 회상한다.

“내가 살아 있는 동안, 한 알고리즘이 ‘한 장면의 이야기를 말할 수 있다’는 것을 실현할 수 있다면, 그것만으로도 충분한 인생이라고 생각했습니다.”

그녀에게 시각 AI 연구는 단순한 기술 개발이 아니라 “지능의 본질을 탐구하는 여정”에 가까웠다.

4. Human-Centered AI – 기술보다 ‘사람’을 앞에 두는 관점

페이페이 리가 독특한 점은, 기술적 업적을 이루면서도 항상 “AI가 인간에게 어떤 영향을 주는가?”라는 질문을 놓지 않았다는 것이다.

그녀는 감시 기술, 군사용 AI, 데이터 편향, 오용 가능성 등 AI가 가져올 위험에 대해 지속적으로 경고해왔고, 기술이 인간의 존엄과 삶의 질을 개선하는 방향으로 설계돼야 한다고 주장한다.

AI4ALL은 여성과 소수자 등 비전형적 배경을 가진 학생들이 AI를 배울 수 있는 길을 넓혀주기 위해 만들어졌다. 스탠퍼드 HAI의 운영 철학 역시 간단하다.

“AI는 기술이자 사회적 제도이며, 결국 사람을 위한 도구여야 한다.”

5. 언어를 넘어 세계를 이해하는 AI로

최근 대형 언어 모델(LLM)이 빠르게 주목받고 있지만, 페이페이 리는 AI의 다음 단계가 “세계 모델(world models)”과 “공간 지능(spatial intelligence)”이라고 말한다.

그녀가 설립한 World Labs는 AI가 텍스트뿐 아니라 실제 3D 세계를 보고 이해하고, 상황을 추론하며 행동까지 연결하는 능력을 연구하고 있다. 이는 “보는 것 → 이해하는 것 → 행동하는 것”으로 이어지는 지능의 확장을 의미한다.

이 방향성은 그녀가 오랫동안 붙잡아온 질문과도 맞닿아 있다.
“지능이란 무엇인가?” AI가 인간 수준의 시각과 공간 이해로 확장될 때, 이 질문의 새로운 답이 보일 수 있다는 것이다.

6. 마무리글

우리가 오늘 자연스럽게 사용하는 시각 AI 기술들— 스마트폰 카메라의 장면 인식, 원격 의료 영상 진단, 그리고 자율주행의 시각 모듈까지. 그 출발점에는 AI에게 “세상을 제대로 보여줘야 한다”는 한 연구자의 집요한 문제 정의가 있었다.

페이페이 리는 단순히 데이터를 만든 것이 아니라, AI가 세상을 어떻게 바라보고 이해해야 하는가를 정의한 사람이다.

“AI의 눈을 만든 연구자, 그리고 그 눈이 향해야 할 방향을 함께 고민한 사람.”

다음 편 예고 – Ep.8 앤드루 응, AI를 ‘배울 수 있는 기술’로 바꾸다

Ep.7까지의 여정은 AI가 세상을 어떻게 보고 이해하게 되었는가에 초점을 맞추었다. Ep.8에서는 방향을 조금 바꿔, “그 기술을 누가, 어떻게 배우게 되었는가”를 이야기한다.

Google Brain의 공동 창립자이자, Coursera와 DeepLearning.AI를 통해 수백만 명에게 머신러닝을 소개한 교육자, 앤드루 응(Andrew Ng). Ep.8에서는 그가 어떻게 AI를 소수 연구자의 영역에서 전 세계 학습자의 책상 위로 옮겨 놓았는지 살펴볼 예정이다.

← 이전글: Ep6 – 데니스 홍
→ 다음글:(예정) Ep8 – 앤드루 응

📚 참고자료 요약

ImageNet 및 ILSVRC 대회 자료 – 딥러닝 발전의 실제 분기점.
Stanford HAI 발표·인터뷰 – Human-Centered AI 철학의 기반.
AI4ALL 활동 및 사례 – AI 교육의 다양성·포용성 확대 노력.
World Labs 소개 – 공간 지능과 세계 모델 연구 방향.
Fei-Fei Li TED 강연·매체 인터뷰 – 시각 지능의 역할과 AI 윤리에 대한 관점.

'AI 기술 동향' 카테고리의 다른 글

Emad-Mostaque-rise-of-open-source-ai-ep9 (2)	2025.12.08
Andrew-Ng-ai-education-ep8 (3)	2025.12.07
Dennis-Hong-humanoid-robot-future-ep6 (2)	2025.12.06
Elon-Musk-ai-gamble-and-future-ep5 (1)	2025.12.06
Jensen-Huang-gpu-ai-ep4 (1)	2025.12.05

TiSEOUL 님의 블로그

Fei-Fei-Li-computer-vision-ep7

AI 혁명기의 선각자들 Ep.7 – 페이페이 리, 컴퓨터 비전의 기반을 만든 연구자

1. 베이징에서 뉴저지 세탁소까지, 그리고 스탠퍼드로

2. ImageNet – AI에게 세상을 처음으로 ‘보여준’ 데이터

3. “시각 지능은 지능의 코너스톤이다”

4. Human-Centered AI – 기술보다 ‘사람’을 앞에 두는 관점

5. 언어를 넘어 세계를 이해하는 AI로

6. 마무리글

다음 편 예고 – Ep.8 앤드루 응, AI를 ‘배울 수 있는 기술’로 바꾸다

📎 이전글 · 다음글

📚 참고자료 요약

'AI 기술 동향' 카테고리의 다른 글

티스토리툴바

Fei-Fei-Li-computer-vision-ep7

AI 혁명기의 선각자들 Ep.7 – 페이페이 리, 컴퓨터 비전의 기반을 만든 연구자

1. 베이징에서 뉴저지 세탁소까지, 그리고 스탠퍼드로

2. ImageNet – AI에게 세상을 처음으로 ‘보여준’ 데이터

3. “시각 지능은 지능의 코너스톤이다”

4. Human-Centered AI – 기술보다 ‘사람’을 앞에 두는 관점

5. 언어를 넘어 세계를 이해하는 AI로

6. 마무리글

다음 편 예고 – Ep.8 앤드루 응, AI를 ‘배울 수 있는 기술’로 바꾸다

📎 이전글 · 다음글

📚 참고자료 요약

'AI 기술 동향' 카테고리의 다른 글

관련글

티스토리툴바