구글 퍼스널 인텔리전스는 무엇이고, 왜 불편한가
구글이 2025년 1월 발표한 '퍼스널 인텔리전스(Personal Intelligence)'는 검색이 세상 전체의 정보뿐 아니라 내가 가진 정보, 즉 맥락까지 함께 읽어 원하는 답을 제공하겠다는 구글의 야심이다. 구글은 퍼스널 인텔리전스를 발표하면서 "검색이 나를 이해한다."는 거창한 광고 문구를 덧붙였다. 이제 이용자는 구글 서비스와 검색을 연결하는데 동의하는 것으로 훨씬 더 나를 이해하는 답변을 받을 것이다. 그러나, 그것이 과연 좋은 방법일까?
퍼스널 인텔리전스란 무엇인가
퍼스널 인텔리전스(이하 PI)를 이해하려면 먼저 기존 검색과 무엇이 다른가를 봐야 한다. 지금까지 구글 검색은 키워드를 입력하면 전 세계 웹페이지에서 키워드와 관련있는 정보를 찾아주는 방식이었다. 내가 누구인지, 무엇을 좋아하는지, 어떤 일정이 있는지는 검색 시스템이 알 수 없었다. 매번 내가 설명해야 했다.
PI는 이 구조를 바꾼다. 구글은 이미 지메일, 구글 포토, 구글 캘린더 같은 서비스를 통해 엄청난 양의 개인 데이터를 갖고 있다. 항공권 예약 메일, 가족 사진, 일정 알림, 쇼핑 내역 같은 것들이다. PI는 이 데이터들을 검색 시스템에 연결한다.
작동 방식은 이렇다. 이용자가 검색창에 질문을 입력하면 시스템은 두 가지 작업을 동시에 한다. 첫째, 전 세계 웹에서 관련 정보를 찾는다. 이건 기존 검색과 같다. 둘째, 내 지메일과 포토에서 관련 맥락을 찾는다. 이게 새로운 부분이다. 그리고 이 둘을 결합해서 이용자만을 위한 답변을 만든다.
구글은 이 기능을 인공지능 모드(AI Mode)를 통해 제공한다(2026년 1월 22일 기준 미국 내 이용자 중심으로 베타 제공). 인공지능 모드는 기존 검색 결과 링크 목록 대신 대화형 인공지능 응답을 보여준다. 이용자는 설정에서 지메일과 포토를 직접 연결해야 한다. 기본값은 꺼짐이다. 연결을 켜는 순간부터 검색은 내 개인 데이터를 참고하기 시작한다.
예를 들어보자. 이번 주말 가족이 갈 만한 곳을 검색하면 시스템은 지메일에서 호텔 예약 확인 메일을 찾는다. 언제 어디로 가는지 파악한다. 포토에서 최근 사진을 분석한다. 아이 사진이 많으면 가족 여행을 선호한다고 판단한다. 산 사진이 많으면 자연 선호, 도시 야경 사진이 많으면 도시 선호로 읽는다. 이 모든 정보를 종합해서 당신 가족에게 맞는 여행지를 추천한다.
"3월 시카고 가는데 코트 추천해줘"라고 검색하면 어떻게 될까. 시스템은 지메일에서 항공권 예약 메일을 찾는다. 3월 시카고의 날씨 정보를 검색한다. 내 쇼핑 내역 메일에서 선호 브랜드를 파악한다. 포토에서 내가 입은 옷 스타일을 분석한다. 그리고 날씨에 맞고 내 스타일에 맞고 선호 브랜드에서 나온 코트를 추천한다. 검색이 비서가 되는 셈이다.
핵심은 맥락이다. 기존 검색은 단어만 봤다. PI는 단어 뒤의 상황을 본다. 그리고 그 상황은 내 메일과 사진 속에 있다.
제미나이 2.0과 검색 보강 생성
구글은 이 기능을 제미나이 2.0 플래시 실험(Gemini 2.0 Flash experimental) 모델로 구동한다고 밝혔다. 이 모델은 빠르고 많은 맥락을 동시에 읽을 수 있도록 설계됐다. 검색 응답 속도와 개인 데이터 처리를 동시에 감당하려면 속도와 용량이 모두 필요하기 때문이다.
여기서 중요한 기술이 등장한다. 검색 보강 생성(RAG, Retrieval-Augmented Generation)이다. 핵심은 간단하다. AI가 답을 만들 때 필요한 정보를 그때그때 찾아서 참고하는 방식이다. 내 메일 전체를 AI 머릿속에 넣어두는 게 아니라 질문이 들어올 때마다 관련 있는 메일만 골라서 본다.
구글은 메일 전문이나 사진 전체를 모델이 직접 학습하지는 않는다고 강조한다. 내 메일과 사진이 AI의 장기 기억, 즉 훈련 모델 자체가 되지는 않는다는 주장이다. 대신 질문을 처리할 때 필요한 정보만 참조한다. 답변을 만들기 위해 그 순간 관련 있는 단서를 불러와 쓴다. 원본은 학습 재료로 삼지 않고 참고 문서처럼 잠깐 활용한다는 설명이다.
그런데 체감상 차이는 작아진다. 원본을 저장하지 않더라도 원본을 통해 의미와 맥락을 추출하면 그 의미는 원본보다 더 날카로운 나의 초상이 된다. 메일 한 통보다 '이 사람은 가족 여행을 선호한다'는 판단이 검색과 추천 시스템에는 더 유용하다. 원본이 아니라 추론된 내가 남는 구조다. 이게 PI가 불편해지는 지점이다.
이건 구글만의 선택이 아니다
PI를 혼자 떼어놓고 볼 수 없다. 이건 이미 빅테크 전체의 전략이다.
챗지피티는 2024년부터 메모리 기능을 제공한다. 대화 중 중요한 정보를 인공지능이 기억하고 다음 대화에 활용한다. 나는 채식주의자야, 라고 한 번 말하면 다음에 레시피를 물어볼 때 고기 요리는 추천하지 않는다. 구글과의 차이는 명확하다. 오픈AI는 대화 속 명시적 정보를 기억한다. 구글은 서비스 전체에 흩어진 암묵적 정보를 연결한다.
마이크로소프트는 더 노골적이다. 코파일럿은 아웃룩, 원드라이브, 팀즈를 모두 읽고 업무 맥락을 파악해 회의록을 작성하고 문서를 요약한다. 지난주 프로젝트 진행 상황 정리해줘, 라고 하면 여러 출처를 뒤져서 보고서를 만들어준다.
세 회사 모두 같은 전제를 공유한다. AI의 다음 단계는 나를 아는 AI다. 그리고 나를 안다는 건 단일 데이터가 아니라 데이터 간 연결을 의미한다. 메일 하나, 사진 하나로는 알 수 없는 것들이 메일, 사진, 검색어, 일정이 엮이면 보인다. 구글만 특별히 나쁜 게 아니라 산업 전체가 이 방향으로 움직인다.
구글이 말하지 않는 것들
구글은 옵트인(이용자가 직접 연결하는 기능)과 통제 가능을 강조한다. 좋다. 문제는 그 다음이다.
학습하지 않는다, 는 표현은 많은 사람에게 왜곡된 의미로 들린다. 그럼 내 데이터는 안 쓰는 거네, 라고. 하지만 실제로는 참조를 위해서는 데이터를 봐야 하고 참조를 통해 맥락을 추출하고 그 맥락이 추천과 노출과 설득에 활용된다. 모델이 내 메일 전체를 꿀꺽하지 않는다고 해서 내 메일이 내 삶을 설명하는데 쓰이지 않는다는 건 아니다.
구글은 AI 모드의 질문과 응답 같은 메타 레벨 정보가 더 좋은 답변을 제공하는데 쓰인다고 말한다. 그런데 질문과 응답 자체가 이미 정체성의 농축액이다. 내가 무엇을 불안해하는지, 무엇을 사고 싶은지, 무엇을 미루고 있는지, 어떤 관계 속에 있는지가 질문과 응답에 고스란히 들어간다. 원본을 가져가지 않아도 질문만으로도 사람은 충분히 투명해질 수 있다.
개인정보가 털린다는 느낌의 정체
털린다는 표현은 다소 강하다. 하지만 이용자가 그렇게 느끼는 이유는 분명하다. PI는 단순히 데이터를 수집하는 수준이 아니라 데이터 간 연결을 통해 나라는 모델을 만드는 방향으로 작동한다.
정보가 유출되어야만 위험한 것이 아니다. 더 무서운 건 내가 나도 모르게 예측 가능한 사람이 되는 것이다. 검색이 편해지는 만큼 검색이 나를 해석하는 권력이 커진다. 편의와 권력은 늘 같이 움직인다.
법은 이걸 어떻게 보는가
여기서 흥미로운 질문이 생긴다. 학습하지 않고 참조만 한다는 말이 법적으로 다른 대우를 받을 수 있는가?
유럽의 일반 데이터 보호 규정(GDPR)은 개인정보 처리의 목적과 방식을 엄격히 규제한다. 중요한 건 처리한다는 말의 정의다. 일반 데이터 보호 규정에서 처리란 수집, 기록, 조직, 구조화, 저장, 각색, 검색, 조회, 사용, 공개 등 거의 모든 형태의 데이터 접근을 포함한다. 학습은 안 하지만 참조는 한다고 해도 참조 자체가 이미 처리다. 참조만 한다는 말로 규정을 우회할 수는 없다.
한국 개인정보보호법도 비슷한 구조다. 개인정보를 수집, 이용, 제공하려면 원칙적으로 이용자가 동의해야 한다. 구글이 옵트인(이용자 동의)을 강조하는 이유가 여기 있다. 법적으로 필요하기 때문이다. 그런데 문제는 동의의 질이다. 이용자가 지메일과 포토를 옵트인 했을 때 정확히 무엇에 동의하는지 알고 있을까? 참조만 하고 학습은 안 한다는 기술적 설명이 일반 이용자에게 충분히 이해 가능한 언어로 전달됐을까? 법은 동의했느냐보다 제대로 된 동의였느냐를 묻는다.
더 미묘한 건 메타 정보다. 구글은 질문과 응답을 개선에 활용한다고 했다. 그런데 질문과 응답에는 개인정보가 들어갈 수밖에 없다. "내 딸 생일 선물 추천해줘", "회사 근처 병원 찾아줘" 같은 질문은 그 자체로 가족 관계, 직장 위치를 드러낸다. 법적으로 이건 메타 정보가 아니라 개인정보가 포함된 처리 기록이다. 메타라는 이름이 법적 책임을 가볍게 하지는 않는다.
마지막으로 조금 더 깊은 질문을 던져본다. 전통적인 법 체계는 개인정보를 개인의 소유물처럼 다룬다. 내 정보니까 내가 동의하면 쓸 수 있다는 논리다. 하지만 PI 같은 기술은 다르게 작동한다. 여러 데이터의 관계에서 의미가 생긴다. 내 메일 하나, 내 사진 하나는 별것 아닐 수 있다. 하지만 그것들이 연결되는 순간 나는 예측 가능한 존재가 된다. 이때 나라는 존재는 데이터의 소유자가 아니라 데이터 관계의 산물이다. 현행법은 이 구조를 제대로 포착하지 못한다. 동의라는 틀로는 부족하다. 우리에게 필요한 건 연결의 권력을 규제하는 새로운 법 개념일지도 모른다.
기술의 문제가 아니라 관계의 문제다
구글의 PI는 분명 유용할 것이다. 그러나 유용함은 언제나 대가를 요구한다. 검색이 나를 이해하는 세상은 편리한 세상일 수도 있지만 동시에 내가 해석되는 세상이기도 하다.
법은 여전히 동의라는 낡은 틀로 이 구조를 규제하려 한다. 하지만 진짜 문제는 연결의 권력이다. 데이터 하나하나가 아니라 데이터들이 엮일 때 생기는 예측 가능성이 위험하다. 오픈AI든 마이크로소프트든 구글이든 모두 같은 방향으로 간다. 이건 이제 선택의 문제가 아니라 생태계의 문제다.
질문은 하나로 모인다. 나는 편리하기 위해 어디까지 나를 열어둘 수 있는가.